콘텐츠로 이동

신체적 정박과 극단적 데이터 효율성

같은 과제, 다른 데이터량

거대 언어 모델은 수조 개의 토큰을 통과한 뒤에야 문장을 다룬다. 세 살 아이는 낯선 물건을 가리키는 말을 한두 번 듣고 곧바로 비슷한 사물 전체로 그 말을 넓힌다. 두 학습자가 도달하는 능력은 겉으로 비슷해 보이지만, 그곳에 이르기까지 소비한 경험의 양은 비교할 수 없을 만큼 다르다. 이 격차를 설명하는 가장 익숙한 답은 연산 성능의 차이다. 인간의 뇌가 더 영리한 계산 장치이기에 적은 데이터로 더 많은 것을 뽑아낸다는 것이다.

이 글의 논제는 그 자리를 옮긴다. 인간의 극단적 데이터 효율성은 수십억 년의 신체적 상호작용이 인지의 사전 구조로 침전된 결과다. 적은 데이터로 세계의 규칙을 꿰뚫는 능력의 뿌리는 머릿속 연산 속도가 아니라, 몸이 세계에 부딪히며 남긴 흔적에 있다.

적은 데이터가 들어갈 자리는 이미 열려 있다

인간이 한 번의 경험에서 규칙을 길어 올리는 장면은 한 번의 경험이 세계 모델이 될 때에서 자세히 다룬 바 있다. 아이가 "이건 블릭이다"라는 말을 한 번 듣고 그 말을 다음 사물로 확장할 수 있는 이유는, 새 정보가 들어갈 사전 구조가 이미 넓게 열려 있기 때문이다. 이름은 사물과 연결되고, 사물은 종류와 연결되며, 종류는 행동 가능성과 연결된다. 한 번의 노출이 곧바로 작은 규칙이 되는 것은 빈 서판에 데이터를 쌓아서가 아니라, 이미 짜인 구조의 한 칸을 채우기 때문이다.

여기서 결정적인 질문이 따라온다. 그 사전 구조는 어디에서 오는가. 세계 모델, 검증 절차, 범주화 기대라는 인지적 골격은 어느 날 갑자기 머릿속에 생기지 않는다. 그것은 몸이 세계와 맺어 온 오랜 거래의 침전물이다.

신체는 최초의 학습 환경이다

인간의 첫 번째 학습 환경은 언어 이전의 신체다. 통증, 균형, 거리, 무게, 저항을 통과하면서 인간은 세계 안에 하나의 중심을 세운다. 신체가 최초의 학습 환경이라는 분석이 보여주듯, 자아의 경계조차 감각과 운동이 끊기지 않고 순환하는 회로를 따라 형성된다. 뜨거운 냄비에 덴 손, 무너지는 탑을 받치던 손바닥의 압력, 넘어지기 직전 몸이 기울던 방향은 추상적 명제이기 전에 신체로 새겨진 규칙이다.

직관적 물리학이라 부르는 능력은 이 거래의 산물이다. 인간은 받쳐지지 않은 물체가 떨어지고, 단단한 것이 서로를 통과하지 못하며, 던진 것이 호를 그린다는 사실을 방정식으로 배우지 않는다. 몸이 그 규칙 위에서 살아왔기에 이미 알고 있다. 근육 기억과 피부 감각은 데이터를 해석하는 틀로 먼저 작동한다. 적은 경험으로 빠르게 일반화하는 능력은 이 틀이 미리 가동되고 있기에 가능하다.

기호의 표면과 신체의 부재

AI의 학습은 다른 자리에서 출발한다. 언어 모델은 세계에 몸을 담그지 않은 채, 기호와 기호 사이의 형식적 관계만을 통과한다. 언어 모델의 추론 구조를 정리한 분석에 따르면, 모델은 토큰의 조건부 확률분포를 계산하고 통계적으로 학습한 구조를 따라 출력을 잇는다. 이 방식으로도 인상적인 일반화가 나타나지만, 그 일반화는 수조 개의 사례라는 막대한 양을 전제로 한다. 신체가 미리 제공하는 해석 틀이 없는 자리에서, 사전 구조는 오직 데이터의 압도적 규모로만 보충된다.

이 대비는 성능 격차에 그치지 않는다. 신체성의 탈락과 정동적 마찰의 소멸이 짚듯, 신체가 빠진 인지는 기호의 표면에서 매끄럽게 작동하면서도 세계의 물질적 저항과는 연결되지 않는다. 인간이 적은 데이터로 충분한 이유와 AI가 많은 데이터를 요구하는 이유는 같은 곳을 가리킨다. 한쪽은 몸이 쌓은 사전 정보를 가지고 시작하고, 다른 한쪽은 그 사전 정보를 데이터로 처음부터 세워야 한다.

진화가 각인한 틀의 두 얼굴

신체적 정박을 강조하면 직관적 물리학을 오류 없는 능력으로 떠받드는 과장에 빠지기 쉽다. 이 지점에서 균형이 필요하다. 직관의 파산 선고가 보여주듯, 인간의 3차원 기하학과 연속성에 대한 직관은 지구라는 좁은 환경에서 살아남기 위해 진화가 뇌에 각인한 운영체제에 가깝다. 그것은 일상의 척도에서는 강력하지만, 무한과 추상의 극단에서는 세계를 왜곡한다.

이 한계는 신체적 정박 가설을 약화시키기보다 오히려 강화한다. 직관이 특정 환경에 정교하게 맞춰져 있다는 사실 자체가, 그 직관이 추상적 연산의 산물이 아니라 신체와 환경의 오랜 상호작용에서 빚어졌음을 보여주기 때문이다. 강력한 사전 정보는 보편적 진리가 아니라, 특정한 몸이 특정한 세계에서 치른 적응의 기록이다.

데이터 효율성은 연산이 아니라 침전이다

인간이 적은 경험으로 세계의 규칙을 꿰뚫는 능력은 뇌의 처리 속도가 만든 기적이 아니다. 그것은 수십억 년에 걸쳐 몸이 세계와 부딪히며 남긴 흔적이 인지의 사전 구조로 가라앉은 결과다. 데이터 효율성의 비밀은 더 빠른 계산이 아니라 더 오래된 신체에 있다. 한 번의 경험이 곧바로 규칙이 되는 자리에는, 그 한 번을 받아 낼 준비를 마친 몸의 긴 역사가 먼저 와 있다.

이어 읽기

작성 정보

초안 작성: Claude · Claude Opus 4.8 · Max Adaptive Thinking
검토·개고: ChatGPT · GPT-5.5 Extended Thinking

인포그래픽

작성일: 2026년 6월 2일