인공지능에 대한 다양한 유튜브 영상들이 있다. 그중 최근 필자의 관심을 끈 것은 2024년 노벨 물리학상을 수상한 제프리 힌튼의 인공지능에 대한 경고다. 그의 경고를 듣다 보니, 의도한 대로 나 역시 두려움에 휩싸이게 된다. 내가 본 영상은 영국 왕립 기관인 The Royal Institution에서 진행한 강연이었다. 지능은 정말 언어로 환원되는가 그런데 개그맨이 절묘한 순간에 던지는 그 '맥락의 전복'을 어떻게 숫자로 나타낼 수 있을까? 노래할 때의 미세한 감정의 떨림은 어떻게 수량화할 수 있을까? 힌튼의 관점에서 보면, 수량화되지 않는 맥락의 전복이나 감정의 떨림은 지능이 아닐지도 모른다. 계산기(GPU)가 굴릴 수 있는 '언어 데이터'만이 지능의 전부인 것으로 보이기 때문이다. 힌튼의 이야기를 듣다 보면, '지능은 곧 언어'라는 느낌이 든다. 본인은 아마도 '내가 언제 그런 말을 했어?'라고 하겠지만, 속으로 내던지고 싶은 말은 그것이 아니었을까 하는 생각이 든다. 지능이 어디 언어뿐인가? 인간의 지능에는 신체적 감각이나 공간에 대한 직관 등, 언어로 다 담을 수 없는 수많은 층위가 있다. 그런데 힌튼은 이 복잡한 지능을 '구조주의적 언어 모델'이라는 좁은 틀에 가둬놓고는 "거봐, 내 모델이 언어를 잘 다루니 인간보다 똑똑해"라고 말하는 듯하다. 필자가 이런 느낌을 받는 이유는 다른 데에도 있다. 인공지능을 '학습'시키고 물음에 답하게 하는 데 쓰인 트랜스포머 알고리즘이 언어에만 쓰이는 것이 아니라 영상이나 음성을 처리하는 데에도 동일하게 쓰인다는 점이다. 그런데 이때는 이를 지능이라 부르지 않고 시각지각(visual perception) 또는 패턴인식(pattern recognition)이라고 부른다. 언어만 지능이고 영상 인식이나 음성 인식은 지능이 아니라는 것인가? 계산 가능한 지능 vs. 정의 불가능한 인간성 일론 머스크(Elon Musk)와 마윈(Jack Ma)이 2019년 중국 상하이에서 열린 '세계 인공지능 대회 2019'에 인공지능에 대해 토론한 영상을 보면, 머스크는 마윈의 질문에 제대로 답하지 못하고 잠시 멈추었다가 화제를 돌리곤 한다. 마윈의 주장은 인문학적인 접근이었는데, 이런 '비과학적 공격'에 대해 머스크는 "그건 과학적으로 틀렸다"라고 말할 근거도, 그렇다고 "맞다"라고 인정할 수도 없는 난처한 상황에 처했던 것이다. 그래서 잠시 뜸을 들인 뒤 얼른 화제를 바꾸어 인공지능의 성능이 얼마나 눈부시게 발전하고 있는지를 이야기한다. '계산 가능한 지능(머스크)'과 '정의 불가능한 인간성(마윈)'의 충돌이었다. 과연 현재의 인공지능이 이런 문제를 헤쳐 나갈 수 있을까? 사실 이런 종류의 공격을 힌튼 역시 받지 않았을까? 힌튼은 오히려 이런 질문에 정면으로 반박하며, 생명이라는 것이 생명체 고유의 특징이 아니며 생명현상의 신비 또한 결국은 물리 법칙 안에서 작동하는 계산 모형에 불과하다고 말한다. 여기에 그의 말을 그대로 옮겨 놓는다. "나는 거대언어모형이 세계 모형을 가지고 있다고 믿는다. 다음 단어를 예측하기 위해서는 그 문장이 담고 있는 세계의 맥락을 이해해야만 하기 때문이다." 전체 내용보기