오마이뉴스
현대자동차는 새해 초부터 언론의 집중적 조명을 받았습니다. 2028년을 기점으로 '아틀라스' 로봇을 대량 생산해 자동차 생산 라인에 배치하겠다는 계획을 발표했기 때문입니다. 한국 언론의 보도 내용은 흥분에 찬 환호 일색이었습니다. 경영진을 향해서는 경탄의 '하트'를 잇달아 날리는 한편, 노조를 향해서는 표정을 바꿔 '기술진보를 가로막는다'라며 한껏 눈을 흘겼지요. 그다지 신통치 못한 2025년 실적 발표를 앞두고 있던 현대차로서는 기대 이상의 성과를 올린 셈입니다. 저는 지난글 에서 한국 언론이 하지 않는 일을 시도했습니다. 현대자동차의 로봇 도입 공언의 현실성을 검증한 것이지요. 제가 학계에 몸담고 있는 만큼, 로봇공학 분야의 최근 연구 성과를 토대로, 현대 측 주장과 전망이 실현 가능한지 분석했습니다. 이 과정에서 저는 흔한 착시현상, 즉 생성형 인공지능을 휴머노이드 로봇과 뒤섞어 '곧 로봇이 인간의 신체 능력에 근접할 것'이라고 믿는 오류를 지적했습니다. 챗지피티 등 챗봇이 인간의 언어능력을 제법 그럴싸하게 흉내 낼 수 있게 된 것은, 막대한 텍스트 데이터를 기반으로 학습했기 때문입니다. 사람이 읽는 데만 수만 년이 걸릴 정도로 방대한 문자와 이미지 정보가 인터넷에 축적되어 있기 때문에 가능했던 것이지요. 하지만 로봇이 사람의 신체활동을 모방하기 위해 필요한 학습 데이터, 특히 '손기술(dexterity)' 훈련을 위한 데이터는 인터넷에 거의 존재하지 않고, 거의 전적으로 사람이 한 동작 한 동작 원격 조종을 통해 훈련시켜야 합니다. 물론, 시뮬레이션(컴퓨터 가상 환경에서의 모의실험)을 활용한 학습도 가능하고, 이 방식으로 로봇공학이 많은 진전을 이룬 것도 사실입니다. 로봇에게 걷기나 뛰기, 심지어 공중회전까지 훈련시킬 수 있었던 것도 시뮬레이션 덕분이었지요. 이러한 움직임은 질량과 중력 등 물리 법칙을 반영한 모델링으로 현실과 가깝게 구현할 수 있어, 시뮬레이션 학습의 효율이 매우 높습니다. 하지만 이어폰 선을 정돈하거나 셔츠의 단추를 채우는 등의 섬세한 손동작으로 넘어가면 시뮬레이션의 한계가 명확히 드러나기 시작하지요. 이 흥미로운 차이를 '모라벡의 역설(Moravec's Paradox)'이라고 부릅니다. 인간에게 어려운 일이 기계에게는 쉬운 반면, 인간에게 쉬운 일이 기계에게는 어려운 현상을 의미하는 개념이지요. 기계에게 복잡한 계산, 장기나 바둑 두기, 심지어 공중제비 돌기 등은 쉽게 가르칠 수 있습니다. 반면에 책상에 놓인 동전을 집거나 신발 끈을 매는 것처럼 사람이 일상적으로 하는 일을 가르치기는 매우 어렵습니다. 어쩌면, 로봇이 인간의 손동작을 단기간에 익히지 못하는 것을 '역설'로 부르는 것이 온당치 않은 일일 수 있습니다. 인간의 정교한 손놀림에 필요한 감각과 운동 능력은 수백만 년에 걸쳐 진화해 온 결과이기 때문이지요. 이렇게 오랜 세월을 거쳐 축적된 능력을 기계가 쉽게 모방하지 못하는 것은 당연할 수도 있습니다. 인류는 약 240만 년 전 호모 하빌리스('손재주 있는 사람') 단계에 이르러 도구를 능숙하게 다룰 수 있게 됐지만, 그 이전에 직립보행을 통해 손의 자유를 얻어야 했고, 이후 손의 기능이 고도로 정교해지기까지 또다시 수백만 년의 시간이 필요했습니다. 반면, 논리·수학·언어 등은 인류 역사에서 최근에 발현된 능력인 만큼, 기계가 이를 재빨리 따라잡을 수 있었다고도 볼 수 있습니다. '모라벡의 역설'... 사람에게 쉬운 일, 로봇에게는 왜 어려울까 로봇 기술은 단기간에 비약적으로 발전했지만, 와인잔이나 전구처럼 굴곡이 크고 깨지기 쉬운 물체, 혹은 전선과 같이 형태가 수시로 변하는 비정형 물체를 다루는 데에는 여전히 커다란 장벽이 존재합니다. 3월 초, 이세돌 9단이 다시 한번 인공지능과 마주 앉았습니다. 알파고 이후 10년 만의 대국이었지요. 인공지능은 10년간 더욱 발전해 이세돌을 가볍게 이겼지만, 인공지능을 대신해 바둑알을 옮겨 준 것은 여전히 사람 손이었습니다. 상대의 수를 읽고 최적의 판단을 내리는 '사고지능'은 비약적으로 발전했지만, 바둑알을 사뿐히 집어 바둑판 위에 조용해 내려놓는 '신체지능'은 여전히 숙제로 남아 있는 것이지요. 만일 아틀라스 같은 로봇에게 대국을 맡겼다면 어떤 일이 일어났을까요? 바둑알을 제대로 집지 못하거나 떨어뜨리는 것은 물론, 조명에 반사돼 반짝이는 바둑알의 높이와 위치를 정확히 파악하는 일조차 버거워했을 것입니다. 이는 인공지능(사고·언어 지능)과 로봇공학(물리·신체 지능) 사이의 괴리를 잘 말해 줍니다. 사람의 섬세한 손 기교를 시뮬레이션으로 로봇에게 학습시킬 수 있다면 시간과 비용을 획기적으로 절감할 수 있겠지만, 안타깝게도 현실은 그렇지 못합니다. 가상 환경에서 완벽히 작동하던 모델이 실제 환경에서는 쉽게 무너지곤 하니까요. 물체의 미세한 변형이나 마찰력 같은 복잡한 물리 변수를 수치화하기도 어렵지만, 더 큰 문제는 이런 변수들이 현실에서 거의 무한대의 불확실성을 보인다는 점입니다. 예를 들어, 가상현실에서 바둑알을 모델링하는 것은 가능하지만, 현실의 바둑알은 크기, 무게, 표면 특성, 반사광 등이 모두 미세하게 다르고 환경에 따라 지속적으로 변화합니다. 이처럼 가상 환경의 조건과 현실 세계의 변수 사이에서 발생하는 물리적 괴리, 즉 학습 모델이 실제 현장에서 실패하게 되는 현상을 '시뮬레이션-현실 간극(Sim-to-Real Gap)'이라 부릅니다. 물론 공학자들은 이를 극복하기 위해 다양한 시도를 하고 있습니다. '공간 인공지능(Spatial AI)'처럼 인공지능에게 주변 공간을 인식하고 이해하게 만들려는 시도도 있고, '도메인 랜덤화(domain randomization)' 같이 조명, 질감, 위치, 마찰력 등 시뮬레이션 환경의 여러 요소를 무작위로 변화시켜 시뮬레이션-현실 괴리를 좁히려는 노력도 진행되고 있습니다. 하지만 앞서 말한 것처럼, 현실 세계의 복잡성과 비정형성을 완전히 재현하는 것은 불가능에 가깝습니다. 전체 내용보기
Go to News Site