미토스 이어 GPT-5.5도... 20시간짜리 해킹, AI가 혼자 해냈다

오마이뉴스

미토스 이어 GPT-5.5도... 20시간짜리 해킹, AI가 혼자 해냈다

영국 정부 산하 AI안전연구소(AISI)가 2026년 4월 발표한 보고서는 조용하지만 묵직한 경고를 담고 있다. 엔트로픽의 클로드 미토스 프리뷰(Claude Mythos Preview)에 이어 오픈AI의 GPT-5.5가, 숙련된 보안 전문가가 20시간은 걸린다고 추정되는 기업 네트워크 해킹 시나리오를 스스로 끝까지 완수했다. 한 번이 아니라 두 번, 서로 다른 회사의 AI가 같은 수준에 도달했다는 사실이 핵심이다. 이것이 특정 AI 한 개의 특이한 성과인지, 아니면 산업 전체의 흐름이 바뀐 것인지를 판단하는 것이 이 보고서의 핵심 질문이었다. 결론은 후자다. 한 명의 천재가 아니라 반 전체의 성적이 올랐다 클로드 미토스(Claude Mythos)가 처음으로 복잡한 기업 네트워크 공격 시뮬레이션을 완수했을 때, 세상은 이를 엔트로픽만의 특별한 성과로 볼 수도 있었다. 그러나 곧이어 오픈AI의 GPT-5.5가 같은 시험에서 유사한 성과를 냈다. 두 회사는 경쟁 관계에 있고 기술 개발 방식도 다르지만, 결과는 놀랍도록 비슷했다. 이는 특정 기업이 앞서 나간 것이 아니라, AI 전체가 동시에 같은 방향으로 진화하고 있다는 신호이다. 마치 한 반에서 한 명만 시험을 잘 본 것이 아니라, 반 전체의 평균 점수가 갑자기 뛰어오른 상황과 같다. AI는 이제 '도구'를 넘어 '작전 수행자'다 기존의 AI 보안 평가는 단순했다. 암호를 해독할 수 있는가, 특정 취약점을 찾아낼 수 있는가처럼 개별 기술을 하나씩 시험하는 방식이었다. 그러나 이번 평가의 핵심은 달랐다. 정보 수집에서 시작해 권한 탈취, 내부 시스템 이동, 최종 데이터 유출까지 32단계에 달하는 연속 공격을 스스로 설계하고 실행할 수 있는지를 봤다. 미토스(Mythos)와 GPT-5.5 모두 이 다단계 공격을 실제로 수행해냈다. AI가 더 이상 사람이 시키는 일만 하는 도구가 아니라, 목표를 받고 스스로 경로를 찾아 작전을 완수하는 주체로 변화하고 있다는 의미이다. 성적표를 보면, 격차는 생각보다 작다 고난도 사이버 작업에서 엑스퍼트(Expert)급 문제의 성공률을 비교하면 GPT-5.5는 약 71%, 클로드 미토스 프리뷰(Claude Mythos Preview)는 약 68%를 기록했다. 이전 세대 모델들이 50% 안팎에 머물렀던 것을 고려하면 두 모델 모두 눈에 띄는 도약을 이뤘다. 다만 GPT-5.5와 미토스(Mythos) 사이의 차이는 오차 범위 안에 들어올 만큼 작다. 누가 1등인지보다 중요한 것은, 프론티어 AI 전체가 이미 새로운 수준에 진입했다는 사실이다. 전체 내용보기

Go to News Site