구글 딥마인드가 지난달 국제수학올림피아드(IMO)에서 금메달을 따낸 자체 최고 수준의 인공지능(AI) 추론 모델을 공개했다. 동시에 여러 추론을 진행하는 '병렬적 사고(parallel thinking)'를 특징으로 들었다.
구글은 1일(현지시간) 고차원 추론과 복잡한 문제 해결에 특화된 AI 모델 ‘제미나이 2.5 딥 싱크 (Gemini 2.5 Deep Think)’를 출시했다.
이 모델은 하나의 문제에 대해 여러 아이디어를 동시에 탐색하고 비교한 뒤 최적의 답변을 도출하는 방식으로 작동한다. 이를 통해 고도의 창의력과 전략적 사고가 요구되는 문제 해결에 특화했다는 설명이다.
제미나이 2.5 딥 싱크는 구글이 2025년 5월 I/O 행사에서 처음 공개한 다중 에이전트 모델로, 여러 AI 에이전트가 병렬로 문제를 분석하고 해결 방안을 제시하는 구조다. 단일 에이전트보다 연산 자원이 많이 들지만, 더 정교하고 신뢰도 높은 결과를 도출할 수 있다는 장점이 있다.
실제로 이 모델은 IMO에서 금메달을 획득한 AI 시스템에 활용됐으며, 구글은 이 모델이 "수초나 수분이 아닌, 몇시간에 걸쳐 사고를 전개한다는 점에서 기존 소비자용 AI와는 다른 차원의 성능을 보인다"라고 강조했다.
이런 점은 여러 작업에서 차별화된 성능을 보인다. 예를 들어, 복잡한 것을 하나하나씩 구축해야 하는 웹 디자인 작업에서 미적 측면과 기능적 측면을 모두 향상할 수 있다고 소개했다.
성능 면에서도 주목할 만하다.
고난이도 테스트인 '인류의 마지막 시험(HLE)’에서 34.8%의 정답률을 기록하며, xAI의 '그록 4(25.4%)'와 오픈AI의 'o3(20.3%)'를 크게 앞섰다. 실시간 경쟁 코딩 테스트인 ‘라이브코드벤치(LiveCodeBench) 6’에서도 87.6%의 점수로 다른 모델을 능가했다.
구글은 새로운 강화 학습(RL) 기법을 적용해 추론 경로의 효율성을 높였다고 밝혔다.
또 코드 실행과 구글 검색 등 다양한 도구를 자동으로 연계해 긴 형식의 복잡한 작업도 수행할 수 있도록 했다. 특히, 웹 개발 분야에서는 시각적으로 우수하고 구조화된 결과물을 제공해 사용자 만족도를 높였다는 평이다.
다중 에이전트 시스템은 현재 주요 AI 기업들이 집중하고 있는 차세대 기술이다. 일론 머스크의 xAI는 최근 ‘그록 4 헤비(Heavy)’를 출시했고, 오픈AI도 IMO 금메달을 수상한 미공개 수학 모델이 다중 에이전트 시스템이라고 인정했다. 앤트로픽도 리서치 전용 에이전트를 통해 이 방식을 실험하고 있다.
다만, 고성능 다중 에이전트 모델은 기존 AI보다 비용이 많이 들기 때문에, 구글과 xAI 모두 해당 기능을 최고가 요금제에만 제공하고 있다.
제미나이 2.5 딥 싱크는 구글의 월 250달러 프리미엄 요금제 ‘울트라’ 가입자에게 2일부터 제미나이 앱을 통해 제공된다. IMO에서 실제로 사용된 고급 버전은 학문적 목적을 위해 수학자나 학계 연구자에게 제한적으로 배포된다.
박찬 기자 cpark@aitimes.com
