구글이 오픈AI의 'o1'에 대응할 새로운 추론 전문 모델을 공개했다. 아직은 초기 단계에 불과하다고 밝혔지만, 멀티모달 기능과 추론 과정 공개를 차별점으로 내세웠다.
구글은 19일(현지시간) 개발자 홈페이지를 통해 '제미나이 2.0 플래시 싱킹(Gemini 2.0 Flash Thinking)'을 공개했다.
또 'AI 스튜디오'에 체험할 수 있는 데모 페이지를 론칭하고, 제미나이 API를 통해 사용할 수 있도록 했다.
순다르 피차이 구글 CEO는 이날 X(트위터)를 통해 "지금까지 우리가 만든 가장 사려 깊은 모델"이라고 소개했다.
공개된 개발자 문서에 따르면 이 모델은 3만2000개의 입력 토큰(50~60페이지 분량의 텍스트)를 지원하며 출력 응답 당 8000개의 토큰을 생성할 수 있다. 이는 기존 12만8000개 이상이던 제미나이 모델에 비해 컨텍스트 창이 상당히 줄어든 편이다. 아직 검색이나 코드 실행 기능도 없다.
또 모델의 훈련 방식과 아키텍처, 학습 데이터 등에서도 밝히지 않았다.
대신 이 모델은 이미지까지 입력으로 처리할 수 있는 멀티모달 이해 능력을 갖췄다. 출력은 텍스트로만 가능하다. 반면, 오픈AI의 o1은 텍스트 전용으로 출시됐다가, 최근 o1 풀 버전 출시를 통해 이미지 입력을 추가하겠다고 밝힌 상태다.
여기에 드롭다운 메뉴를 통해 단계별 추론을 확인할 수 있도록 허용한 것이 눈에 띈다. 이 역시 o1과는 다르다. 오픈AI는 추론의 핵심인 '생각의 사슬(CoT)' 구조를 비밀로 규정, 이를 알아보려는 시도 자체를 막고 있다.
구글은 이 모델이 추론은 물론 코딩 등에도 유용하다고 강조했다. 캐릭터닷AI에서 구글로 복귀한 노암 샤지어도 X를 통해 모델이 까다로운 확률 문제를 해결하는 데모를 공개했다.
이 모델 역시 o1처럼 생각하는 데 수십초에서 몇분까지 시간이 걸리는 편이다. 또 컴퓨팅을 기존 모델보다 많이 사용하는 등 오픈AIO의 '테스트-타임 컴퓨트' 방식과 흡사한 것으로 보인다.
특이하게 벤치마크 결과는 공개하지 않았다. 이에 대해 로건 킬패트릭 AI 스튜디오 리더는 "이 모델은 실험적인 것으로, 우리의 추론 여정 첫번쨰 단계에 불과하다"라고 설명했다. 일종의 미리보기라는 말이다.
다만, 이 모델은 사용자 선호로 순위를 매기는 IM아레나에서 며칠 전 출시된 '제미나이-EXP-1206'에 이어 2위를 차지했다.
이처럼 구글도 본격적으로 추론 모델을 공개하며 이 분야는 본격적인 격전지로 떠오르게 됐다.
오픈AI는 2주 전 o1 풀 버전과 o1-프로를 출시했으며, 알리바바와 문샷, 딥식 등 중국 업체들도 추론 모델을 공개했다. 앤트로픽도 추론 모델을 개발 중이라는 소식은 이미 한달 전에 등장했다.
임대준 기자 ydj@aitimes.com
- 구글, '제미나이 2.0' 출시·AI 에이전트 3종 공개..."스마트 안경에 AI 비서 탑재할 것"
- 문샷 AI, 추론 처리 향상한 아키텍처 ‘문 케이크’ 오픈 소스 공개
- 구글, '실험용 제미나이' 잇달아 공개..."수학·추론 성능 강화"
- 구글, '제미나이' 개선 위해 '클로드'와 답변 비교해
- 구글 "2025년 제미나이 사용자 5억명으로 늘릴 것”
- 추론 모델 비용 낮추는 기술 속속 공개..."2+3 계산에 CoT 필요 없어"
- 구글, '제미나이 2.0' 업데이트 버전 2종 출시...딥시크·오픈AI 동시 겨냥
- 구글, '제미나이' 기반 텍스트 임베딩 모델 공개..."최고 성능 달성"
- 구글, 최초의 'LMM 내장' 이미지 생성 기능 공개..."이건 넥스트 레벨"
