(사진=구글)
(사진=구글)

구글이 대형멀티모달모델(LMM) '제미나이 1.5 프로'를 출시했다. 컨텍스트 창을 기존 최고 수준의 5배가량 확장, 엄청난 양의 텍스트나 이미지를 한꺼번에 처리할 수 있도록 한 것이 특징이다. 오랜만에 오픈AI의 'GPT-4'에 견줄 만한 경쟁력을 갖췄다는 자신감도 드러났다. 

로이터와 블룸버그 등은 15일(현지시간) 구글이 지난해 12월7일 공개한 '제미나이 1.0 프로'의 업그레이드 버전을 출시했다고 보도했다. 

이에 따르면 제미나이 1.5 프로는 대량의 데이터를 처리할 수 있는 능력이 특징으로, 100만개의 토큰을 한번에 지원하는 컨텍스트 창을 갖췄다. 기존 '제미나이 1.0 프로'의 3만2000개와 오픈AI 'GPT-4 터보'의 12만8000개는 물론 기존 최대인 앤트로픽 '클로드 2'의 20만개를 무려 5배나 뛰어넘는 크기다.

한번에 입력할 수 있는 데이터의 크기가 비약적으로 늘어났다는 의미다. 70만 단어 이상의 텍스트, 3만줄 이상의 코드, 1시간 분량의 동영상, 11시간 분량의 음성 파일 입력이 가능하다는 설명이다.

이로 인해 활용 용도가 크게 늘어난다는 점을 강조했다. 구글은 데모 영상을 통해 제미나이 1.5 프로가 44분 분량의 영화 줄거리 요약을 55초 만에 수행하는 모습을 시연했다.

구글의 제미나이 1.5 프로가 44분 분량의 영화 줄거리를 요약하는 데모 (사진=구글)
구글의 제미나이 1.5 프로가 44분 분량의 영화 줄거리를 요약하는 데모 (사진=구글)

이전 버전에 비해 성능도 크게 향상됐다. 지난주 공개한 최고 사양의 '제미나이 1.0 울트라'와 동등한 성능을 보이며, 기존 제미나이 1.0 프로보다 벤치마크 테스트에서 87% 더 우수한 성능을 보였다.

또 '전문가 혼합(MoE)’ 기술을 동원, 더 빠르고 효율적으로 작동한다. MoE는 대형언어모델(LLM)을 생물, 물리, 수학 등 각 분야를 담당하는 작은 전문 모델(Expert)로 쪼개고, 질문에 따라 전문 모델을 연결하거나 몇 종류를 섞는 방식이다. 이 경우 전체 큰 모델을 돌리는 것보다 비용과 시간이 훨씬 적게 들어간다.

순다르 피차이 구글 CEO도 잔뜩 힘을 줬다. "이번 출시는 구글 사업에 활력을 불어넣을 획기적 발전 중 하나"라며 "이 모델은 사람들의 질문을 크게 확장하도록 도울 수 있다"라고 말했다. 

"커진 컨텍스트 창을 통해 영화 제작자는 AI에 평론가처럼 영화를 판단해 달라고 요청하는 등 활용 범위가 거의 무한대로 늘어날 것"이라고 자신했다.

제미나이 1.5 프로는 개발자를 위한 AI 개발 도구 ‘구글 AI 스튜디오(AI Studio)’와 기업들이 AI 모델을 활용할 수 있는 플랫폼 ‘버텍스 AI(Vertex AI)’를 통해 프리뷰 버전으로 제공된다.

향후 정식 버전에서는 기본 12만8000개 토큰의 컨텍스트 창을 제공하고, 구매 옵션에 따라 컨텍스트 창을 확장할 수 있도록 할 방침이다.

한편 이번 구글의 발표는 오픈AI가 '장기 기억' 기능을 추가한 새로운 버전의 챗GPT를 발표한 지 이틀 만에, 구글을 따라잡기 위한 검색 도구를 개발한다는 보도가 나온 지 하루 만에 이뤄진 것이다. 

특히 두 회사는 지난해 11월 제미나이 출시 전부터 LMM 경쟁으로 눈길을 끌기도 했다. 당시 구글은 제미나이가 오픈AI의 LMM 'GPT-4V'보다 성능이 뛰어난 지를 확신하지 못해, 출시가 늦어진다는 보도까지 나왔다.

하지만 이번 업그레이드는 파차이 CEO가 강조할 만큼 확실한 비교 우위 요소를 갖춘 것으로 볼 수 있다. 이처럼 두 회사의 경쟁이 심화하며, AI 기술력이 전반적으로 빠르게 고도화하는 모습이다. 

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지