(사진=셔터스톡)
(사진=셔터스톡)

바이두가 딥시크를 따라잡기 위해 추론 모델을 내놓았다. 또 기존의 대형언어모델(LLM) '어니'를 멀티모달모델(LMM)로 업그레이드하는 등 분위기 반전에 나섰다.

바이두는 16일 두개의 새로운 인공지능(AI) 모델을 출시했다고 밝혔다. 여기에는 '어니 X1(Ernie X1)'라는 추론 모델과 비추론 플래그십 모델인 '어니 4.5 업그레이드'가 포함됐다.

어니 X1은 딥시크-R1과 비슷한 모델이다. 하지만 "도구를 자율적으로 사용하는 최초의 심층 사고 모델"이라며 AI 에이전트 능력을 강조했다.

따라서 고급 검색과 문서 질의응답은 물론, 이미지 이해와 생성, 코드 생성, 웹 링크 읽기, 학술 검색, 비즈니스 정보 쿼리, 프랜차이즈 정보 쿼리 등을 비롯한 여러 도구를 이미 지원한다고 밝혔다.

사용료는 경쟁력이 있다. 바이두는 "어니 X1은 딥시크-R1과 동등한 성능을 절반의 가격으로 제공한다"라고 밝혔다.

정확하게는 API 입력은 2배 정도 비싸고 출력이 절반 정도다. R1은 100만 토큰당 입력 0.14달러(약 204원), 출력 2.14달러(약 3113원)인데 반해, 어니 X1은 입력 2위안(약 402원), 출력 8위안(약 1608원)이다.

현재는 어니 공식 웹사이트에서 무료로 데모를 체험할 수 있으며, 곧 정식 출시가 이뤄질 예정이다.

어니 4.5 벤치마크 결과 (사진=바이두)
어니 4.5 벤치마크 결과 (사진=바이두)

어니 4.5는 '딥시크-V3'에 없는 멀티모달 기능을 차별점으로 내세웠다. 특히 다른 비전언어모델(VLM)을 LLM에 통합한 것이 아닌, '네이티브' 멀티모달 파운데이션 모델이라고 소개했다.

오디오와 이미지, 차트, 영상을 이해할 수는 있지만, 생성할 수 있는 능력은 없다. 대신, 최근 등장한 오픈AI의 GPT-4.5처럼 "높은 EQ를 가졌다"라며, 인터넷의 밈이나 풍자만화를 잘 이해한다고 덧붙였다. 벤치마크에서는 오픈AI의 GPT-4o보다 우수한 성적을 거뒀다고 밝혔다.

이 모델은 이날부터 모든 사용자에게 무료로 제공된다.

한편, 바이두는 지난해부터 기술적으로는 알리바바와 딥시크 등에 밀리고, 소비자용 챗봇에서는 바이트댄스와 문샷 등에 뒤처지며 하락세를 맞았다.

이 때문에 리옌훙 CEO는 오픈 소스로 전략을 바꾸고, 멀티모달과 추론 모델을 출시하는 전략으로 분위기 반전을 꾀하고 있다. 

하지만, 경쟁자들도 최근 연구에 속도를 올리고 있다. 딥시크는 5월 이전에 R2 및 V4 모델을 출시할 예정이고, 알리바바는 연일 딥시크를 넘었다는 모델을 내놓고 있다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지