(사진=X, xAI)
(사진=X, xAI)

일론 머스크 CEO의 xAI가 최신 프론티어 인공지능(AI) 모델 '그록-3' 제품군을 출시했다.

이는 세계 최대의 AI 데이터센터 '콜로서스'에서 훈련된 것으로, 각종 벤치마크에서 현존 최강인 오픈AI의 'GPT-4o'와 'o3-미니-하이'를 능가했다. 또 오픈AI의 '딥 리서치'와 같은 '딥서치(DeepSearch)'라는 추론 에이전트도 공개했다.

xAI는 17일(현지시간) X(트위터) 스트리밍 이벤트를 통해 그록-3를 공개했다.

그록-3는 텍스트는 물론 이미지 처리까지 가능한 멀티모달모델(LMM)으로, ▲더 작은 버전인 '그록-3 미니' ▲추론 모델 '그록-3 추론(Reasoning) ▲'그록-3 미니 추론' 등 모두 4가지 버전으로 출시됐다. 

이 중 추론 모델은 그록-3에 '생각'을 요청하거나 더 어려운 질의의 경우 추가 컴퓨팅을 사용하는 추론을 위해 '빅 브레인(Big Brain)' 모드로 활용할 수 있다. 

알려진 대로 인간 대신 인터넷을 검색하고 추론으로 고급 답변을 작성하는 딥서치도 공개했다. 이는 몇주 안으로 그록-3와 함께 xAI의 기업용 API에 도입될 예정이다.

그록-3와 미니는 X의 '프리미엄+' (월 22달러) 구독자 대상 서비스를 시작한다. 여기에 다른 기능은 월 30달러짜리 '슈퍼그록'이라는 요금제를 통해 서비스한다. 슈퍼그록은 추론 모델과 딥서치를 사용할 수 있으며, 무제한 이미지 생성을 제공한다.

특히 이 모델은 미국 멤피스의 콜로서스에서 GPU 10개로 훈련했다. 이 때문에 머스크 CEO는 몇개월 전부터 성능이 대단할 것이라고 예고했고, 이날도 행사에서도 "그록-3는 그록-2보다 훨씬 더 유능하다"라고 강조했다. 

그리고 이런 점을 벤치마크 결과로 설명했다.

우선 그록-3는 수학 능력을 가리는 'AIME 2025'에서 52점을 기록, GPT-4o의 39점을 누르고 1위를 차지했다. 또 박사 수준의 과학 지식을 테스트하는 'GPQA'에서는 75점으로, 역시 GPT-4o의 65점을 넘었다. 코딩 능력 테스트에서는 57점으로, 딥시크-V3의 40점을 크게 앞질렀다. 

그록-3 벤치마크 결과 (사진=X, xAI)
그록-3 벤치마크 결과 (사진=X, xAI)
그록-3 추론 벤치마크 결과 (사진=X, xAI)
그록-3 추론 벤치마크 결과 (사진=X, xAI)

하지만, 오픈AI가 바로 전날 공개한 GPT-4o의 업데이트 버전을 능가하는지는 알려지지 않았다. 오픈AI는 새로운 GPT-4o가 벤치마크에서 점수 향상을 기록했다고 밝혔기 때문이다.

이어 그록-3 추론 모델은 'AIME 2025'에서 93점을 받았다. 여기에서도 오픈AI의 o1과 o3-미니-하이의 87.3점, 79.6점을 넘었다. 다만, o1과 o3-미니의 점수는 AIME 2025가 아닌 AIME 2024에서 받은 점수다.

또 사용자 선호도로 순위를 가리는 'IM아레나 리더보드'에서는 그록-3의 초기 테스트 버전으로 GPT-4o 최신 버전과 제미나이 2.0 최신 버전 등을 모두 앞섰다. 

결과적으로 "지구상에서 가장 똑똑한 모델"이라는 머스크 CEO의 말처럼 그록-3는 현재 가장 뛰어난 모델인 것으로 볼 수 있다. 오픈AI 모델은 물론, 딥시크에도 모두 앞섰다.

IM아레나 리더보드 (사진=X, xAI)
IM아레나 리더보드 (사진=X, xAI)

하지만, '인류의 마지막 시험(HLE)'이라는 벤치마크 결과를 공개하지는 않았다. 이 벤치마크에서 오픈AI의 'o3'가 기반인 딥 리서치는 26.6%의 정확도로 다른 모델을 두배 이상 앞서고 있다.

또 딥시크로 인해 최근 큰 관심사로 떠오른 API 사용료도 공개하지 않았다.

한편, 이날 머스크 CEO는 그록-3를 AI 음성 비서로 업그레이드할 뜻도 밝혔다. 그는 "앞으로 일주일 정도면 그록 앱에 음성 모드가 추가된다"라고 말했다. 

그록-1에 이어 그록-2도 몇달 안에 오픈 소스로 출시한다고 밝혔다. "우리는 일반적으로 다음 버전이 완전히 출시되면, 이전 버전을 오픈 소스로 공개한다"라고 강조했다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지