xAI가 출시한 ‘그록-3’가 각종 벤치마크에서 다른 AI 모델들보다 우수한 성과를 거뒀다고 주장했다. 그러나 일부 AI 전문가들은 여전히 핵심 분야에서 오픈AI보다 뒤처져 있다고 평가했다.
오픈AI의 공동 창립자인 안드레이 카르파시는 18일(현지시간) X(트위터)를 통해 "조기 액세스를 통해 그록-3를 테스트한 결과, 전체적으로 오픈AI의 'o1-프로' 수준에 근접하며 '딥시크-R1'보다 앞서 있다”라고 평가했다.
그러나 인터넷 검색과 추론을 통해 심층적인 답변을 생성하는 ‘딥서치(DeepSearch)’ 기능에 대해서는 “퍼플렉시티의 ‘딥리서치(DeepResearch)’와 비슷한 수준이지만, 오픈AI의 ‘딥 리서치’만큼 철저하고 신뢰할 만한 단계에는 아직 도달하지 못했다”라고 밝혔다.
유명 AI 평론가인 에단 몰릭 펜실베이니아대학교 와튼스쿨의 교수는 링크드인을 통해 “xAI가 빠르게 성장하고 있지만, 그록-3가 시장의 확실한 선두 주자는 아니다”라며 “매우 강력한 모델이지만, 기존의 프론티어 모델을 대체할 정도는 아니다”라고 분석했다. 이어 “그록-3가 일부 벤치마크에서 기존 오픈AI 모델을 능가하지만, 'o3'를 뛰어넘지는 못한다”라고 단정했다.
AI 과대광고에 대해 비판적인 입장을 취해온 지오메트릭 인텔리전스 창립자 게리 마커스는 더 회의적인 입장을 보였다. 그는 서브스택에 올린 글에서 “머스크는 그록-3가 역대 가장 뛰어난 AI가 될 것이라고 주장했지만, 실상은 그렇지 않았다”라고 전했다.
또 그록-3 출시 이벤트를 이전 데모의 “복사판”이라고 평가하며, “그록-3가 개선된 점은 있지만, 오픈AI 모델과 비교했을 때 ‘게임 체인저’ 수준은 아니다”라고 평가했다.
이처럼 전문가들은 벤치마크를 떠나, 전반적인 역량에서 오픈AI를 능가하는 것이 아니라는 점을 지적하고 있다. 특히, 오픈AI는 이미 공개한 o3가 다른 모든 모델을 압도하는 데 반해, 그록-03는 그런 수준이 아니라는 지적이다.
반대로, 호평을 보낸 전문가도 있다. 테크 업계 베테랑 로버트 스코블은 X를 통해 '시리' 공동 창립자 톰 그루버의 발언을 인용하며, “AI에서 가장 중요한 것은 학습 속도이며, xAI는 그 어떤 모델보다도 빠르게 학습하고 있다”라고 밝혔다.
카르파시도 “xAI가 불과 1년 전부터 시작했다는 점을 고려하면, 짧은 시간 안에 최첨단 기술 수준에 도달한 것은 매우 이례적인 일”이라고 칭찬했다. 알렉산드르 왕 스케일 AI CEO는 “그록-3는 xAI가 만든 세계 최고의 새로운 모델”이라며 높게 평가했다.
머스크 CEO는 아직 그록-3가 완전한 것은 아니며, 앞으로 더 좋아질 것이라고 예고했다.
그는 전날 스트리밍을 통해 “한달 전 사전 훈련을 완료했으며, 현재는 추론 기능을 모델에 통합하는 작업을 진행 중"이라며 "하지만 아직 초기 단계이며, 이번에 공개된 버전은 추론 모델의 일부로서 베타 단계로 거의 매일 성능이 좋아질 것”이라고 말했다.
박찬 기자 cpark@aitimes.com
