(사진=알리바바)
(사진=알리바바)

중국 알리바바가 최신 인공지능(AI) 추론 모델 ‘큐원3-맥스-싱킹(Qwen3-Max-Thinking)’을 4일 선보였다. 오픈AI의 'GPT-5 프로'에 견줄 만한 수학적 추론 성능을 보여줬다.

이 모델은 아직 학습 중인 단계로, 정식 출시된 것은 아니다. 하지만, 이미 2025년 미국초청수학경시대회(AIME)와 하버드-MIT 수학토너먼트(HMMT)에서 100% 정답률을 기록했다고 강조했다.

이는 오픈AI의 GPT-5 프로에 이어 해당 수학 추론 벤치마크에서 완벽한 성과를 낸 두번째 모델이자, 중국 모델로는 최초의 사례다.

벤치마크 결과 (사진=알리바바)
벤치마크 결과 (사진=알리바바)

큐원3-맥스-싱킹은 지난 9월 공개된 '큐원3-맥스(Qwen3-Max)'를 기반으로 개발됐다.

큐원3-맥스는 1조개 이상의 매개변수를 갖춘 알리바바 사상 최대 규모 모델로, 공개 당시 앤트로픽의 '클로드 오퍼스 4'와 딥시크의 'V3.1', xAI의 '그록-4', 오픈AI의 GPT-5 프로 등 첨단 모델과 견줄 만한 성능을 보였다. 미국의 프론티어 모델과 본격적인 경쟁을 벌일 가장 강력한 중국의 후보로 꼽혔다.

특히, 최근 중국에서 실시한 가상 암호화폐 실거래 실험에서도 눈에 띄는 성과를 거뒀다. 실제 자금을 운용한 실험에서 큐원3-맥스는 2주 동안 22.3%의 수익률을 기록해 6개 참가 모델 중 1위를 차지했다. GPT-5는 62.7%의 손실을 기록한 것으로 나타났다.

린쥔양 알리바바 연구원은 X(트위터)를 통해 “큐원3-맥스-싱킹은 아직 완성된 단계는 아니며, 모델의 정밀도를 높이기 위한 추가 학습이 계속 진행 중”이라고 전했다.

큐원3-맥스-싱킹은 웹 기반 큐원 챗(Qwen Chat)알리바바 클라우드 API 플랫폼을 통해 사용할 수 있다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지