알리바바, 매개변수 1조개 '큐원3-맥스' 공개...프론티어 경쟁 예고

임대준 기자
업데이트 2025.09.08 18:07
입력 2025.09.08 18:00
댓글 0

이 기사를 공유합니다

알리바바가 무려 1조개(1000B) 이상의 매개변수를 가진 새로운 플래그십 대형언어모델(LLM)을 공개했다. 이제는 오픈 소스 최강을 넘어, 미국의 폐쇄형 모델과 본격적인 경쟁을 예고했다.

알리바바는 6일 X(트위터)를 통해 '큐원3-맥스-미리보기(Qwen3-Max-Preview(Instruct))'를 소개했다.

주목할 점은 이제까지 등장한 알리바바의 모델과는 달리, 오픈 소스가 아니라는 것이다. 이 모델은 큐원 챗이나 알리바바 클라우드 API를 통해 이용 가능하다. 최근 메타의 슈퍼인텔리전스 랩(MSL)이 프론티어급 모델을 폐쇄형으로 출시하겠다는 전략과도 흡사하다.

알리바바는 "1조개가 넘는 매개변수를 갖춘 역대 최대 규모의 모델"이라고 강조했다. 이제까지 알려진 오픈 모델 중 가장 규모가 큰 것은 6710억개의 매개변수를 가진 '딥시크-V3'와 '딥시크-R1'다. R1은 V3를 기반으로 제작됐다.

역대급 규모를 갖춘 만큼 성능도 뛰어나다. 벤치마크 비교 대상으로는 이전 버전인 '큐원3-235B(Qwen3-235B-A22B-250)'와 최근 중국에서 화제를 일으킨 '딥시크-V3.1', 문샷 AI의 '키미 K2', 앤트로픽의 '오퍼스 4(비추론)' 등을 내세웠다.

그 결과, 상식(슈퍼GPQA)과 수학(AIME24), 코딩(라이브코드벤치), 아레나하드, 라이브벤치 등 5개 분야에서 모든 모델의 성능을 앞질렀다.

컨텍스트 창도 캐싱을 통해 최대 26만2000(262K) 토큰을 지원하는 등 대부분 상용 모델을 넘어서는 확장된 문서 및 세션 처리가 가능하다.

API 비용은 토큰 사용량에 따라 가격이 달라진다. 32K 토큰까지는 100만개 입력 시 0.861달러, 100만개 출력 시 3.441달러로 경쟁력이 있으나, 128~252K 토큰 사용 시에 2.151달로와 8.6달러로 가격이 껑충 뛴다.

Big news: Introducing Qwen3-Max-Preview (Instruct) — our biggest model yet, with over 1 trillion parameters!

Now available via Qwen Chat & Alibaba Cloud API.

Benchmarks show it beats our previous best, Qwen3-235B-A22B-2507. Internal tests + early user feedback confirm:… pic.twitter.com/7vQTfHup1Z
— Qwen (@Alibaba_Qwen) September 5, 2025