(사진=셔터스톡)
(사진=셔터스톡)

텐센트가 인공지능(AI) 추론 모델 '훈위안 T1(Hunyuan T1)'을 출시했다. 이는 ‘훈위안 터보 S(Hunyuan Turbo S)’를 출시한지 한ㅌ달이 채 안 된 것으로, 딥시크로부터 촉발된 경쟁에 적극 대응하고 나섰다.

텐센트는 22일(현지시간) 챗봇 '위안바오(Yuanbao)'에서 테스트된 T1-프리뷰 버전의 정식 모델 ‘훈위안 T1(Hunyuan T1)’을 출시했다.

이는 지난달 28일 출시된 훈위안 터보 S를 업그레이드한 것이다.

이 모델은 '딥시크-R1'과 같은 ‘느린 사고(slow-thinking)’ 모델과 달리, ‘빠른 사고(fast-thinking)’ 모델로 설계된 것이 특징이다. 특히, 1초 만에 답변을 내놓는다는 점이 강조됐다.

또 컨텍스트 창이 커질수록 속도가 느려지고 메모리 사용량이 증가하는 트랜스포머(Transformer) 아키텍처의 단점을 보완하기 위해 '맘바(Mamba)' 아키텍처를 결합했다. 여기에 ‘전문가 혼합(MoE, Mixture of Experts)’ 모델을 적용, 필요한 일부 매개변수만 활성화하는 방식으로 연산 효율을 극대화했다. 

훈위안 T1은 이런 터보 S 모델에 강화학습(RL)을 결합, 과학적 및 수학적, 논리적 사고를 위한 느린 사고 프로세스를 추가한 것이다.

RL은 딥시크-R1에도 활용된 핵심으로, 이를 통해 훈위안 T1은 정교하고 균형 잡힌 응답을 생성할 수 있다는 설명이다.

벤치마크 결과 (사진=텐센트)
벤치마크 결과 (사진=텐센트)

벤치마크 테스트에서도 우수한 성능을 입증했다.

MMLU 프로 벤치마크에서는 87.2점으로, 딥시크-R1의 84점을 상회했다.

다만, 오픈AI의 'o1(89.3)'에는 약간 못 미쳤다. 또 미국 수학 경시대회(AIME 2024)에서는 78.2점으로, R1(79.8)과 o1(79.2)에 떨어진다.

중국어 평가에서는 91.8점으로 딥시크와 동일한 수준을 유지했으며, 오픈AI(87.8)보다도 더 높은 점수를 획득했다.

가격 경쟁력도 갖췄다. 사용 요금은 입력 토큰 100만개당 0.14달러, 출력 토큰 100만개당 0.56달러로 책정됐다. 입력 요금은 R1과 같지만, 출력 요금(2.19달러)은 훨씬 저렴하다.

일부 기술 블로거들은 훈위안 T1과 딥시크-R1의 성능을 비교 분석했다.

NCJRYDS의 분석에 따르면, 훈위안 T1은 고전 중국 시 작문 능력에서는 딥시크 R1에 뒤졌지만, 중국어 단어 해석에서는 더 우수한 성능을 보였다. 고플레이AI(GoPlayAI)가 수학 문제를 제시한 결과, 가장 어려운 문제에서 오답을 내는 등 한계도 존재했다.

한편, 텐센트는 훈위안과 R1을 클라우드 플랫폼과 위안바오 챗봇에 함께 통합하는 ‘더블 코어’ 전략을 채택하고 있다.

전문가들은 이런 전략이 텐센트가 비디오 게임 산업에서 자체 개발 게임과 서드 파티의 타이틀을 동시에 지원하며 시장을 장악해온 방식과 유사하다고 분석했다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지