알리바바, 'o1'에 정식 도전장...오픈 소스 추론 모델 'QwQ' 출시

박찬 기자
업데이트 2024.11.29 05:11
입력 2024.11.28 18:05
댓글 0

이 기사를 공유합니다

알리바바가 오픈AI의 ‘o1’과 경쟁하기 위한 새로운 추론 AI 모델을 공개했다. 이 모델은 o1처럼 사용자 질문에 대한 응답 품질을 높이기 위해 추가적인 컴퓨팅 리소스와 시간을 활용하는 ‘테스트-타임 컴퓨트(Test-Time Compute)’ 기술을 적용했다.

알리바바는 27일(현지시간) 허깅페이스를 통해 새로운 추론 AI 모델인 ‘QwQ-32B-프리뷰’를 오픈 소스로 출시했다.

이 모델은 325억개의 매개변수를 포함하며, 최대 3만2000단어 길이의 컨텍스트 창을 지원한다.

작업을 계획하고 논리적으로 추론하며, 정답에 도달하기 위한 여러 단계를 수행할 수 있다. 특히 질문이 복잡할수록 응답을 내기 전에 수십초 동안 추가적인 ‘생각’을 할 수 있는데, 이는 o1 모델에 적용된 기술과 유사하다.

이는 모델이 작업을 수행하는 과정에서 추가적인 처리 시간을 활용, 응답의 정확성과 신뢰성을 높이는 데 초점을 맞춘다.

알리바바는 QwQ-32B-프리뷰가 벤치마크인 'AIME'와 'MATH'에서 오픈AI의 o1-프리뷰와 o1-미니 모델보다 우수한 성능을 기록했다고 주장했다. AIME는 AI 모델 간 성능을 비교하기 위한 평가 시스템이며, MATH는 수학 문제 풀이 능력을 측정하는 데이터셋이다.