딥시크가 인공지능(AI) 모델 'V3.1'을 통해 통합형 모델 체제 전환과 성능 개선 등 주요 발전 사항을 동시에 선보였다. 이번 업데이트가 당초 출시 예정인 '딥시크-R2'를 대체하는 것이라는 예측이 다시 등장했다.
딥시크는 21일 위챗(WeChat)을 통해 ‘V3.1’을 출시 사실을 공식 발표하고, 기술 세 사항 등을 공개했다.
V3.1은 앞서 19일 허깅페이스를 통해 공개됐다. 또 딥시크는 이날 위챗과 X(트위터)를 통해 출시를 알렸다.
그러나 당시에는 모델에 대한 설명이나 기술 보고서가 포함되지 않았다. 따라서 V3.1이 추론-비추론 하이브리드 모델이라는 점도 일부 개발자들이 알아냈다.
이번에는 위챗 게시물을 통해 새 모델을 정식 소개하고, 벤치마크 결과도 공개했다. 무엇보다 "에이전트 시대를 향한 첫걸음"이라는 점을 강조했다.
V3.1은 ‘사고’ 모드와 ‘비사고’ 모드를 동시에 지원하는 하이브리드 추론 방식을 적용했다. 사용자는 ‘딥 싱킹(Deep Thinking)’ 버튼을 통해 두 모드 간 전환이 가능하다.
컨텍스트 창은 12만8000 토큰으로 확장됐다. 특히, 기존 'R1' 추론 모델보다 응답 속도가 크게 향상됐다고 강조했다.
또 사후 훈련 최적화를 통해 도구 활용과 에이전트 작업에서 성능이 눈에 띄게 개선됐다.
벤치마크에서 기존 R1을 뛰어 넘는 성능을 보였다.
코딩 벤치마크에서는 R1의 1.4~4.2배의 점수를 얻었다. 또 다단계 추론을 요구하는 복합 검색 테스트(browsecomp)와 다학제 전문가 수준 난이도 테스트(HLE)에서 각각 30%대 8.9%, 29.8%대 24.8%의 우위를 기록했다.
토큰 효율성도 강조됐다.
추론 모드에서는 R1과 유사한 평균 성능을 유지하면서도 출력 토큰 수를 20~50% 줄였고, 비추론 모드에서도 V3와 비교해 출력 길이를 크게 줄이면서 동일한 성능을 확보했다.
전반적으로 오픈AI의 GPT-5와 비슷한 흐름이다. 즉, 코딩과 에이전트 성능을 크게 향상해 사용성을 높이고, 모델의 효율을 강조한 것이다.
또 이번 업데이트는 추론과 비추론 기능을 하나의 모델로 통합하는 사용자 친화적 인터페이스 트렌드를 따른 것이다. 오픈AI도 'GPT-5'에서는 추론과 비추론 모델을 통합, 실시간 라우터를 활용해 쿼리를 자동으로 적합한 모델에 분배한다.
따라서 V3.1은 딥시크가 R1의 후속작 R2 개발을 건너뛰고, 대신 기능을 통합한 단일 모델로 연구 방향을 전환했다는 것을 보여준다는 분석이다. 이미 이번 모델에는 R1보다 뛰어난 추론 기술이 도입됐기 때문이다. 사실상 R2가 포함됐다는 것을 의미한다.
사우스차이나모닝포스트는 "이번 출시는 '1개 모델, 2개 모드' 방식을 채택했는데, 이는 딥시크가 R1의 후속 모델을 개발하지 않을 수도 있음을 시사한다"라고 분석했다.
며칠 전 중국 전문가인 포 자오도 "딥시크는 이번 모델 출시와 동시에 조용히 R1 태그를 삭제했다. 이제 모든 진입점은 V3.1로 기본 설정된다"라며, V3.1이 새로운 플래그십 모델이라고 밝혔다.
실제로 딥시크가 몇달 내에 이보다 성능이 월등하게 우수한 R2를 출시할 수 있을지는 미지수다. 또 R2는 최근까지 성능 부족으로 출시가 연기됐다는 말이 나왔다.
딥시크는 R1 출시 후 7개월이 지난 상태다. 성능은 대부분 모델에 따라잡혔고, 사용자도 감소했다. 알리바바나 문샷 AI 등은 잇달아 R1을 능가하는 모델을 출시하는 상황이다.
한편, 딥시크는 API 요금 체계 개편도 발표했다. 오는 9월6일부터 개발자 대상 API 가격은 00만 토큰당 입력 4위안(약 0.56달러), 출력 단가는 12위안(약 1.68달러)으로 인상된다. 기존의 야간 할인 요금제는 폐지된다.
박찬 기자 cpark@aitimes.com
- 딥시크, 추론·코딩 통합한 'V3.1' 출시..."완벽한 하이브리드 아키텍처"
- 딥시크, 'R2' 출시 지연은 정부의 화웨이 칩 사용 강요 때문
- 딥시크, 알리바바·문샷AI 등 경쟁 심화로 점유율 하락세
- 딥시크 "V3.1은 곧 출시될 차세대 중국 칩에 최적화"
- 중국 칩 지원한다는 딥시크 모델 공개로 중국 반도체 주가 급등
- 허위 정보로 비난받은 딥시크, '공개 데이터'로 AI 훈련 진행했다고 주장
- 딥시크, 올해 말 'R2' 출시 예정...AI 에이전트에 초점
- 알리바바, 매개변수 1조개 '큐원3-맥스' 공개...프론티어 경쟁 예고
- 딥시크, V3.1 개선한 ‘딥시크 V3.1-터미너스’ 출시..."도구 활용 강화"
