딥시크가 신형 인공지능(AI) 모델 ‘딥시크 V3.1’을 조용히 선보였다. 추론과 비추론 모델이 결합한 하이브리드 형태로, 앞으로 딥시크의 방향성을 보여주는 것이라는 분석이 등장했다.
딥시크는 19일(현지시간) X(트위터)를 통해 새로운 오픈소스 AI 모델 ‘딥시크 V3.1’을 출시했다고 발표했다. 또 별도 홍보 없이 허깅페이스에 업로드했다.
딥시크 V3.1은 6850억 매개변수의 규모로, V3의 6710억개와 비슷한 규모다. 전작과 같은 전문가 혼합(MoE) 방식으로 보이며, V3와 같은 최대 12만8000 토큰 컨텍스트 창을 제공한다.
BF16, FP8 등 다양한 정밀도 형식을 지원해 개발자가 하드웨어 환경에 맞게 최적화할 수 있다. 이런 엔지니어링 강점은 전작부터 강조됐던 것이다.
BREAKING: DeepSeek V3.1 is Here!
— Commentary DeepSeek News (@deepsseek) August 19, 2025
The AI giant drops its latest upgrade — and it’s BIG:
⚡685B parameters
Longer context window
Multiple tensor formats (BF16, F8_E4M3, F32)
Downloadable now on Hugging Face
Still awaiting API/inference launch
The AI race just got… pic.twitter.com/nILcnUpKAf
딥시크는 새 모델에 대한 기술 보고서는 물론, 자세한 설명도 내놓지 않았다. 대신, 전문가와 연구자 커뮤니티에서 이를 분석했다.
가장 눈에 띄는 것은 기존의 비추론 모델인 ‘V3’와 달리, 사용자 요청에 맞춰 즉각적인 반응과 논리적 추론을 모두 수행할 수 있는 ‘비추론-추론 하이브리드 아키텍처’를 채택했다는 점이다.
서브레딧 관리자인 루키(Rookie)라는 연구원은 모델 아키텍처에 내장된 네가지 새로운 특수 토큰을 발견했다고 주장했다. 여기에는 실시간 웹 통합을 가능하게 하는 검색 기능과 내부 추론 프로세스를 가능하게 하는 사고 토큰이 포함됐다.
즉, 딥시크는 이를 통해 성능 저하 없이 일반 챗봇과 추론, 코딩 기능을 모델 하나에 통합하는 구조적 혁신을 이뤘다는 평가다. 이전에는 여러 AI 기능을 결합하면 전반적으로 모델 성능이 떨어지는 경우가 많았다. 이 떄문에 코딩 모델은 별로 출시하는 경우가 많았다.
Deepseek v3.1 scores 71.6% on aider - non-reasoning SOTA https://t.co/lSfKN3Lckb pic.twitter.com/5rhLXcpBDh
— Andrew I. Christianson (@ai_christianson) August 19, 2025
또 앤드류 크리스찬슨이라는 개발자가 실시한 코딩 벤치마크 ‘에이더(Aider)’에서 V3.1은 71.6%를 기록했다. 이는 앤트로픽의 ‘클로드 오퍼스 4’보다 1% 높은 성능이었다.
그는 코딩 작업 한건 비용이 1.01달러에 불과, 클로드보다 최대 70배까지 저렴하다고 소개했다.
한편, 이 모델은 오픈AI가 새로운 개방형 모델 2종과 'GPT-5'를 내놓은 지 며칠 만에 등장했다.
또 딥시크는 현재 R2의 성능이 기대에 못 미친다는 이유로 공개를 몇달째 미루고 있다는 소식이 전해진 상태다. 엔디비아 칩 부족과 중국 정부의 화웨이 칩 사용 권유도 발목을 잡은 것으로 알려졌다.
이런 상태라, 이번 모델 출시는 충분한 의미를 가지고 있다는 분석이다.
특히 중국 전문가인 포 자오는 "딥시크는 이번 모델 출시와 동시에 조용히 R1 태그를 삭제했다. 이제 모든 진입점은 V3.1로 기본 설정된다"라고 밝혔다.
이는 오픈AI가 GPT-5부터 추론과 비추론 모델을 통합한 전략과 같다는 것이다. 따라서 앞으로는 V 시리즈(비추론)와 R 시리즈(추론)가 통합될 것을 예고한다는 분석이다.
박찬 기자 cpark@aitimes.com
- 딥시크, 'R2' 출시 지연은 정부의 화웨이 칩 사용 강요 때문
- 딥시크, 알리바바·문샷AI 등 경쟁 심화로 점유율 하락세
- 딥시크, 엔비디아 칩 부족으로 'R2' 출시 지체..."결국 미국 기술에 종속"
- 딥시크, 'V3.1' 플래그십 모델 가능성 제기..."R2 출시하지 않을 수도"
- 딥시크 "V3.1은 곧 출시될 차세대 중국 칩에 최적화"
- 중국 칩 지원한다는 딥시크 모델 공개로 중국 반도체 주가 급등
- 딥시크, V3.1 개선한 ‘딥시크 V3.1-터미너스’ 출시..."도구 활용 강화"
- 딥시크, 텍스트를 이미지 데이터로 변환해 처리하는 획기적 LLM 출시
