미국의 첨단 반도체 수출 통제로 인해 딥시크의 차세대 대형언어모델(LLM) 'R2'의 출시에 제동이 걸린 것으로 밝혀졌다.
디 인포메이션은 26일(현지시간) 중국 클라우드 서비스 기업 관계자들을 인용, 엔비디아의 서버용 AI 칩 공급 부족으로 인해 '딥시크-R2'의 출시가 늦어지고 있다고 보도했다.
또 출시된다고 해도 R1만큼 빠르고 폭넓게 채택되기 어려운 상황이라고 덧붙였다.
딥시크가 지난 1월 공개한 R1은 첨단 모델보다 훨씬 적은 컴퓨팅으로 비슷한 성능을 내는 효율성으로 세계적인 주목을 받았다. 특히, 전문가들은 R1 성능의 핵심으로 엔비디아의 중국 전용 AI 칩 ‘H20’에 최적화된 엔지니어링 기술을 꼽았다.
R1이 성공을 거두자, 제한적인 성능으로 인해 H20 도입을 꺼리던 중국 기업들이 일제히 이를 채택하기 시작했다. 바이트댄스와 알리바바, 텐센트 등들은 2025년 1분기에만 총 120만개, 약 160억달러(약 22조원)어치의 H20을 주문한 것으로 알려졌다.
그러나, 미국 정부가 지난 4월 H20의 중국 수출을 전면 금지하며 상황이 급변했다. 현재 중국 내 클라우드 기업들은 확보해 둔 재고에 의존할 수밖에 없는 실정이며, 이는 R2의 사용 가능 범위를 크게 제한할 것이라는 예측이다.
또 엔비디아 칩에 최적화된 기술을 갖춘 딥시크는 차세대 모델 개발에 지장을 받는 것으로 알려졌다.
회사 내부 사정에 정통한 소식통에 따르면, 딥시크의 엔지니어들이 수개월 동안 R2를 집중 개발했지만, 량원펑 CEO는 성능에 만족하지 않아 출시 승인을 계속 보류하고 있다.
딥시크는 일부 클라우드 기업들과 협력 중이며, 서버 탑재 및 모델 배포에 필요한 기술 사양을 공유하는 것으로 나타났다. 하지만 대다수 기업은 R2 풀사이즈 모델을 운용하기 위한 H20 칩 확보에 어려움을 겪고 있다.
이처럼 딥시크는 미국 기업보다 훨씬 적은 연산 자원을 훈련에 사용했다며 기술 우위를 내세워 왔지만, 결국 미국 기술에 깊게 의존하고 있다는 점을 드러냈다는 평이다.
실제로 R1은 엔비디아의 소프트웨어와 하드웨어에서 최상의 성능을 발휘하며, 화웨이 등 중국 칩에서는 운용이 어렵고 효율성도 떨어진다는 평가다. 딥시크의 기술 자체가 엔비디아 하드웨어에 최적화된 것이 가장 큰 장점이기 때문이다.
엔비디아는 성명을 통해 “중국은 세계에서 가장 많은 개발자를 보유하고 있으며, 이들이 만든 오픈 소스 기반 모델과 민간 AI 애플리케이션은 전 세계적으로 사용되고 있다”라며 “보안이 중요한 것은 사실이지만, 모든 애플리케이션은 미국의 AI 스택에서 최상의 성능을 낼 수 있어야 한다”라고 밝혔다.
박찬 기자 cpark@aitimes.com
