딥시크의 차세대 모델 출시가 지연되는 이유가 화웨이 칩을 훈련에 사용하며 성능을 제대로 내지 못했기 때문으로 알려졌다. 이는 중국 정부가 칩 사용을 강요한 결과다.
파이낸셜 타임스는 14일(현지시간) 복수의 관계자를 인용, 딥시크가 중국 당국의 권고로 엔비디아 대신 화웨이 칩을 'R2' 훈련에 사용했다고 보도했다.
그러나 성능 불안정과 칩 연결 속도 저하, 소프트웨어 호환성 문제 등으로 원하는 성능을 내는 데 실패한 것으로 알려졌다.
딥시크는 앞서 R1 모델을 5만개의 엔비디아 호퍼(Hopper) 시리즈 GPU 클러스터에서 훈련했는데, 여기에는 'H20' 3만장, 'H800' 1만장, 'H100' 1만장 등이 포함됐다. 이 장비는 모 회사인 하이플라이어 캐피털 매니지먼트가 공급됐다.
그러나, 중국 정부의 권고에 따라 R2는 화웨이 ‘어센드(Ascend)’ 프로세서를 채택했다.
이는 R2 출시가 당초 5월에서 지연된 주요한 이유로 꼽혔다. 데이터 라벨링 지연도 일정 차질의 원인이 됐다.
중국 내 고성능 엔비디아 GPU 부족 현상도 영향을 미쳤다. 이 때문에 R2가 사전 훈련을 마쳤는지도 아직 불분명하다.
하지만, 딥시크는 여전히 R2의 추론 기능을 어센드에 맞추는 작업을 진행 중으로 알려졌다.
딥시크의 모델 아키텍처는 엔비디아 하드웨어에 최적화돼 있으며, R1 모델이 뛰어난 성능을 낼 수 있었던 것은 엔지니어링 기술 때문이라고 분석됐다. 즉, 어센드 칩 사용은 딥시크의 가장 큰 장점을 없애는 결과를 초래한 셈이다.
또 R2는 R1보다 훨씬 강력한 훈련 인프라가 필요해, 추가 자원 확보가 필수로 꼽히고 있다.
그러나, 중국 정부는 최근 빅테크들을 소집, 엔비디아 칩 추가 주문을 자제하라고 지시한 상태다.
박찬 기자 cpark@aitimes.com
- 딥시크, 중국서도 다운로드 급감..."단순 챗봇 시대 끝나"
- 딥시크, 엔비디아 칩 부족으로 'R2' 출시 지체..."결국 미국 기술에 종속"
- '딥시크-R2' 정보 인터넷에 떠돌아..."화웨이 칩으로 훈련·오픈AI보다 97.3% 저렴"
- "중국의 엔비디아 'H20' 수입 금지, 오래가지는 않을 것"
- 중국, 국가 데이터센터에 “칩 절반 이상 중국산 사용” 의무화
- 딥시크, 추론·코딩 통합한 'V3.1' 출시..."완벽한 하이브리드 아키텍처"
- 딥시크, 'V3.1' 플래그십 모델 가능성 제기..."R2 출시하지 않을 수도"
- 딥시크, 올해 말 'R2' 출시 예정...AI 에이전트에 초점
