(사진=셔터스톡)
(사진=셔터스톡)

딥시크가 일부 차세대 인공지능(AI) 모델 훈련에 화웨이의 AI 칩을 활용하기로 했다. 이는 엔비디아 의존도를 낮추려는 움직임으로, 중국 정부가 자국산 반도체 사용을 확대하라고 압박하는 가운데 나온 결정이다.

디 인포메이션은 29일(현지시간) 복수의 소식통을 인용, 딥시크가 중·소형 모델 훈련에 화웨이의 '어센드(Ascend)' 칩을 적용하기 시작했다고 전했다. 가장 강력한 모델 훈련에는 여전히 엔비디아 칩을 사용한다고 덧붙였다.

이는 미국의 수출 규제 강화 속에서 중국이 자국 기술에 기반한 생태계를 강화하려는 흐름과 맞물린다.

중국 정부가 올해 초부터 딥시크에 자국 칩을 사용하라고 권고했다는 소식은 이미 전해졌다. 또 화웨이 ‘어센드(Ascend)’ 프로세서를 활용한 결과, 'R2' 출시가 지연된다는 말이 나왔다.

결국 딥시크는 플래그십 모델 개발에는 이전처럼 엔비디아 칩을 사용하고, 대신 중소형 모델 훈련은 화웨이와의 협력을 통해 진행하는 것으로 전해졌다.

실제로 지난 20일 공개한 'V3.1' 모델은 곧 출시될 차세대 중국 칩에 최적화됐다고 밝힌 바 있다.

또 V3.1은 추론 하이브리드 모델로 뛰어난 성능을 보여, R2를 대체하는 것이 아니냐는 추측이 제기됐다. 하지만 이번 보도에 따르면 딥시크는 V3.1과 별개로 R2를 여전히 개발 중인 것으로 볼 수 있다.

변형 모델도 동시에 준비 중인 것으로 볼 수 있다. R1 출시 당시에는 매개변수 15억(1.5B)~700억(70B)에 이르는 '큐원'과 '라마' 등 오픈 소스 모델의 증류(Distillation) 버전을 6종 공개한 바 있다. 

딥시크는 이런 소형 모델 개발 과정에서 화웨이 엔지니어들과 협업해 어센드 칩에 최적화된 훈련 방식을 모색하고 있으며, 이를 통해 차세대 모델의 효율성과 비용 경쟁력을 끌어올린다는 계획을 가진 것으로 알려졌다. 중국 관계자들은 이번 협력이 화웨이 칩의 생태계 강화에도 도움이 될 것이라고 평했다.

대부분 중국 AI 기업은 여전히 엔비디아 칩과 쿠다(CUDA) 소프트웨어에 익숙하다. 딥시크도 R1 모델이 엔비디아 하드웨어에 최적화돼 있어, 중국산 칩으로 학습하는 데 한계를 경험했다. 이에 따라 딥시크는 현재 화웨이의 소프트웨어 체계인 캔(CANN)에 대한 이해를 넓히고, 모델을 이에 맞게 조정하는 작업을 병행하고 있다.

딥시크가 자체 개발한 데이터 처리 포맷 'UE8M0 FP8'도 같은 맥락에서 주목된다. 이 포맷은 엔비디아 칩에서도 구동 가능하지만, 중국 칩에서 더 효율적으로 작동하도록 설계됐다. 앞으로 중국산 칩과 모델 호환성을 높이려는 전략이다.

젠슨 황 엔비디아 CEO는 최근 “중국은 세계에서 두번째로 큰 컴퓨팅 시장”이라며, 중국 AI 칩 시장 규모가 올해 500억달러(약 70조원)에 이르고 연 50% 성장할 것으로 전망했다.

하지만 딥시크의 행보는 장기적으로 엔비디아의 중국 내 사업에 위협이 될 수 있다는 평이다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지