딥시크의 인공지능(AI) 모델이 화웨이 클라우드 플랫폼을 통해 사용자에게 서비스된다. 그러나 화웨이와의 파트너십이 미국의 제재를 초래할 수 있다는 우려도 존재한다.
사우스차이나모닝포스트(SCMP)는 2일(현지시간) 화웨이 클라우드 부문이 AI 인프라 스타트업 실리콘플로우와 협력, '딥시크-V3'와 '딥스크-R1'을 화웨이 어센드(Ascend) 클라우드 서비스를 통해 사용자에게 제공한다고 보도했다.
화웨이 클라우드는 딥시크 모델이 엔비디아 GPU에서 실행되는 모델과 동등한 성능을 낸다고 밝혔다.
딥시크 모델을 호스팅하는 실리콘플로우에 따르면, V3 요금은 100만개 입력 토큰에 대해 1위안(약 203원), 100만개 출력 토큰에 대해 2위안(약 407원)으로 할인되며, R1 모델은 100만개 입력 토큰에 4위안(약 815원), 100만개 출력 토큰에 16위안(약 3260원)이 부과된다.
'딥시크-V3' API의 입력 토큰 0.3달러(약 440원), 출력 토큰 1달러(약 1466원), '딥시크-R1'의 입력 토큰 0.14달러(약 205원), 출력 토큰 2.19달러(약 3210원)보다 저렴하다.
미국에서도 딥시크 모델은 주요 클라우드 업체의 인기 서비스 대상이다.
마이크로소프트(MS)는 최근 애저 클라우드와 깃허브에서 R1 모델 지원을 시작했다. 또 아마존은 아마존웹서비스(AWS)를 통해 R1을 활용한 애플리케이션 개발을 지원하고 있다.
화웨이의 어센드 클라우드 서비스는 서버 클러스터, AI 모듈, 가속 카드 등을 포함한 다양한 컴퓨팅 자원을 제공한다. 그러나 사용하는 칩에 대한 구체적인 정보를 공개하지 않았다.
이번 조치는 외국 기술 의존도를 줄이고 자국의 AI 산업을 강화하려는 중국의 방침에 따른 것으로 보인다. 그러나 미국은 화웨이를 안보 위협으로 간주, 화웨이 협력 업체들까지 잇달아 블랙리스트에 추가하고 있다. 이에 따라 딥시크가 미국 추가 제재 대상이 될 수 있다는 우려가 제기된다.
한편, 중국 빅테크 텐센트도 클라우드 플랫폼에 R1을 도입했다. 3분 만에 설정을 마칠 수 있다는 점을 강조했다.
박찬 기자 cpark@aitimes.com
