화웨이, 엣지와 클라우드 연결하는 '콜라보' 강조
"AI 칩부터 개발 프레임워크까지 '풀스택' 지원"
추론용 어센드 310·훈련용 어센드 910 NPU로 AI 성능↑

박태민 한국화웨이 이사가 AI 추론용 칩인 어센드 310을 소개하고 있다. (사진=양대규 기자)
박태민 한국화웨이 이사가 AI 추론용 칩인 어센드 310을 소개하고 있다. (사진=양대규 기자)

 

화웨이의 AI 플랫폼은 칩세트부터 개발 프레임워크까지 '풀스택'을 지원하는 것을 의미한다

화웨이가 엣지부터 클라우드까지 모든 영역을 연결하는 통합 AI 플랫폼을 공개했다. 화웨이는 이를 통해 파트너사들과의 생태계(ecosystem)을 만들겠다는 계획이다.

박태민 한국 화웨이 기술담당 이사는 "이를 '엣지-클라우드 컬래버레이션'(이하 콜라보)이라는 이름으로 부르고 있다"고 말했다.

화웨이는 27일부터 29일까지 서울 삼성동 코엑스에서 진행하는 '국제인공지능대전(AI 엑스포)' 행사에 참가해 자사의 AI 플랫폼을 소개했다.

박태민 이사는 "화웨이는 하드웨어 기업이기 때문에 플랫폼을 만들기 위해서는 칩을 먼저 만들어야 했다"며, 자사의 AI 전용 가속기 칩에 대해 설명했다.

화웨이는 지난해 훈련용 어센드(Ascend) 910 AI 프로세서와 마인드스포어(MindSpore) AI 프레임워크를 출시했다. 이에 앞서 2018년에는 추론(Inference)용 어센드 310을 출시한 바 있다.

박 이사는 "업계에서 이런 AI 칩세트를 주로 GPU(그래픽처리장치)라고 부르지만, 화웨이는 NPU(신경망처리장치)라고 부르고 있다"고 말했다. 동일한 전력에서 더 많은 컴퓨팅 파워를 낼 수 있게 불필요한 그래픽 렌더링 기능을 과감하게 삭제했다는 것이다.
 
화웨이가 어센드 310을 기반으로 제품화한 것이 엔드 디바이스에 사용되는 아틀라스 200이다.  아틀라스 200 AI 가속기에는 터미널 장치에 추론과 영상, 사진 디코딩 모듈이 포함됐다.

아틀라스 500과 아틀라스 500 프로 엣지 서버도 클라우드와 엣지 간 콜라보를 지원해 집약적인 추론 기능을 제공한다. 두 제품에도 어센드 310이 탑재됐다.

또한 화웨이는 데이터센터에서 실행되는 정밀한 훈련용으로 어센드 910 기반의 제품을 제공했다. 고성능 컴퓨팅 파워를 제공하는 아틀라스 800 AI 서버, 대규모 데이터세트 신경망 트레이닝을 지원하는 아틀라스 900이 대표적이다.

박태민 이사는 "엣지 디바이스에서 만들어진 다양한 추론데이터들이 클라우드 서버에 모여서 재학습을 시킨 후에 정확도를 높인 후 다시 배포하는 선순환 구조를 만들겠다는 게 저희의 목표"라며 아틀라스 800을 개발한 이유를 설명했다.

화웨이는 클라우드 서비스를 하는 여러 데이터센터 고객들이 대용량 머신러닝용 서버를 통해 모인 엣지 데이터를 재학습 시키게 되면, AI의 정확도가 상당히 높아져 결국에는 사람이 개입하지 않을 수준의 정확도를 가지게 될 것으로 전망했다.

이를 위해 화웨이는 엣지-클라우드 콜라보가 중요하다고 강조했다.

화웨이 로드맵에 따르면, 내년에 어센드 310과 910 사이의 모델인 710(가칭)을 공개할 예정이다.

박 이사는 "310이 엣지에서 충분한 능력을 보여주기 때문에 710은 컨셉상으로 SMB용 서버에 사용될 가능성이 높다"며, "현재 910은 너무 크다. 데이터센터용 가속기 중에서도 상당히 큰 성능을 보이고 있다. 910 한 대로 웬만한 중견기업 업무를 처리할 수 있다"고 전했다.

[관련기사] 엔비디아 최신 MLPerf 추론 결과 1위…단점은 가격·크기

[관련기사] Arm, "마이크로NPU로 엣지에 더많은 AIㆍ머신러닝 기능 제공할 것"

키워드 관련기사
  • 아마존, '비싼' 엔비디아 대신 빠르고 저렴한 자사 AI칩 선택