(사진=셔터스톡)

복잡성이 높은 신경망 구조를 학습(Learning) 모델로 사용하는 딥러닝(DL)은 머신러닝(ML) 패러다임 가운데 가장 현실에서 유용하게 사용된다. 인공지능(AI) 칩 시장의 대부분은 DL로 운영되고 있다. 

이에 전문가들은 오늘날 AI칩 시장이 딥러닝 가속화에만 급급하다고 지적한다. 추론(inference)은 사라지고 훈련(training)만 남았다는 것이다.

영국 시장조사업체 키사코 리서치의 미카엘 아조프 수석연구원은 "가속기는 훈련뿐만 아니라 추론도 필요하다"며 "우리는 왜 그것(AI칩 시장)이 지금과 같은 방식인지, 어떻게 변화할 가능성이 있는지, 그리고 그것이 무엇을 의미하는지 더 잘 이해하기 위해 이 시장을 분석할 필요가 있다"는 주장을 EE타임스에 기고했다.

미카엘 아조프는 엔비디아가 전통적인 그래픽처리장치(GPU)를 병렬 프로세싱으로 범용연산에 활용한 GPGPU(General-Purpose computing on GPU) 기술을 공개한 2010년부터 DL의 활용이 급격히 늘어났다고 보았다. DL의 도입으로 수개월 걸렸던 대형 신경망 네트워크의 교육시간이 불과 몇 시간에서 수 일로 줄었기 때문이다.

엔비디아는 GPGPU 기술로 게이밍 GPU 회사에서 AI 컴퓨팅 회사로 체제를 전환하고 회사 규모를 키웠다. 엔비디아의 성공으로 다른 반도체 기업과 반도체 설계자 생각도 바뀌게 됐다. 얼마나 많은 GPU를 가지고 더 나은 성능을 발휘할 수 있는지를 생각하게 된 것이다.

아조프는 "오늘날의 AI 워크로드는 단순히 DL을 실행하는 것을 의미하며, 여기에 바로 시장 수요가 존재한다"고 지적했다. 

하지만 그는 DL이라는 큰 시장 외에도 다양한 종류의 시장도 존재한다고 강조했다. 훈련은 아마존웹서비스(AWS)나 구글 클라우드, 마이크로소프트(MS) 애저 등 초대형 클라우드와 데이터센터, 워크스테이션 등에서 사용되지만, 추론은 클라우드와 워크스테이션은 물론 PC나 랩톱, 스마트폰을 비롯해 IoT 디바이스까지 수많은 엣지 디바이스에서 주로 사용된다. 

훈련용 AI 칩은 모델을 만들기 위해 엄청나게 큰 데이터를 처리해야 한다. 대규모 병렬 연산이 필요하다. 엣지 디바이스에 사용되는 추론은 훈련보다 민감한 개별 정보 입력을 처리해야 한다. 빠른 연산이 필요하다. 때로는 몇 밀리초(ms) 이내에 필요할 수 있다는 것이다.

ML이라고 묶어서 불리지만 훈련과 추론은 반도체 단위에서부터 개발 방향과 성격이 달라질 수밖에 없다.

(사진= 미카엘 아조프, EE타임스)
(이미지= 미카엘 아조프, EE타임스)

컴퓨팅 성능이 중요한 '훈련' vs 성능·전력·비용 효율이 중요한 '추론'

아조프는 이에 훈련과 추론에 맞는 애플리케이션과 기술 등을 삼각형으로 매핑했다. 그의 삼각형 매핑에 따르면, 각각의 꼭짓점은 그 자체적인 기준을 가진 뚜렷한 시장 수요를 나타낸다. 정점에 데이터 센터, 클라우드, HPC 환경의 AI 칩 수요가 있다. 

세레브라스는 현재 전 세계에서 가장 큰 칩인 웨이퍼 스케일 엔진(WSE)을 개발했다. WSE는 가로세로 각각 약 21cm(8.46인치)다. 스마트 태블릿과 비슷한 크기다. 일반 CPU나 GPU보다 50배 이상 크다. 엔비디아 테슬라 V100의 56배나 많은 트랜지스터를 집약했다.

세레브라스의 WSE 칩은 1.2조개의 트랜지스터를 집적했으며, 40만개의 코어를 갖췄다. 엔비디아 테슬라 V100 GPU도 210억개의 트랜지스터와 수 천 개의 코어를 지녔다. 일반 프로세서는 약 20억개의 트랜지스터에 4개의 코어가 전부다.

WSE는 극단적인 컴퓨팅 성능에 치중한 AI칩이다. 여기서 전력소비량과 비용은 단지 부수적인 요인이다.

추론은 반대다. 삼각형의 하단 가장자리에서는 칩의 크기, 낮은 지연 시간, 낮은 전력 소비량, 생산 비용 등의 조건이 중요해진다. 추론은 애플리케이션이 다양하다.

추론용 AI칩 시장에는 다양한 경쟁자들이 뛰어들고 있다. 여기에서도 엔비디아는 테슬라 T4 GPU로 시장을 선도하고 있다. 다만 훈련용 AI칩 시장만큼 절대적인 우위를 점하지는 못하고 있다. 

테슬라 T4는 튜링(Turing) 아키텍처와 일련의 새로운 추론 소프트웨어를 기반으로 하는 GPU다. 퀄컴도 지난해 클라우드용 AI100 칩을 발표했다. 자세한 내용은 공개되지 않았지만 올해 출시될 것으로 전망된다. 인텔과 자일링스는 FPGA를 이용한 가속기로 AI 시장에 뛰어들었다. 

이밖에도 수많은 칩 설계자와 반도체 기업, 스타트업들이 AI칩에 뛰어들었다. 시장 경쟁이 가속화되면서 AI 칩의 성능도 함께 올라가고 있다.

아조프는 "AI 연구자들은 이런 혜택을 받아 새로운 디자인을 실행할 것이며, DL의 현재 패권을 추월할 새로운 알고리즘이 등장할 것으로 기대한다"며 "인간 같은 인공적인 뇌를 만들겠다는 목적의 장기적 AI 연구에서 DL은 막다른 골목"이라고 말했다. 필연적으로 새로운 알고리즘이 등장할 수밖에 없다는 것이다. 여기서는 DL이 아닌 추론 기반, 또는 완전 새로운 개념이 등장할 것이다.

현재 AI칩 시장은 5G의 도입으로 DL 중심으로 폭발적으로 성장하고 있다. 수십억 달러 규모의 시장을 형성하는 중이다. 다만 지속적인 성장에서 DL 외에도 다양한 ML을 개발하는 기업들이 시장에 뛰어들며 생존 경쟁을 이어나갈 것이다.

[관련기사] "MLPerf, 우리가 더 높아"...엔비디아 vs 구글

[관련기사] 美 ETA 컴퓨트, 엣지 AI 개발 위한 솔루션 발표

키워드 관련기사
  • [AI논단] 스탠포드 AI 인덱스 2019에 나타난 글로벌 AI 수준
  • 인텔·VM웨어, AI/ML 활용한 무선 네트워크 기능 공동 개발
  • 美 신티언트, 엣지 AI 칩 100만개 출하…6500만달러 투자 유치