하일로, 인텔·구글 뛰어넘는 추론 장치 개발
그래프코어, IPU 고객사 위한 파트너 프로그램 소개
그로크, 초당 1000조번 연산하는 고성능?TSP 개발

하일로가 공개한 벤치마크(자료=하일로)
하일로가 공개한 벤치마크(자료=하일로)

인공지능(AI) 시장이 발달하면서 수많은 AI칩 스타트업들이 생겨났다 사라지곤 한다. 실제로 극히 일부만이 새로운 유니콘으로 재탄생한다.

최근 AI 칩 스타트업 3곳이 뚜렷한 성과를 보이며 주목받고 있다. 바로 이스라엘의 하일로(Hailo), 영국의 그래프코어(Graphcore), 미국 실리콘밸리의 그로크(Groq)가 그 주인공.

◇ 하일로, 인텔·구글 뛰어넘는 추론 장치 개발

이스라엘 AI 칩 스타트업 하일로는 엣지(Edge) 애플리케이션용 '하일로-8 AI 가속기'를 출시했다. 해당 가속기는 벤치마크에서 인텔과 구글의 추론용 엣지 AI칩을 능가하는 성능을 자랑했다.

EE타임스는 "스마트 시티, 스마트 상거래, 스마트 홈, 인더스트리4.0 애플리케이션의 팬리스(fanless) 엣지 박스에 적합할 것"이라고 보도했다.

엣지 박스는 대기 시간을 줄이고 개인 정보 보호 문제를 피하기 위해 엣지에서 수행해야 하는 다중 비디오 스트림 분석과 같은 작업을 수행할 수 있다.

하일로의 AI 가속기 모듈은 M.2와 미니 PCIe를 지원한다.

하일로-8 AI칩 아키텍처는 3TOPS/W로 26TOPS(Trillion Operations Per Second, 초당 1조번 연산)의 성능을 적용한다. 또한 ASIL-B 적용에 적합한 자동차 인증을 받았으며, AEC-Q100 2급 인증을 받았다.

하일로는 최근 자사 모듈이 다양한 성능 벤치마크에서 인텔 미리아드(Myriad)X와 구글 엣지 TPU 모듈보다 압도적인 성능을 달성했다고 밝혔다.

이미 하일로-8은 엣지 애플리케이션에서 비디오를 처리하도록 설계된 폭스콘의 엣지 박스 '박시엣지(BOXiedge)'에 사용됐다. 

박시엣지는 일본의 소시오넥스트(Socionext)의 SynQuacer SCA11 병렬 프로세서와 하일로-8을 탑재해 딥러닝 추론 가속화를 구현했다.

이를 통해 박시엣지는 최대 20대의 카메라 영상에서 이미지 분류, 객체 인식, 포즈 추정 등의 작업을 동시에 수행할 수 있다. AI 추론을 위한 스마트 시티, 스마트 보안, 자율이동 로봇, 자율주행차 등 분야에 적합하다.

폭스콘은 애플의 아이폰을 생산하는 대만 제조 기업으로 잘 알려져 있다.

이스라엘 텔아비브에 위치한 AI 스타트업인 하일로는 2017년 설립돼 현재 100여 명의 직원이 근무하고 있다. NEC와 ABB 등 투자자로 현재까지 8800만달러 이상을 모금했다.

그래프코어의 IPU-머신, M2000 (사진=그래프코어)
그래프코어의 IPU-머신, M2000 (사진=그래프코어)

◇그래프코어, IPU 고객사 위한 파트너 프로그램 소개

영국의 AI칩 스타트업 그래프코어는 IPU(지능형처리장치)라는 AI용 프로세서를 개발해 유명해졌다. 

IPU는 CPU(중앙처리장치)에 직접 메모리 반도체를 탑재해 처리 속도를 높인 것이 특징이다. GPU가 커버하지 못하는 소단위 데이터를 처리하는 데 특화된 칩이다.

삼성전자, HP 등 글로벌 기업들이 이를 연구해왔으나, 가시화된 제품은 IPU가 처음이다.

최근 그래프코어는 글로벌 협력사 지원 프로그램인 ‘엘리트 파트너 프로그램(Elite Partner Program)’을 공개했다.

엘리트 파트너 프로그램은 스케일아웃과 슈퍼컴퓨팅을 지원하는 그래프코어의 AI 컴퓨팅 플랫폼인 IPU-M2000과 IPU-POD에 대한 고객 요구사항을 충족하기 위해 구축된 글로벌 채널 파트너 네트워크다.

메가존, 2CRSi, 아토스, 보스턴 리미티드, BSI, 델 테크놀로지스(Dell), 인스퍼, 람다(Lambda) 등이 파트너 프로그램에 속해있다.

그래프코어 GTM(go-to-market) 파트너 프로그램 규모는 이 회사의 지능형처리장치(IPU)와 최근 출시한 2세대 IPU 시스템 중심으로 형성되고 있는 높은 수요를 반영한다. 창립 멤버들은 세계 각국 고객사들에게 차세대 AI 컴퓨팅 플랫폼을 제공하는 데 박차를 가할 예정이다. 

나이젤 툰(Nigel Toon) 그래프코어 CEO는 “정보기술 분야 공급망에서 가장 신뢰할 수 있는 조직들로 구성된 그래프코어 엘리트 파트너 프로그램을 통해 전 세계 상업, 학계, 공공 분야 고객들에게 그래프코어의 서비스를 제공할 수 있게 됐다”고 말했다.

그래프코어는 2016년 영국 브리스톨에서 시작된 스타트업이다. 알테라·이매지네이션을 거친 나이젤 툰과 엘리먼트14·아이세라의 창업자 사이먼 놀스가 공동 창업했다. 2018년 IPU를 처음으로 출시했으며 최근 2세대 IPU을 발표했다. 

그로크 노드(사진=그로크)
1POPS의 성능을 기록한 그로크 노드(사진=그로크)

◇ 그로크, 초당 1000조번 연산하는 고성능 TSP 개발

그로크는 자사 PCIe용 AI칩 8개를 하나의 섀시에 통합해 데이터센터의 AI 추론을 위한 TSP(텐서 스트리밍 프로세서)를 서버 시장에 출하하고 있다. 

그로크가 공개한 수치에 따르면, TSP는 1POPS(1TOPS의 1000배, 초당 1000조번 연산)의 강력한 성능을 자랑한다. 배치 사이즈(Batch Size, 한 번에 학습되는 데이터 개수) 로는 ResNet-50 v2에서 1만8900번의 IPS(inferences per second, 초당 추론횟수)를 기록했다.

EE타임스는 "그로크의 프로세서는 소프트웨어를 통해 개발이 이뤄지는 단순한 하드웨어 설계를 가지고 있다"며 "그로크의 컴파일러는 기본적으로 모든 데이터 흐름과 계산이 스톨 없이 이루어지도록 하기 위해 필요한 타이밍을 조정해 지연 시간과 성능을 예측할 수 있게 한다"고 설명했다.

최근 그로크는 구체적인 액수를 밝히지는 않았지만 더 많은 자금을 지원받았다고 발표했으며, 자동차 시장 진출을 위해 시장을 넓히고 있다.

[관련기사] '손 안의 AI 기기'…초소형·저전력 엣지 AI 추론 반도체 등장

[관련기사] AI칩, 매년 40% 성장…키워드는 메모리·딥러닝·신경망

키워드 관련기사
  • 그래프코어, "2세대 IPU 엔비디아 GPU보다 낫다" vs "자체 기준, 설득력 부족"
  • 그래프코어 IPU-POD 시리즈, MLPerf벤치마크서 AI 성능 입증