인퍼X1 엣지 AI 가속기, 추론 벤치마크에서 엔비디아 젯슨 자비에 능가
30%에서 최대 11배까지 높은 성적…3D 컨볼루션에서 높은 성능 보여
"소형 디바이스부터 대형 의료용까지 다양한 엣지 AI 추론에 사용 가능"

인퍼X X1 보드(사진=플렉스 로직스)
인퍼X X1 보드(사진=플렉스 로직스)

플렉스 로직스(Flex Logix)가 엔비디아 제품보다 더 높은 성능에 더 낮은 가격의 엣지(Edge) AI 가속기를 공급한다고 주장했다.

플렉스 로직스에 따르면, 자사의 인퍼X(InferX) X1 AI 가속기가 욜로(Yolo) v3 벤치마크에서 엔비디아 젯슨 자비에(Jetson Xavier)보다 30% 이상의 성능을 보였다.

욜로(Yolo)는 'You Only Look Once'의 줄임말이다. 대표적인 객체 탐지(object detection) 모델로 AI 가속기의 추론(Inference) 능력을 평가하는 주요 지표로 사용된다.

욜로는 CNN(합성곱 신경망) 기반의 모델이다. 하나의 CNN 모델에 기존 다른 모델의 3단계 분류 과정을 통합해 엔드투엔드 학습을 구현했다.

3개의 학습이 하나의 신경망 안에서 이루어지기 때문에 통합적 구조를 이룬다. 이를 통해 실시간 환경에서 높은 성능을 보여준다. 기본 모델에서 45FPS(초당 프레임 수)의 성능을 보일 때, 컨볼루션층의 9개 레이어를 남겨둔 패스트 욜로(Fast Yolo) 모델은 155FPS의 성능까지 보인다.

21일(현지시간) EE타임스는 플렉스 로직스의 인퍼X X1이 다음 분기에 샘플 생산된다며, 대량 애플리케이션에서 AI 추론의 광범위한 채택을 위해 의도적으로 저렴한 가격이 책정됐다고 보도했다.

플렉스 로직스는 새로운 AI칩이 로봇공학, 산업자동화, 의료영상촬영, 유전자 염기서열화, 은행보안, 소매분석, 자율주행차, 항공우주 등 응용분야에 적합하다고 설명했다.

엔비디아를 제외한 다른 엣지 AI 칩 메이커들은 일반적으로 ▲높은 신뢰성 ▲낮은 전력 ▲낮은 지연 시간 ▲작은 크기 등 특정 요소와 특정 틈새 시장의 요구를 충족시키는 데 초점을 맞춰왔다. 

실제 하나의 아키텍처로 자율 주행과 의료 장비 모두의 요구를 충족하기는 어렵다는 것이다.

하지만 제프 테이트 플렉스 로직스 CEO는 EE타임스와의 인터뷰에서 인퍼X X1 가속기가 이를 다 충족시킬 수 있다고 자신했다.

그는 "모든 카테고리, 그 이상을 원하는 고객들과 (그것을 충족하는) 모델을 보유하고 있다"며 "이 시장(추론 AI칩)은 매우 커질 것이고 인퍼X X1이 응용될 다양한 종류의 애플리케이션이 있을 것"이라고 말했다.

플렉스 로직스는 소형 임베디드 엣지 애플리케이션용으로 엔비디아 젯슨 자비에와 비교했으며, 의료 영상 장비 같은 대형 엣지 장비용으로 엔비디아 테슬라 T4와 비교했다.

플렉스 로직스에 따르면, 욜로 v3에서 인퍼X X1은 젯슨 자비에보다 30% 나은 성능을 보였다. 또한 Z모델에서 자비에보다 50% 더 빨랐으며, X모델에서는 11배의 성능 차이를 보였다. 3D 컨볼루션(Convolution, 합성곱)을 적용한 모델에서 인퍼X X1의 성적이 더 낫다는 것이다.

젯슨 자비에(사진=엔비디아)
젯슨 자비에(사진=엔비디아)

인퍼X X1은 TSMC 16nm(나노미터) 공정을 이용해 54mm²로 350mm²의 젯슨 자비에보다 더 작다.

테슬라 T4와 비교에서도 X모델에서 2배가량 앞서는 것으로 나타났다. 욜로 v3에는 3분의 1의 속도를 냈으며, Z모델에서는 거의 절반의 속도를 냈다. 

플렉스 로직스는 T4의 크기가 인퍼X X1보다 10배 큰 545mm²이며 DRAM성능도 8배인 점을 고려하면 괜찮은 성적이라고 주장한다.

테이트는 인퍼X1이 적용된 첫번째 애플리케이션은 카메라가 될 것으로 보지만, 그는 진정한 사용처는 아직 개발되지 않았을 수도 있다고 말했다.

업체는 내년 1분기에 더 많은 샘플 출하를 진행할 것이며, 2분기부터 본격적인 생산을 진행할 것이라고 밝혔다.

[관련기사] Arm, "마이크로NPU로 엣지에 더많은 AIㆍ머신러닝 기능 제공할 것"

[관련기사] 하일로·그래프코어·그로크…보다 '성숙한' AI칩 스타트업

키워드 관련기사
  • 사이먼 놀스 그래프코어 CTO, "HBM, AI 훈련에 적합하지 않아"
  • 그래프코어, 2.2억달러 투자 유치…"엔비디아 Arm인수 반시장적"