엣지용 NPU(신경망처리장치) 설계 전문 모빌린트(대표 신동주)는 19~21일 서울 코엑스에서 열리는 국내 최대 인공지능(AI) 전시회 ‘2024 인공지능&빅데이터쇼’에 참가해 고성능 NPU 데모를 선보인다고 17일 밝혔다.
모빌린트는 이번 전시에 엣지용 NPU PCIe(PCI Express 규격)카드 ‘MLA100’을 이용한 고성능 AI 데모를 시연할 예정이다. MLA100은 최대 초당 80조회 연산(80TOPS)의 고성능 AI 가속기 ‘에리스(ARIES)’를 내장한 PCIe 카드로 스마트팩토리, 스마트시티, 로봇, AI 보안 시스템, 엣지서버, 엣지 데이터센터 등에 적합하다는 설명이다.
온디바이스 AI용 시스템온칩(SoC) ‘레귤러스(REGULUS)’도 전시할 예정이다. 레귤러스는 작은 크기와 5와트(W) 이하의 적은 전력 소모가 특징이다. 로봇, 드론, AI CCTV, 사물인터넷 기기, AI 교감형 인형 등에 활용할 수 있다.
특히 올해 하반기부터는 수십 건의 PoC(기술실증)를 통해 검증된 에리스를 양산할 계획이다. 내년 초부터는 소프트웨어 업데이트를 통해 기존 합성곱신경망(CNN), 순환신경망(RNN), LSTM(Long short-term memory)뿐만 아니라 트랜스포머 계열 모델 연산까지 지원할 계획이다. 이에 대형언어모델(LMM) 및 멀티모달 모델을 지원해 활용 분야를 확장하겠다고 전했다.
한편 모빌린트는 세계 최고 수준 고성능 저전력 엣지 NPU와 소프트웨어 개발 키트(SDK)를 개발한 국내 AI 반도체 팹리스 전문 기업이다. 기어 딥러닝 추론 연산에 최적화한 연산기와 외부 메모리 접근을 최소화하는 구조를 통해 전력효율을 극대화한 것이 특징이다. 더불어 텐서플로우, 파이토치(PyTorch), ONNX(Open Neural Network Exchange) 등 주요 머신러닝 프레임워크와 200종 이상 AI 모델들을 지원하는 범용성도 갖췄다.
기존 유사 등급의 반도체(GPU) 대비 최소 2배 이상 성능이 뛰어나며 가격도 절반 이하에 불과하다고 강조했다. AI 성능을 향상하는 동시에 비용 절감이 가능하다.
무엇보다 하드웨어-소프트웨어 공동 최적화가 강점이다. 모빌린트 NPU 제품들은 하드웨어 자원 활용률이 매우 높기 때문에 1조회 연산(1TOPS) 당 유효 성능이 기존 반도체보다 뛰어나 실제 성능은 표기 성능(TOPS)보다도 훨씬 뛰어나다는 설명이다.
모빌린트 관계자는 “NPU에 있어 성능만큼 중요한 건 소프트웨어가 하드웨어를 충분히 활용할 수 있는지다"라며 "라이브 데모를 통해 실제 성능을 실시간으로 공개하는 기업은 전세계적으로도 많지 않다"라고 말했다
이어 "직접 보면 기존 반도체와 큰 차이를 느낄 수 있을 것”이라며 “기업들이 저렴한 비용으로 더 강력한 AI 제품을 개발할 수 있도록 앞으로도 더욱 효율 좋은 NPU를 개발하고 지원할 것”이라고 말했다.
장세민 기자 semim99@aitimes.com
