서버·게이트웨이 외에도 엣지 디바이스가 AI 중심 될 것
TinyML로 엣지에서 딥러닝 실행할 수 있어

(원본사진=Pexels, 셔터스톡)
(이미지=AI타임스, 원본=Pexels, 셔터스톡)

인공지능(AI) 기능 대부분은 서버나 게이트웨이에 집중돼 있다. 엣지(Edge) 디바이스는 비용과 전력 소모 등 이유로 프로세서 중심의 추론 정도에 그치고 있다.

그런데, 최근 들어 전송 속도와 개인정보보호 등 이슈로 엣지 디바이스에도 AI 기능을 탑재하기 위한 연구가 활발해지는 추세다. 엣지에서 추론 외에 병렬 연산을 이용한 훈련까지 머신러닝(ML)으로 진행하는 것이 목표다.

EE타임스는 21일(현지시간) 이같은 상황과 관련해 "불과 몇 년 전만 해도 ML과 딥러닝(DL)은 게이트웨이, 데이터센터에 의해 실행되는 훈련과 추론을 통해 고급 하드웨어에서만 수행될 수 있다고 가정됐다"며 "그러나 이 시나리오는 산업계와 학계의 집중적인 연구 개발 노력 덕분에 극적으로 바뀌었다"고 분석했다.

초당 수조번의 작업을 전달할 수 있는 프로세서가 ML을 수행할 필요는 없고, 마이크로컨트롤러(MCU)에 탑재한 ML 가속기만으로도 AI를 충분히 구현할 수 있다는 것이다.

EE타임스는 분석에서 '이런 장치들은 ML을 수행할 수 있을 뿐만 아니라, 매우 낮은 전력 소비로 반드시 필요한 경우에만 클라우드에 연결할 수 있다'고 강조했다. ML 가속기가 장착된 마이크로컨트롤러는 IoT의 모든 데이터를 생성하는 마이크, 카메라, 가속도계 등의 센서를 통해 직접 AI를 구현한다.

최근의 AI 기술은 단일 보드 컴퓨터로도 엣지 AI 프로세싱을 구현할 수 있게 해준다. 미세 공정으로 개별 프로세서 성능이 향상됐고, 클러스터로 실행할 때는 작은 슈퍼컴퓨터급의 성능을 낼 수 있다.

싱가포르 시장조사업체 ABI리서치도 최근 2025년까지 엣지 AI칩 시장이 122억달러 규모를 형성, 같은 기간 119억달러로 예상되는 클라우드 AI칩 시장을 추월할 것으로 전망했다.

ABI리서치는 짧은 대기 시간과 개인정보보호에 대한 수요가 증가하고, 이를 위해 설계한 저비용·저전력 AI칩의 사용이 급격히 늘어날 것으로 예측했다. 훈련과 추론이  향후 5년 안에 센서단에서 바로 연결되는 게이트웨이나 모든 종류의 엣지 디바이스에서 처리될 것이라는 전망이다.

라이언 졔 수 ABI리서치 수석분석가는 "고속 추론과 훈련이 이뤄지면서 엣지 AI는 다양한 분야의 디바이스와 센서 레벨에서의 채택이 늘어날 것"으로 전망했다.

2019년 공개한 클라우드 AI칩과 엣지 AI칩 시장 비교. 올해 ABI리서치에 따르면, 2025년부터는 엣지 AI가 클라우드 AI를 넘어설 전망이다.(이미지=EE타임스, ABI리서치)
2019년 공개한 클라우드 AI칩과 엣지 AI칩 시장 비교. 올해 ABI리서치에 따르면, 2025년부터는 엣지 AI가 클라우드 AI를 넘어설 전망이다.(이미지=EE타임스, ABI리서치)

◇TinyML로 엣지단에서 딥러닝 실행할 수 있어

빅데이터를 활용한 대규모 병렬 연산을 활용하는 ML에서는 당연히 고성능의 프로세서나 가속기를 사용한다. 워크스테이션 수준에서 활용하는 AI 프로세서만 하더라도 DC 전원을 이용해 외부 전력을 다수 소모한다. 크고 비싸다는 문제도 있다.

전문가들은 MCU에 활용하는 ML 기술은 서버나 게이트웨이와는 전혀 다른 방식으로 구동돼야한다고 지적한다. MCU는 mW만의 전력을 소비한다. 동전 전지나 몇 개의 태양 전지로도 전력을 공급할 때도 있다.

대표적인 예가 'TinyML'이다. TinyML의 목표는 소량의 자원 제약이 있는 저전력 장치, 특히 MCU에서 추론을 수행하며, 궁극적으로 딥러닝을 구동하는 것이다. 이를 위해서는 비교적 적은 량의 처리, 저장, 대역폭 자원을 수용할 수 있도록 신경망 모델의 크기를 줄여야 한다.

EE타임스는 MCU에서 수행되는 ML이 결과적으로는 전체적인 자원의 소비를 줄일 수 있다고 설명했다. 엣지에서 센서 데이터를 수집하고 분석 후 클라우드로 전송되는 가운데, 상당량의 분석이 수행되었기 때문에 전송되는 데이터가 훨씬 줄어든다는 것이다.

TinyML을 유용하게 쓸 수 있는 대표적인 애플리케이션으로는 고해상도로 영상을 촬영하는 '객체 감지시스템'이 있다. 객체 감지시스템은 정확한 인식을 위해 고해상 영상을 촬영하지만, 저장 공간이 제한됐으며, 개인정보보호를 위해 인물 이미지 해상도를 다시 줄여야 한다.

만약 서버에서 AI 기능이 이뤄지려면 고해상도 파일을 직접 서버까지 전달해야하는 통신 자원의 문제와 개인의 정보가 그대로 서버로 이동해 악용될 여지가 있는 개인정보보호의 문제가 발생한다.

TinyML로 카메라에서 직접 분석을 진행하면, 관심 대상만 캡처하고, 고해상으로 분석 뒤, 필요한 정보만 유지할 수 있다. 아직은 게이트웨이나 워크스테이션급 PC 등 고성능 프로세서 장치에서 이뤄지지만, TinyML 기술이 발전하면 MCU에서 직접 실행가능하다.

[관련기사] 2025년이면 엣지 AI 수요가 클라우드 AI 추월?

[관련기사] 美 ETA 컴퓨트, 엣지 AI 개발 위한 솔루션 발표

키워드 관련기사
  • 자일링스 AI칩, 스바루 ADAS 솔루션으로 채택
  • 엔비디아, 온라인 GPU 행사서 AI·데이터사이언스 등 최신 기술 소개
  • 美 블레이즈, 엣지 AI 틈새시장 공략 추진