인공지능(AI) 기반 영상 분석 업체 에스아이에이(SIA, SI Analytics)가 전 세계에 기술력을 입증했다. 컴퓨터 비전 학술대회인 CVPR(국제 컴퓨터 비전 및 패턴인식 학술대회) 2022에서 개최된 챌린지에서 중국팀을 제치며 1위를 기록했다. CVPR은 국제컴퓨터비전학술대회(ICCV), 유럽컴퓨터비전학술대회(ECCV)와 함께 컴퓨터비전 분야 국제 최고 권위의 학술대회로 꼽힌다.
류정원, 윤광진, 서민석 연구원으로 구성된 SIA 연구소팀은 CVPR에서 열린 BMTT(Benchmarking Multi-Target Tracking) 챌린지와 MOT(Multi-Object Tracking) 트랙에서 1위를 기록했다. 최근 AI 분야에서는 가상 데이터만을 활용한 모델 성능 결과를 실제 데이터 기반 모델의 성능만큼 도출할 수 있는지에 대한 연구가 활발히 이뤄지고 있다. 가상 데이터가 실제 데이터만큼 결괏값을 도출한다면 데이터 부족 문제를 극복해 딥러닝 성능을 획기적으로 높일 수 있기 때문이다.
이 트렌드를 반영해 이번 BMTT 챌린지에서는 가상 데이터를 활용한 성능 평가를 시행했다. 보행자들이 촬영된 비디오 데이터에서 3D 렌더링, 게임 등의 가상 데이터를 활용해 보행자들을 추적하는 성능을 얼마나 높일 수 있는지에 대한 가능성을 평가하는 주제로 챌린지가 진행됐다.
SIA 연구소는 이번 챌린지에서 가상 데이터의 다양한 객체 정보를 효과적으로 학습시키기 위해 데이터 증강 방법론을 활용했다. 가상 데이터와 실제 데이터를 병합·혼합해 객체 탐지 성능을 높일 수 있도록 모델을 반복적으로 설계했다.
그 결과 이 방법은 가상 데이터만 학습한 모델 성능 값이 실제 데이터로만 학습시킨 모델 성능 수치와 근접한 결과를 도출했다. 가상 데이터만으로도 높은 다중 객체 추적 성능 달성이 가능함을 증명한 것이다.
류정원 SIA 연구원은 "가상 데이터만으로도 실제 데이터의 성능을 높이기 위한 학습 방법을 도출할 수 있도록 연구 기술을 내재화했다"며 "나아가 현실과 가상의 괴리를 줄이는 연구를 통해 특히 데이터 확보에 많은 제약이 있는 실제 위성 영상 데이터를 사용하지 않고 모델 성능을 높이는 것이 목표"라고 말했다.
SIA는 이번 챌린지에 활용한 알고리즘을 무료로 공개했다. SIA 관계자는 "이번 알고리즘은 가상 데이터를 기반으로 성능 향상을 연구 중인 AI 커뮤니티에 무료로 배포했다"며 "이를 통해 가상 데이터 미래에 많은 기업이 한 발 더 다가서고 AI 공유 문화가 발전하길 바란다"고 희망했다.
한편 이번 챌린지에서 2위는 중국의 AI 회사 센스타임(SenseTime)과 베이징 대학 연구진으로 구성된 팀이 차지했다. SIA 관계자는 "중국의 2위 팀과 근소한 차이로 가상 데이터와 현실 데이터간 도메인 갭을 효과적으로 줄여 높은 결괏값을 얻을 수 있었다"고 밝혔다.
CVPR은 전기전자기술자협회(IEEE)와 국제컴퓨터비전재단(CVF)이 1983년부터 공동으로 주최하는 학술대회다. AI 분야 가장 영향력이 큰 국제학술대회로 꼽힌다.
AI타임스 김동원 기자 goodtuna@aitimes.com
