네이버랩스(대표 석상옥)는 이미지 3D 재구성' 기술로 '2024 유럽컴퓨터비전학회(ECCV)' 두 부문에서 1위를 차지했다고 8일 밝혔다.
네이버랩스는 2017년 별도 법인으로 출범, 2019년 인수한 네이버랩스유럽을 통해 비전 기술을 축적해 왔다.
ECCV는 이미지 및 영상 등 컴퓨터 비전 분야에 특화한 최신 AI 연구 성과를 발표하는 학회다. 네이버랩스는 올해 행사에서 ▲맵-프리 비주얼 리로컬라이제이션(Map-free visual re-localization) ▲BOP(Benchmark for 6D Object Pose Estimation) 챌린지 두 부문에 도전, 모두 1위를 차지했다.
맵-프리 로컬라이제이션 챌린지는 정밀 지도가 없는 상황에서도 얼마나 정확하게 측위가 가능한지를 겨루는 것이다. 비주얼 로컬라이제이션(측위)은 일반적으로 사전에 생성된 3D및 HD 지도를 기반으로 측위을 수행한다. 그러나, 재난 또는 공사 현장 등 지도를 생성하거나 미리 준비할 수 없는 상황도 있기때문에 지도 없이 측위하는 기술의 중요성이 높아지고 있다는 설명이다.
네이버랩스는 이미지를 3D로 재구성하는 AI 기술 도구 ‘마스터(MASt3R)’를 선보였다. 마스터는 정밀 지도가 없는 상황에서도 정확한 측위가 가능하다는 점을 인정 받아, 구글과 애플, 메타 등 12개 참가팀 중 1위를 차지했다. 마스터는 네이버랩스유럽이 개발한 3D 비전 파운데이션 모델(VFM) ‘크로코(CroCo)’를 기반으로 만든 '더스터(DUSt3R)'의 업그레이드 버전이다.
BOP 챌린지에서도 1위를 차지했다. 이미지 내에 있는 물체들의 3차원 회전과 위치를 얼마나 정확히 추정하는지 겨루는 방식이다. 네이버랩스는 RGB 이미지만으로도 물체의 위치를 측위하고 빠르게 처리할 수 있다는 평가를 받으며 1위를 차지했다.
이번 BOP 챌린지 1위는 지난해에 이어 두번째다. 3D 비전 파운데이션 모델 CroCo를 기반으로 제작한 결과물이다.
석상옥 네이버랩스 대표는 “인공지능(AI)에 이어 새로운 미래 변화를 만들어 낼 비전 지능은 핵심 경쟁력 그 자체”라며 “로봇, 자율주행, 디지털 트윈은 물론 이를 지원하는 클라우드 인프라, 1784와 같은 핵심 테스트베드, 나아가 중동 등 새로운 글로벌 이정표로도 확장할 수 있도록 연구 개발에 더욱 집중하겠다”라고 말했다.
한편, 네이버클라우드 역시 이번 ECCV에서 11편의 AI 연구 논문이 게재 승인되는 성과를 거뒀다고 밝혔다. 네이버는 비전 AI 기술을 바탕으로 생성 AI 서비스를 고도화하는 데 속도를 내겠다고 전했다.
장세민 기자 semim99@aitimes.com
