ETRI 연구진이 CCTV에서 AI(인공지능)가 객체를 인식하는 기능을 확인하는 모습. (사진 제공=ETRI) ©AI타임스
ETRI 연구진이 CCTV에서 AI(인공지능)가 객체를 인식하는 기능을 확인하는 모습. (사진 제공=ETRI) ©AI타임스

(AI타임스=전승진 기자) 국내 연구진이 시각 인공지능(AI) 기술의 핵심 알고리즘과 전문 기술 없이도 얼굴 사진을 쉽게 편집할 수 있는 기술을 일반에 공개한다. 시각지능 학습에 필요한 이미지 데이터도 함께 공개해 국내 AI 산업 생태계에 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 사물 인식, 행동 추적 등 시각 AI 구현에 필요한 핵심 기술인 백본 네트워크(VoVNet)와 포토샵 없이도 얼굴을 마음대로 편집할 수 있는 기술(SC-FEGAN)을 공개한다고 밝혔다. 아울러 시각 AI 기술을 학습시키는데 필요한 도심환경 사물 560종 대상 사물인식 학습 데이터 20만 장도 공개한다.

이 기술을 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능들을 구현할 수 있어 시각지능의 핵심 기반 기술로 평가받는다. 개발자들은 손쉽게 원하는 서비스나 혁신적인 기능을 구현해 부가가치를 창출할 수 있다.

연구진이 공개하는 또 하나의 핵심 기술은 전문 편집 프로그램 없이도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 기술이다. 이 기술을 활용하면 사진 속 인물이 하고 있지 않던 액세서리를 추가하거나 머리 모양, 표정까지도 바꿀 수 있을 뿐 아니라 낙서 등으로 인해 일부가 훼손되거나 빈 공간이 생겨도 원하는 내용을 간단하게 그려 복원할 수도 있다.

이는 얼굴 사진에 특화돼 다양한 편집이 가능한 알고리즘으로, 딥러닝 기법 중 하나인 갠(GAN) 기술이 사용된다. 인공적으로 데이터를 만들고 이를 판별하면서 진짜 같은 가짜 데이터를 만들어내는데 효과적인 기술이다.

 

쓰레기 투기 장면을 관절 단위로 잡아내는 모습 (사진 제공=ETRI) ©AI타임스
쓰레기 투기 장면을 관절 단위로 잡아내는 모습 (사진 제공=ETRI) ©AI타임스

ETRI는 시각 AI 기술을 학습하는데 꼭 필요한 높은 품질의 데이터도 함께 공개했다. 데이터에는 전봇대, 신호등, 자동차 등 CCTV에 주로 녹화되는 도심 환경에 주로 등장하는 사물들이 들어있다.

연구진은 단순히 임의의 사물로 이뤄진 많은 양의 데이터보다 시각지능 기능 구현 및 학습에 적합한 데이터가 보다 효과적이라고 설명했다. 이미 작년부터 관련 자료를 공개해오면서 현재 누적 공개 데이터 개수는 총 20만 장이다.

ETRI 박종열 시각지능연구실장은 “국내 시각 AI 기술이 급속도로 성장하고 있지만 외국 의존도가 점차 높아지고 있어 관련 기술을 공개해 국내 산·학·연이 보다 경쟁력 있는 기술을 확보하고 생태계 조성을 위해 적극 지원할 예정이다”고 밝혔다.

한편, 연구진은 향후 시각지능 관련 핵심 기반 기술들과 높은 품질의 데이터를 지속적으로 공개하는 한편 얼굴뿐 아니라 냉장고, 가구 등 다른 객체를 대상으로도 쉽게 편집을 할 수 있도록 기술을 고도화할 계획이라고 전했다.

 

 

【에이아이타임스 aitimes 에이아이타임즈】