엔비디아가 음성만으로 자연스러운 표정과 입 모양의 동영상을 생성하는 인공지능(AI) 도구를 공개했다. 사진도 필요없는 방식으로, 3D 아바타 애니메이션 제작 방식에 혁신을 가져왔다는 평이다.
엔비디아는 24일(현지시간) 음성 입력만으로 사실적인 3D 아바타 얼굴 애니메이션을 생성하는 AI 도구 ‘오디오투페이스(Audio2Face)’를 오픈 소스로 공개했다.
이는 '엔비디아 ACE(NVIDIA ACE)' 기술에 포함된다. 이번 조치로 개발자들은 게임이나 애플리케이션 등에 활용할 3D 캐릭터를 자유롭게 제작할 수 있게 됐다.
오디오투페이스는 목소리의 음향적 특징을 분석해 입 모양과 표정에 맞는 애니메이션 데이터를 생성하고 이를 3D 아바타에 매핑한다. 이를 통해 기존의 영상 콘텐츠뿐만 아니라 실시간 라이브 스트리밍에서도 자연스러운 아바타 애니메이션을 구현할 수 있다.
이미 일부 게임 개발사들은 오디오투페이스를 활용해 작품을 선보였다. 대표적으로 팜51(Farm51)은 신작 ‘체르노빌라이트 2: 익스클루전 존’에 이 기술을 적용했으며, ‘에일리언: 로그 인커전 이볼브드 에디션’ 개발팀도 이를 사용했다.
엔비디아는 이번에 오디오투페이스의 모델과 소프트웨어 개발 키트(SDK)뿐만 아니라, 학습 프레임워크까지 공개했다.
"이를 통해 개발자들은 다양한 활용 사례에 맞춰 모델을 직접 조정하고 최적화할 수 있다"라고 강조했다.
박찬 기자 cpark@aitimes.com
관련기사
