사티아 나델라 MS CEO(가운데)가 가우디오랩에 방문하고 있다. (사진=가우디오랩)
사티아 나델라 MS CEO(가운데)가 가우디오랩에 방문하고 있다. (사진=가우디오랩)

지난주 'CES 2004'에서 사티아 나델라 마이크로소프트(MS) CEO의 부스 방문으로 화제가 됐던 가우디오랩이 CES 혁신상 수상작을 조만간 일반에 서비스하겠다고 밝혔다.

인공지능(AI) 오디오 전문 가우디오랩(대표 오현오)은 CES에서 공개한 '저스트 보이스(Just Voice)'를 1분기 안으로 출시한다고 18일 전했다.

저스트 보이스는 이번 CES 혁신상을 수상한 제품으로, AI 음원 분리 기술을 활용해 실시간으로 잡음 및 소음을 제거, 깔끔하고 또렷한 목소리를 들려주는 사운드 솔루션이다. 콘텐츠 감상 시 특정 음성 강화 기능도 포함한 ‘통합형 솔루션’이다. 각종 스트리밍 서비스, OTT 서비스, 화상회의 등 현실과 웹을 오가는 사용자 경험(UX)에서 불편한 소리를 개선하기 위해 개발했다. 

저연산 및 초저지연 AI 프로세싱으로 다양한 디바이스와 플랫폼에 쉽게 탑재 및 작동이 가능하다. 개발 완성 단계로 출시를 앞두고 있어, 올 1분기 내 일반 사용자를 위한 애플리케이션 형태로 공개한다고 밝혔다.

가우디오랩 CES 부스 (사진=가우디오랩)
가우디오랩 CES 부스 (사진=가우디오랩)

한편 CES 기간 중 부스를 찾은 나델라 MS CEO는 가우디오랩의 대표 솔루션 중 하나인 소리 생성 AI '폴리(FALL-E)'에 관심을 보인 것으로 알려졌다.

그는 폴리가 제작한 사운드를 듣고서는 "이제 진짜 AI가 생성한 소리냐"라며 흥미를 보인 것으로 알려졌다. 또 이미지 생성 AI인 '달리'에서 폴리라는 이름을 따온 것도 재미있다는 반응을 보였다.

폴리는 텍스트와 이미지를 입력, 게임 등 가상세계뿐 아니라 영화나 드라마 등 소리가 필요한 모든 장면에 현실과 똑같은 소리를 생성하는 기술이다. 이를 통해 누구나 원하는 사운드를 쉽게 만들 수 있는 미래를 실현하겠다는 것이 이 회사의 비전이다.

특히 ‘소리’ 생성 관련 기술이 본격 떠오른 지난해에는 경쟁사와의 벤치마킹 테스트를 자체적으로 진행, 폴리가 가장 적은 모델로 빠른 시간에 고품질의 소리를 생성한다는 사실을 입증했다.

가우디오랩 내부 벤치마킹 테스트 결과 (사진=가우디오랩)
가우디오랩 내부 벤치마킹 테스트 결과 (사진=가우디오랩)

앞으로는 이미지를 넘어 영상으로부터 효과음을 생성, 모든 미디어의 사운드 작업 효율성을 극대화할 것이라고 밝혔다. 

가우디오랩 관계자는 “이 기술을 완성하면 영화 사운드 제작에서 30~80%를 차지하는 효과음 제작 시간을 크게 단축할 수 있을 것”이라며 “게임 및 메타버스 등 전문 분야에서 활용할 수 있으며 유튜브나 쇼츠 등 사운드 비전문가에 해당하는 일반 사용자들도 빠르게 고품질 사운드 작업을 수행하게 될 것”이라고 말했다. 

가우디오랩 팀 사진 (사진=가우디오랩)
가우디오랩 팀 사진 (사진=가우디오랩)

이번 CES 참가에 대해서는 “혁신의 허브 유레카 파크에서 가우디오랩 비밀 연구실을 살짝 공개했던 셈”이라며 “특히 생성 AI 붐이 일기 전부터 폴리 프로젝트에 착수, 큰 관심을 받게 돼 기쁜 마음”이라고 소감을 전했다. 

한편 가우디오랩은 정부의 R&D 지원으로 빠른 기술 혁신을 이룰 수 있었다고 밝혔다. 폴리도 한국콘텐츠진흥원의 지원을 받아 문화기술 연구개발 과제로 수행한 결과다. 지능정보산업협회 주최 ‘AI 코리아 대상’에서 AI 혁신상(지능정보산업협회 협회장상)도 수상한 바 있다.

저스트보이스의 핵심 기술인 음원 분리 기술도 과학기술정보통신부 정보통신기획평가원의 지원을 받아 인공지능 융합 선도 프로젝트 과제로 수행, ‘IITP R&D 기술개발 우수연구자’를 수상하기도 했다.

장세민 기자 semim99@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지