인공지능(AI) 서비스 전문 이스트소프트(대표 정상원)는 AI 휴먼 영상 제작 및 오토 더빙 서비스 페르소닷에이아이(PERSO.ai)에 다화자 보이스 클로닝과 스크립트 편집 기능 추가와 함께, 팀 요금제를 새롭게 출시했다고 17일 밝혔다.
다화자 보이스 클로닝은 영상 속 화자의 음성을 인식하고 복제하는 기능을 기존의 1명에서 10명까지 확대한 것이다. 이에 따라 여러 인물이 등장하는 까다로운 인터뷰나 토론 영상 번역도 자연스럽고 일관된 결과물을 얻을 수 있게 됐다는 설명이다.
여기에 한국어 특성 AI 모델을 적용해 한국어 음성 인식 정확도를 높였다. 또 입술 움직임 패턴을 분석해서 정확한 입모양을 생성해내는 립싱크 기술도 대폭 개선했다고 전했다.
정의정 이스트소프트 AI 엔진 플랫폼 실장은 "2인 이상의 대화에서도 화자를 정확히 구분하고, 각자의 음색과 어투를 자연스럽게 유지하는 것이 이번 기술 고도화에 핵심"이라며 "헤이젠, 신세시아 등 글로벌 경쟁사와 차별화된 기술적 강점을 갖추게 됐다”라고 설명했다.
글로벌 서비스에 비해 경쟁력있게 가격을 조정했으며, 팀 담위의 협업 환경도 개선했다. 이스트소프트는 ▲팀 단위 협업을 위한 ‘팀 플랜’ ▲멤버 초대 및 권환 관리 시스템 ▲크레딧 공유 메커니즘 ▲협업 워크플로우 등 팀 요금제를 출시하고 정책과 기능을 추가했다.
김생근 이스트소프트 PERSO SaaS 센터장은 "현재 3000만 구독자를 보유한 50개 이상의 파트너 채널과 협력 중이며, 올해 상반기 중 이를 500개 채널, 총 1억 구독자 규모로 확대할 계획”이라고 말했다.
박수빈 기자 sbin08@aitimes.com
