음성 인공지능(AI) 스타트업 일레븐랩스가 다양한 콘텐츠를 활용해 팟캐스트를 생성할 수 있는 새로운 기능을 공개했다. 이 기능은 구글의 '노트북LM(NotebookLM)'과 유사한 방식으로 작동한다.
일레븐랩스는 27일(현지시간) 유튜브 동영상이나 텍스트, 문서 등 업로드된 콘텐츠를 기반으로 팟캐스트를 생성하는 ‘젠FM(GenFM)’ 기능을 출시했다고 발표했다.
젠FM은 일레븐랩스의 iOS 앱인 '일레븐랩스 리더(ElevenLabs Reader)'를 통해 사용할 수 있다.
현재 한국어를 비롯해 영어, 힌디어, 포르투갈어, 중국어, 스페인어, 프랑스어, 독일어, 일본어 등 32개 언어를 지원한다.
사용자가 콘텐츠를 업로드하면 앱이 자동으로 두개의 목소리를 선택해 팟캐스트를 제작한다. 앱은 12개 이상의 목소리 선택 옵션을 제공한다.
특히 흥미로운 점은 AI가 팟캐스트를 생성하는 과정에서 “음음”이나 “‘생각하는 듯한 멈춤” 등을 추가한다는 것이다. 기존 음성 도구들이 “음”과 “아” 같은 감탄사를 제거하려는 것과는 대조적으로, 일레븐랩스는 이를 인간적 요소를 보고 의도적으로 포함하고 있다.
잭 맥더모트 일레븐랩스 모바일 성장 책임자는 “우리는 ‘음’ ‘아’ ‘흠’은 물론 웃음과 숨소리 같은 인간적 대화 요소를 얼마나 도입할지 심도 깊게 논의했다”라며 “자연스럽고 인간적인 대화와 실용적인 콘텐츠 제공 사이에서 최적의 균형을 찾는 것이 우리의 목표”라고 밝혔다.
또 “뛰어난 장편 팟캐스트는 중단 없이 자연스럽고 통찰력 있는 대화 흐름을 가진다”라며 “우리는 다양한 목소리와 언어를 통해 이런 경험을 더 쉽게 제공할 것”이라고 설명했다.
일레븐랩스는 앞으로 사용자 정의 옵션과 다양한 소스를 결합, 생성 AI 팟캐스트 제작을 지원하는 기능을 확장할 계획이다.
한편, 구글의 노트북LM을 벤치마킹한 제품은 며칠 전에도 등장했다.
스타트업 플레이AI는 독창적 기능을 갖춘 ‘멀티 턴 스피치’ 모델을 출시하며 경쟁에 합류했다. 이 모델은 PDF, 비디오, 사진, 노래, URL 등을 업로드하면 이를 음성으로 변환한다. 사용자는 입력된 자료를 1대1 팟캐스트, 낭독, 토론, 또는 동화 스타일로 구현할 수 있다.
박찬 기자 cpark@aitimes.com
- '노트북LM'처럼 팟캐스트 만들어주고 동화같이 읽어주는 AI 음성 서비스 등장
- 메타, '노트북라마' 오픈 소스 출시...구글 '노트북LM' 따라하기 나서
- 구글, '노트북LM' 업데이트·기업용 버전 출시...두달 만에 방문자 6.4배 증가
- 구글, '노트북LM'과 흡사한 AI 팟캐스트 기능 테스트
- 데이원컴퍼니, 22일 일레븐랩스 ‘글로벌 해커톤’ 서울 대회 운영
- 스포티파이, 일레븐랩스의 'AI 오디오북' 서비스 추가
- 일레븐랩스, 다국어 정확도 가장 높은 음성-텍스트 모델 '스크라이브 v1' 출시
- 인간 이해 못하는 '로봇 언어'로 소통하는 AI 영상 화제
- 일레븐랩스, 기업용 '대화형 AI 2.0' 출시..."자연스럽고 지능적인 상호작용 가능"
- 일레븐랩스, ‘감정 표현’ 가능한 TTS 모델 ‘일레븐 v3 알파’ 발표
