유튜브가 팟캐스터와 크리에이터를 위한 다양한 인공지능(AI) 기능을 공개했다. 이번 업데이트는 쇼츠(Shorts)와 팟캐스트, 유튜브 스튜디오 전반에 걸쳐 적용, 유튜브를 동영상 제작과 유통을 핵심 플랫폼을 굳히겠다는 의도다.
유튜브는 16일(현지시간) 뉴욕에서 열린 ‘메이드 온 유튜브(Made on YouTube)’ 라이브 행사에서 쇼츠 제작을 위해 구글의 동영상 모델 ‘비오 3(비오 3)’를 커스터마이징한 ‘비오 3 패스트(Fast)’를 도입한다고 밝혔다.
현재 미국, 영국, 캐나다, 호주, 뉴질랜드에서 먼저 적용되며, 앞으로 더 많은 지역으로 확대될 예정이다.
비오 3 패스트는 480p 해상도에서 낮은 지연 시간으로 영상을 생성할 수 있어 휴대폰에서도 클립 제작이 쉬우며, 처음으로 오디오 생성 기능도 제공된다.
비오를 활용하면 영상 속 움직임을 이미지에 적용할 수 있다. 예를 들어, 정지된 사진 속 인물을 다른 영상의 춤 동작과 연동해 애니메이션처럼 움직이게 만들 수 있다.
또 팝아트나 종이접기 스타일 등 다양한 스타일 적용이 가능하며, 텍스트 설명을 통해 캐릭터나 소품 등 객체 추가를 할 수 있다. 이런 기능은 몇달간 차례로 공개될 예정이다.
또 새로운 ‘스피치-노래(Speech to Song)’ 리믹스 도구를 사용하면, 대상 영상의 대사를 쇼츠용 음악 트랙으로 변환할 수 있다. 유튜브 쇼츠 및 생성 AI 담당 디렉터 디나 베라다는 블로그를 통해 “짧은 대사 하나가 아이디어를 떠올리게 한다면, 새롭고 독창적인 사운드로 리믹스할 수 있다”라고 설명했다.
이 기능은 구글의 AI 음악 모델 '라이리아 2(Lyria 2)'를 활용하며, 크리에이터는 ‘차분함’ ‘댄스풍’ ‘유쾌함’ 등 원하는 분위기를 추가할 수 있다. 미국 일부 크리에이터 대상으로 테스트가 진행되며, 확대될 예정이다.
또 ‘AI 에디트(Edit with AI)’ 기능이 도입된다. 촬영한 원본 영상을 자동으로 분석해 최적의 장면을 배열, 음악과 전환 효과를 추가하고, 영어와 힌디어로 상황에 맞는 보이스오버까지 생성해 쇼츠 초안 제작을 지원한다. 현재 쇼츠와 유튜브 크리에이트 앱에서 실험 중이며, 앞으로 일부 시장에서 기능 확대가 예정돼 있다.
이 외에도 유튜브는 앞으로 수개월 내 미국 내 영상 팟캐스터가 AI 추천을 통해 손쉽게 클립을 제작할 수 있도록 지원하고, 내년 초에는 이를 쇼츠로 자동 변환할 수 있는 기능을 도입한다. 팟캐스트 하이라이트 영상을 제작해 소셜 미디어에 공유할 수 있는 기능도 추가한다.
내년부터는 오디오 전용 팟캐스터를 위해 AI가 맞춤형 영상을 생성해 주는 기능도 선보인다. 이 기능은 초기에는 일부 파트너에게만 제공되고, 2026년부터 확대 적용될 예정이다.
유튜브 스튜디오에도 AI 기반 기능이 대거 추가된다. 새롭게 도입되는 AI 챗봇 ‘애스크 스튜디오(Ask Studio)’는 채널 운영, 영상 성과 분석, 시청자 반응 등 다양한 정보를 실시간으로 보여줘 크리에이터의 효율을 높인다.
또 '영감 탭(Inspiration tab)'이 업그레이드돼, 맞춤형 주제 제안과 함께 최대 9가지 아이디어 응답을 제공하고 각 제안의 이유를 설명하는 기능이 추가된다. 영상 제작 과정에서 중요한 제목과 썸네일 A/B 테스트도 확장돼, 최대 3가지 버전을 동시에 비교할 수 있다.
콘텐츠 보호 기능도 강화된다. 얼굴 유사성 감지 기능을 통해 무단 도용된 영상이나 이미지를 탐지하고 삭제 요청이 가능하며, 모든 파트너 프로그램 크리에이터에게 오픈 베타로 제공된다.
새로운 협업 영상 기능을 통해서는 최대 5명이 하나의 영상 제작에 공동으로 참여할 수 있어 팀 단위 제작 환경을 지원한다.
마지막으로, 자동 더빙 기능도 개선돼 기존 20개 언어 지원과 동시에 실제 발음과 입 모양을 일치시키는 립 싱크 가능으로 자연스러운 번역 영상을 제공한다.
유튜브에 따르면 2025년 7월 기준, 전 세계 사용자는 매일 1억시간 이상을 팟캐스트 소비하고 있다.
한편, 유튜브는 최근 구글의 최신 AI 기술을 총동원, 사용자 및 크레이잍처 지원에 나섰다. 지난 10일에는 크리에이터들이 한국어를 비롯한 여러 언어의 더빙을 추가할 수 있는 ‘다국어 오디오(Multi-language Audio)’ 기능을 출시했고, 9일에는 비오 3에 세로형 영상 생성 기능을 추가해 쇼츠 제작을 지원할 수 있게 했다.
박찬 기자 cpark@aitimes.com
