어도비가 인공지능(AI) 영상 제작 도구에 음향 효과를 강화, 이 분야 선두인 구글의 '비오 3(Veo 3)' 추격에 나섰다.
어도비는 17일(현지시간) AI 영상 제작 도구 ‘파이어플라이(Firefly)’에 사용자 음성을 기반으로 한 맞춤형 음향 효과 생성 등 새로운 기능을 대거 추가했다고 발표했다.
이번 업데이트의 핵심은 ‘음향 효과 생성(Generate Sound Effects)’ 기능이다. 현재 베타 버전으로 파이어플라이 앱에서 제공되며, 사용자가 의성어와 텍스트 설명을 입력하면, AI가 이를 사운드 효과로 만들어 낸다.
예를 들어, 말이 길을 걷는 영상에 맞춰 사용자가 “또각 또각(clip clop)”이라는 소리를 녹음하고 텍스트로 “콘크리트 위 말 발굽 소리”를 입력하면, AI가 이를 인식해 4가지 음향 옵션을 제시하는 식이다.
이 기능은 비오 3보다 정밀한 오디오 편집 조작이 가능하며, 영상 타임라인과 연동돼 효과를 세밀하게 조절할 수 있다.
어도비가 지난해 10월 ‘맥스’ 행사에서 선보인 실험 프로젝트 ‘슈퍼소닉(Project Super Sonic)’을 기반으로 한다. 대사 생성에는 활용되지 않지만, 발자국이나 지퍼, 부러지는 나뭇가지 소리 등 충격음이나 자연·도시 배경음과 같은 분위기 사운드를 생성하는 데 유용하다.
영상 생성 기능도 강화됐다. ‘구성 참조(Composition Reference)’를 통해 텍스트 프롬프트와 참조 영상을 업로드하면 유사한 장면을 생성할 수 있어, 반복적인 프롬프트 입력 없이도 원하는 결과를 쉽게 얻을 수 있다.
또 ‘키프레임 자르기(Keyframe Cropping)’ 기능을 통해 처음과 마지막 프레임을 이미지로 제공하면, 파이어플라이가 그 사이 영상을 생성하는 방식도 지원된다.
이 밖에도 ▲애니메이션, 벡터 아트, 클레이메이션 등 다양한 스타일을 간편하게 선택할 수 있는 ‘스타일 프리셋(Style Presets)’ ▲클릭 몇번으로 스크립트를 아바타 중심의 영상으로 변환하는 ‘텍스트-아바타(Test-to-Avatar)’ ▲사용자 원래 입력에 문구를 추가해, 파이어플라이가 창작 의도를 더 잘 이해하도록 도와주는 ‘프롬프트 향상(Enhance Prompt)’ 등의 기능이 도입됐다.
박찬 기자 cpark@aitimes.com
