‘음악판 소라(Sora)’로 평가되는 스타트업 수노가 1억250만달러 규모의 자금을 조달했다. 음악 생성 인공지능(AI) 기업으로는 이례적으로 큰 투자 규모로, 이 회사는 물론 음악 생성 AI 시장의 잠재력을 대변한다는 평가다.
벤처비트는 21일(현지시간) 텍스트 음악 생성 인공지능(AI) 'V3'를 개발한 수노가 1억250만달러(약 1400억원)를 모금했다고 보도했다.
이번 투자에는 라이트스피드 벤처 파트너스, 냇 피리드먼, 다니엘 크로스, 매트릭스 파운더 콜렉티브가 참여했다.
특히 벤처비트는 "이번 투자 규모는 수노의 기술에 대한 단순한 신뢰의 결과가 아니라, 음악 영역에서 AI의 변혁적 힘에 대한 믿음의 선언"이라고 평가했다. 그만큼 음악 생성 AI가 대세라는 설명이다.
믹키 슐만 하버드대학교 박사가 설립한 수노는 음악적 지식이 없는 사용자도 텍스트 입력 만으로 몇초 만에 연주와 보컬을 모두 포함하는 완전한 노래를 생성하는 AI ‘V3’를 공개했다. 몇초 만에 싱글 차트 40위 안에 들어갈만한 수준의 완전한 곡을 생성할 수 있다는 주장했다.
수노는 대형언어모델(LLM)과 똑같이 큰 방식으로 수백만 곡의 스타일과 구조를 학습, 다음 토큰을 예측하는 방식을 사용한다고 밝혔다. 그러나 오디오, 특히 음악은 단어처럼 분리된 것이 아닌 연속 신호이기 때문에 언어보다 더 복잡하다.
고품질 오디오의 샘플링 속도는 일반적으로 44킬로헤르츠(khz)나 48khz다. 이는 초당 4만8000개의 토큰을 의미한다. 이를 위해 V3는 샘플링 속도를 합리적인 수준으로 낮추고, 다음 오디오 토큰을 예측하는 모델을 기반으로 한다.
기능도 다양하다. 단순한 텍스트 입력만으로 음악을 들을 수 있을 뿐만 아니라, 선택한 언어로 노래를 불러줄 수도 있다.
또 노래에 필요한 내용을 지정해 텍스트를 통해 모든 세부 사항을 추가할 수 있다. 마음에 들지 않는 부분이 있으면 변경을 요청할 수 있다.
사용자는 ‘사용자 정의 모드’를 통해 자신만의 가사를 쓰고, 제목을 선택하고, 음악 스타일을 지정할 수 있다. 재생 화면에서 오디오 또는 비디오 형식으로 노래를 공유하거나 다운로드할 수 있으며, 생성된 데이터를 기반으로 요소를 수정하여 노래를 리믹스할 수도 있다.
믹키 슐만 수노 AI 공동 창립자는 “우리의 사명은 누구나 음악 창작을 가능하게 하고 모든 사람의 음악적 창의성을 발휘하도록 하는 것”이라며 “이번 새로운 투자를 통해 우리는 AI 기술 개발을 가속화, 전 세계 10억명의 사람들이 음악을 통해 자신을 표현할 수 있도록 할 것”이라고 말했다.
라이트스피드 벤처 파트너스는 수노가 지난해 출시된 이후로 이미 1000만명 이상의 사람들이 플랫폼에서 음악을 만드는 등 인상적인 성과를 기록했다고 밝혔다.
수노는 또 마이크로소프트(MS)와도 파트너십을 맺고 MS 코파일럿에 V3를 직접 통합했다.
박찬 기자 cpark@aitimes.com
- 소라만큼 뜨거운 음악 생성 AI 수노..."AI가 만든 노래는 비현실적" 지적
- 수노, 음악 생성 AI 'V3' 출시...'음악판 소라' 평가 등장
- "누구나 팝송 만들어 발표 가능"...MS, '코파일럿'에 음악 생성 AI 탑재
- 글로벌 3대 음반사, 생성 AI 음악 업체 수노·유디오에 대규모 저작권 소송
- 유튜브, 음반사와 AI 데이터 구매 논의..."새로운 음악 생성 AI 출시 준비"
- 수노, iOS 앱 출시..."음악 생성 AI의 중요한 분수령"
- 블룸버그, 2024년 주목할 AI 스타트업 10곳 선정..."음악 생성 AI 수노 포함"
- 수노, 음반사 상대로 맞고소..."음악 업계, 밥그릇 지키려고 일반인의 음악 생성 방해"
