자칭 '소라 라이벌'인 중국 스타트업 센슈AI가 비디오 생성 인공지능(AI)을 글로벌 출시했다. 이 모델은 최근 추세에 맞춰 30초 만에 4초짜리 클립을 만들어내는 모델로, 이처럼 소라에 앞서 경쟁사들이 잇달아 정식 서비스를 시작하고 있다.

사우스차이나모닝포스트는 최근 센슈가 중국어와 영어를 모두 지원하는 비디오 생성 AI '비두(Vidu)'의 글로벌 서비스를 시작했다고 보도했다.

이 모델은 4초와 8초 클립 두가지를 생성한다. 현재 공식 홈페이지를 통해 사용할 수 있다. 구글 아이디나 이메일, 전화번호 등으로 가입할 수 있다.

센슈는 최근 소라를 겨냥해 치열한 추격전을 펼치는 중국 스타트업 중 가장 먼저 제품을 공개한 곳이다. 소라가 등장한 지 2개월 뒤인 지난 4월 중관춘 포럼에서 비두를 처음 공개했다. 

당시 센슈 측은 확산(Diffusion) 모델과 트랜스포머 아키텍처를 통합한 '유니버셜 비전 트랜스포머(U-ViT)'라는 시각 변환 모델 아키텍처를 기반으로 한다고 설명하며, 이는 소라와 매우 흡사한 방식이라고 설명했다.

이번에는 텍스트-비디오 기능에 '캐릭터-비디오' 기능을 추가했다. 사람 이미지나 애니메이션 캐릭터 이미지를 업로드하고 간단한 텍스트 프롬프트로 영상을 생성하는 방식이다.

센슈 측은 "앞으로는 사용자가 여러 캐릭터를 업로드하고 장면을 설명하는 방식으로, 영화를 제작하는 방식과 비슷하게 영상을 만들어내길 기대한다"라며 "우리의 목표는 AI 도구를 기존 분야와 통합하는 것"이라고 밝혔다.

이 회사는 바이두와 알리바바 등으로부터 이미 수천만달러를 투자받은 바 있다. 

한편, 이에 앞서 지난달 말에는 중국에서 가장 뛰어난 퀄리티를 자랑하는 콰이쇼우의 '클링'이 유료 버전으로 확대됐으며, 며칠 뒤에는 스타트업 지푸 AI도 30초 만에 6초짜리 영상을 생성하는 '잉' 모델을 웹사이트와 앱으로 출시했다.

이달 1일에는 런웨이가 11초 만에 10초 영상 만들어 주는 '젠-3 알파 터보'를 소수 테스트 대상으로 내놓으며 이르면 이번 주 유료 사용자에게 출시할 것으로 예고했다.

임대준 기자 ydj@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지