중국의 텐센트가 새로운 이미지-동영상 생성 인공지능(AI) 모델을 오픈 소스로 출시했다. 이는 며칠 전 알리바바의 모델 출시에 이은 것으로, 오픈AI의 '소라'가 등장한 지 1년 만에 동영상 분야에서도 중국이 미국을 위협하는 분위기다.
텐센트는 7일(현지시간) 깃허브를 통해 ‘훈위안비디오-I2V(HunyuanVideo-I2V)’ 모델을 공개했다.
이 모델은 텍스트는 물론, 참조 이미지를 프롬프트로 입력해 동영상을 생성할 수 있다. 특히 단순히 정적인 이미지를 애니메이션화하는 것에 그치지 않고, 이를 놀라운 시간적 일관성과 맥락적 인식을 갖춘 풍부하고 동적인 비디오로 변환한다고 강조했다.
지난해 12월 출시한 오픈 소스 ‘훈위안비디오’ 모델을 기반으로 한다. 훈위안비디오는 매개변수가 130억개 이상으로, 오픈 소스 비디오 모델 중 가장 크다고 주장했다.
이번에 출시된 I2V 모델은 720픽셀 해상도의 최대 129프레임, 약 5초 분량 비디오 클립으로 변환할 수 있게 해준다. 입 모양에 맞춘 음성이나 배경 음향 효과도 추가할 수 있다.
이에 앞서 지난달 26일에는 알리바바가 비디오 생성 기반 모델인 '통이 완샹(Tongyi Wanxiang)'의 최신 버전인 ‘완2.1(Wan2.1)' 시리즈를 오픈 소스로 공개했다. 이 모델은 비디오 생성 벤치마크 테스트인 'V벤치' 리더보드에서 가장 높은 순위를 기록했으며, 상위 5개 모델 중 유일한 오픈 소스 모델로 자리 잡았다.
이 밖에도 중국에는 경쟁력 있는 비디오 생성 AI가 눈에 띄게 늘어났다. 여기에는 사진과 음성 클립을 비디오로 변환하는 바이트댄스의 ‘옴니휴먼-1(OmniHuman-1)’과 '클링'으로 세계적인 화제가 된 콰이쇼우 등이 포함된다.
지난해 2월 오픈AI의 소라가 공개되자, 중국은 미국에 AI 기술이 크게 뒤졌다고 자성하며 정부까지 나서서 동영상 생성 AI 개발을 독려했다. 그 결과, 1년 만에 주목할 만한 모델을 잇달아 출시했고, 특히 오픈 소스 분야에서는 미국을 크게 앞질렀다.
이에 대해 사우스차이나모닝포스트는 "중국에서는 오픈 소스 출시가 늘어나는 것은 부분적으로 딥시크가 획기적인 성과를 거둔 것에 영향을 받은 결과"라고 분석했다.
박찬 기자 cpark@aitimes.com
- 알리바바, 비디오 생성 AI 모델 오픈 소스 출시…추론 모델 ‘QwQ-맥스’도 공개
- 북경대-콰이쇼우, 동영상 생성 모델 출시..."오픈 소스지만 매력적"
- 알리바바, '큐원 2.5' 제품군 100개 이상 출시..."LLM부터 온디바이스까지 포함"
- "중국의 갑작스러운 오픈 소스 러시는 미국 방해하려는 의도"
- 텐센트, 강화학습으로 업그레이드된 추론 모델 '훈위안 T1' 출시
- 중국 동영상 AI 강자 콰이쇼우, '클링' 2.0 업데이트..."비디오 입력도 가능"
- 텐센트, '듀얼 모드 추론' 지원하는 MoE 모델 ‘훈위안-A13B’ 오픈 소스 출시
