기존 영상 '편집' 넘어 '창조' 수준
워터마크 'AI 생성' 표시...공개방법·시기는 발표 안 해

텍스트 프롬프트 ‘하늘을 나는 빨간 망토와 슈퍼 히어로 복장을 한 개’에서 생성된 비디오(사진=메타)
텍스트 프롬프트 ‘하늘을 나는 빨간 망토와 슈퍼 히어로 복장을 한 개’에서 생성된 비디오(사진=메타)

메타가 텍스트 또는 이미지 프롬프트에서 새로운 비디오 콘텐츠를 생성할 수 있는 AI 기반 비디오 생성기 ‘메이커비디오(Make-A-Video)’를 29일(현지시간) 블로그에 공개했다.

메타는 '폭우 속을 걷는 젊은 부부'와 '인물을 그리는 테디베어'와 같은 텍스트 프롬프트에서 생성된 예제 비디오를 선보였다. 또 AI 모델을 통해 처리된 거북이가 수영하는 영상과 같이 소스 이미지를 가져와 애니메이션으로 만드는 기능도 소개했다.

텍스트 프롬프트 "폭우 속을 걷는 젊은 부부"에서 생성한 비디오(사진=메타)
텍스트 프롬프트 "폭우 속을 걷는 젊은 부부"에서 생성한 비디오(사진=메타)
텍스트 프롬프트 "인물을 그리는 테디베어"에서 생성한 비디오(사진=메타)
텍스트 프롬프트 "인물을 그리는 테디베어"에서 생성한 비디오(사진=메타)
바다 거북 이미지에서 생성한 비디오(사진=메타)
바다 거북 이미지에서 생성한 비디오(사진=메타)

런웨이 등 이미 공개된 AI 비디오 생성기는 기존에 존재하는 이미지를 가져다 동영상으로 '편집'하는 정도였다면, 메타의 메이커비디오는 존재하지 않던 이미지를 만들어 영상으로 '창조'하는 수준이다.

마크 저커버그 메타 CEO도 "영상을 제작하는 것은 각 픽셀을 올바르게 생성하는 것에서 나아가 시간이 지남에 따라 픽셀이 어떻게 변할지 예측해야 한다"며 "당연히 사진보다 비디오를 생성하는 것이 훨씬 어려우며, 기존 이미지 생성기는 이에 비하면 애들 장난수준"이고 말했다.

메타는 달리(DALL-E)와 같은 텍스트-이미지 AI 모델을 사용해 단어와 이미지 사이의 연관성을 파악하고 추가로 레이블이 지정되지 않은 비디오 훈련 데이터를 적용해 메이커비디오 모델이 텍스트 또는 이미지 프롬프트가 시간과 공간에서 어디에 존재하는지 학습하도록 했다. 이어 현 이미지 다음에 올 이미지를 예측해 짧은 시간 동안 움직이는 장면을 표시했다.

메타는 사진 생성처럼 비디오 생성이 악용될 수 있다는 점을 인정했다. 따라서 메이커비디오의 모든 AI 생성 비디오 콘텐츠에 해당 비디오가 AI로 생성되었으며 실제 비디오가 아님을 알 수 있도록 워터마크를 포함한다고 밝혔다.

한편 메타는 메이커비디오를 대중에게 공개하는 방법과 시기는 발표하지 않았다.

박찬 위원 cpark@aitimes.com

키워드 관련기사
  • '동영상 만들어주는 AI' 나왔다
  • 메타, 가상기술 스타트업 잇달아 흡수
  • 메타, AI 이미지 생성 도구 ‘Make-A-Scene’ 공개