구글이 아마존의 새로운 동영상 및 이미지 모델 출시에 한발 앞서 같은 모델군을 기업용으로 내놓았다. 벌써 기업 시장을 두고 치열한 경쟁이 시작됐다.
구글 클라우드는 3일(현지시간) 비디오 및 이미지 생성 모델인 '비오(Veo)'와 '이매진 3(Imagen 3)'를 버텍스 AI(Vertex AI)에 도입했다고 보도했다. 버텍스 AI는 기업 사용자가 AI 모델을 훈련 및 배포하고, 대형언어모델(LLM)을 활용한 AI 애플리케이션 개발을 지원하는 관리형 플랫폼이다.
현재 비오 모델은 비공개 프리뷰 단계지만, 이매진 3는 다음 주부터 모든 버텍스 AI 사용자에게 정식 제공될 예정이다.
비오 모델은 지난 5월 구글 I/O 개발자 컨퍼런스에서 처음 공개됐으며, 딥마인드가 런웨이의 '젠-3(Gen-3)'나 오픈AI의 '소라(Sora)' 같은 경쟁 제품에 대응하기 위해 개발한 비디오 생성 솔루션이다.
이 모델은 텍스트나 이미지 프롬프트를 기반으로 다양한 시각적 스타일의 고품질 1080p 비디오를 초당 24~30프레임으로 제작하며, 최대 60초 이상의 고해상도 비디오를 생성할 수 있다. 특히 프레임 일관성을 유지해 피사체의 움직임이 자연스럽게 이어지는 점이 특징이다.
또 기업 고객을 위해 모델을 강화하고 개선했다고 밝혔다. 그중 16대 9 가로는 물론 9대 16 세로로도 720p의 고화질 비디오를 만들 수 있다라고 전했다.
이매진 3는 텍스트 프롬프트를 기반으로 다양한 스타일의 포토리얼리틱 이미지를 생성하며, 이전 모델에 비해 세부 묘사, 조명 표현, 아티팩트 제거 측면에서 더 뛰어난 성능을 제공한다. 또 텍스트 프롬프트를 통해 이미지 업스케일링, 인페인팅, 아웃페인팅, 배경 교체와 같은 고급 커스터마이징 기능을 활용할 수 있다.
특히 참고 이미지를 입력하면 브랜드 스타일과 로고, 제품 특징에 맞는 콘텐츠를 제작할 수 있어, 기업에 유용한 도구라는 점을 강조했다.
한편, 구글 밢표 이후 몇시간 뒤 아마존웹서비스(AWS)는 베드록(Bedrock) 서비스를 통해 '노바 캔버스(Nova Canvas)'라는 이미지 생성 모델과 '노바 릴(Nova Reel)'이라는 비디오 생성 모델을 새롭게 선보였다. AWS 역시 기업용 서비스라는 점을 부각했다.
박찬 기자 cpark@aitimes.com
