(사진=스태빌리티 AI)
(사진=스태빌리티 AI)

스태빌리티 AI가 이미지 생성 인공지능(AI) 플랫폼 ‘스테이블 디퓨전’에 3D 생성 기능을 추가했다. 새 기능은 게임이나 기업용 이미지에 초점을 맞추고 있어, 오픈 소스를 지향하는 스태빌리티 AI도 결국 돈이 되는 기업 대상 서비스에 집중하는 모습이다.

벤처비트는 1일(현지시간) 스태빌리티 AI가 스테이블 디퓨전 플랫폼에 ▲3D 이미지를 생성하는 ‘스테이블 3D(Stable 3D)’ 모델 ▲이미지 미세 조정 프로세스를 신속하게 처리하는 ‘스테이블 미세조정(Stable Fine-Tuning)’ 도구 ▲콘텐츠 인증을 위한 비가시적 워터마크 등을 추가했다고 소개했다.

이에 따르면 스테이블 3D 모델은 그래픽 디자인과 비디오 게임 개발 등 기업 서비스에 초점을 맞춘 3D 이미지를 생성한다. 세계 최대 규모의 오픈 소스 3D 데이터셋인 ‘옵자버스(Objaverse)-XL’를 활용해 벡터화하고 훈련, 스테이블 디퓨전에 사용한 확산 모델(diffusion model)을 확장했다.  

스태빌리티 AI는 스테이블 3D가 기존의 3D 이미지 생성 방식에 비해 훨씬 효율적이라고 주장했다. 스테이블 3D는 비공개 미리보기로 제공된다. 

또 ‘스테이블 미세조정’ 도구를 통해 기업이 특정 이미지에 대한 미세조정 작업을 처리할 수 있게 지원한다. 기업 특화 도구 중 2D 이미지에서 하늘을 바꾸는 작업을 정확하게 수행하도록 설계된 ‘스카이 리플레이서(Sky Replacer)’를 먼저 도입했다.

스카이 리플레이서 역시 기업용 서비스 성격이 짙다. 예를 들어 건물 이외의 사진 배경을 하늘로 바꿔주는 기술은 부동산 기업의 건물 활용에 유용할 수 있다.

이와 같이 스테이블 미세조정 도구는 기업이 이미지와 콘텐츠를 생성하는 사례에 따라 맞춤화된 제어를 가능하게 하는 최적 워크플로우를 제공할 수 있다.

마지막으로 스태빌리티 AI는 API를 통해 생성 이미지에 눈에 보이지 않는 워터마크를 추가할 예정이다. 콘텐츠 저작권 정보에 대한 자격 증명도 API에 통합할 계획이다. 

이처럼 새 업데이트는 생성 AI 보급이 일반화되는 가운데 '기업용'으로 차별을 주려는 것으로 볼 수 있다.

에마드 무스타크 스태빌리티 AI CEO는 “이번 업데이트 목표는 창의적인 스토리텔러에게 이미지에 대한 추가 제어 수준을 갖는 데 필요한 도구를 제공하는 것”이라고 말했다.  

한편 이미지 생성 AI는 최근 다수 기업이 B2B 시장을 놓고 격전을 예고 중인 분야다. 

어도비는 기존 소프트웨어와 긴밀하게 통합된 ‘파이어플라이’를 출시했으며, 캔바는 차별화를 위해 아마추어라도 생성 AI를 통해 디자인에 접근할 수 있는 AI 도구를 추가했다. 오픈AI는 '달리 3'를 아예 '챗GPT'에 통합, 접근성과 편리성을 극대화했다. 

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지