스테이블 디퓨전 3.5 라지 생성 이미지 (사진=스태빌리티 AI)
스테이블 디퓨전 3.5 라지 생성 이미지 (사진=스태빌리티 AI)

스태빌리티 AI가 이미지 생성 모델 ‘스테이블 디퓨전 3 미디움’의 단점을 개선한 ‘스테이블 디퓨전 3.5’ 제품군을 출시했다.

벤처비트는 22일(현지시간) 스태빌리티 AI가 텍스트에서 이미지를 생성하는  모델 ▲스테이블 디퓨전 3.5 라지(Large) ▲스테이블 디퓨전 3.5 라지 터보(Large Turbo) ▲스테이블 디퓨전 3.5 미디움(Medium) 등을 오픈 소스로 출시했다고 보도했다.

라지 버전은 80억개의 매개변수로 구성된 모델로, 프롬프트에 대한 높은 정확도와 고품질 이미지 생성에 중점을 두고 설계됐다. 100만 화소 해상도의 전문가용으로, 마케팅 캠페인 및 기업용 이미지와 디지털 자산을 제작하는 데 적합하다.

라지 터보 버전은 라지 모델의 간소화된 버전으로, 4단계 만에 고품질 이미지를 생성하면서도 뛰어난 프롬프트 준수성을 유지한다. 이로 인해 라지 버전보다 훨씬 빠르게 이미지를 생성할 수 있으며, 품질을 유지하면서 신속한 이미지 생성 워크플로우에 적합하게 설계됐다. 

미디움 버전은 26억개의 매개변수로, 25만~200만 화소 해상도 범위의 이미지를 생성하는 휴대폰이나 노트북 같은 엣지 디바이스에서 실행되도록 최적화된 모델이다. 이 모델은 오는 29일 이후에 출시 예정이다.

스테이블 디퓨전 3.5 이미지 생성 사례 (사진=스태빌리티 AI)
스테이블 디퓨전 3.5 이미지 생성 사례 (사진=스태빌리티 AI)

모든 버전은 오픈 소스이며, 비상업적 용도로는 무료로 사용 가능하고 연간 수익이 100만달러까지의 상업적 사용도 허용된다. 그 이후에는 기업 라이선스를 구입해야 한다.

모델 가중치는 허깅페이스에서 사용할 수 있으며, 스태빌리티 AI API와 리플리케이트, 파이어워스, 컴파이UI 등을 통해서도 접근할 수 있다.

또 새로운 모델에 대한 고급 제어를 제공하는 '컨트롤넷(ControlNets)'도 출시될 예정이다. 컨트롤넷은 이미지를 업스케일하거나 특정 패턴에 통일하는 등 전문 애플리케이션에 대한 편집 기능을 제공한다.

한편 스태빌리티 AI가 모델 업그레이드를 내놓은 것은 지난달 4일 아마존웹서비스(AWS)의 베드록에 '스테이블 이미지 울트라(Stable Image Ultra)' 등 최신 모델 3종을 출시한 지 50여일 만이다.

그동안 이미지 생성 분야에서는 스태빌리티 출신이 설립한 블랙 포레스트 랩스가 화제가 됐었다. 

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지