SD3 미디엄 생성 이미지 (사진=스태빌리티 AI)
SD3 미디엄 생성 이미지 (사진=스태빌리티 AI)

스태빌리티 AI가 소비자용 노트북에서도 실행할 수 있는 소형 이미지 생성 인공지능(AI) 모델을 출시했다. 대신 성능은 더 큰 대표 모델과 큰 차이가 없다고 강조했다.

벤처비트는 13일(현지시간) 스태빌리티 AI가 소비자 등급 GPU에서 실행할 수 있는 20억 매개변수의 이미지 생성 모델 ‘SD3 미디엄(Stable Diffusion 3 Medium)’을 출시했다고 보도했다.

이에 따르면 SD3 미디엄을 실행하기 위한 최소 요구사항은 GPU VRAM 5GB에 불과하다. 고급 노트북은 물론 다양한 소비자 PC에서도 실행 가능한 정도다. 

스태빌리티 AI는 SD3 미디엄이 매개변수는 적지만, 지난 2월 공개한 80억 매개변수의 'SD3 라지(SD3 Large)'와 비교할만한 수준의 품질을 제공한다고 주장했다. 

크리스티안 라포르테 스태빌리티 AI CEO는 “SD3 미디엄은 SD3 라지에서 제공하는 포토리얼리즘, 프롬프트 준수, 타이포그래피, 자원 효율성 및 미세 조정과 같은 기능들을 모두 제공하며, 현재 사용 중인 SD3 라지 API와 비교할 만하다"라고 말했다.

특히 SD3 미디엄은 16채널 'VAE(Variational Autoencoder)' 덕분에 이전 모델보다 메가픽셀당 더 높은 세부 묘사를 제공, 매우 사실적인 이미지를 생성한다고 전했다.

또 자연어 이해 능력이 향상, 프롬프트로 지시한 이미지 내 요소의 위치와 같은 공간적 이해도 가능하다.

미세조정에도 능숙하다. 미세조정 데이터셋에서 세부 정보를 효율적으로 캡처한다. 타이포그래피 기능도 크게 개선됐다.

무엇보다 SD3 미디엄의 가장 큰 특징은 '효율성'이다.  

라포르테 CEO는 "상대적으로 작은 크기와 2B 모델의 모듈성 덕분에 성능 저하 없이 컴퓨팅 요구 사항을 줄일 수 있다"라며 "이로 인해 SD3 미디엄은 리소스 관리와 효율성이 중요한 환경에 이상적인 선택이 된다"라고 강조했다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지