애플 칩이 탑재된 장치에서 실행되는 스테이블 디퓨전 최적화 모델을 사용해 ‘우주에서 말/용을 타고 있는 우주비행사의 고품질 사진’이라는 프롬프트로 생성된 이미지 (사진=애플)
애플 칩이 탑재된 장치에서 실행되는 스테이블 디퓨전 최적화 모델을 사용해 ‘우주에서 말/용을 타고 있는 우주비행사의 고품질 사진’이라는 프롬프트로 생성된 이미지 (사진=애플)

애플이 애플 칩에서 실행할 수 있도록 최적화한 '스테이블 디퓨전(SD: Stable Diffusion)' 인공지능(AI) 이미지 생성기를 공개했다. 애플 신경망 엔진 하드웨어에서 SD의 이미지 생성시간을 단축할 수 있는 솔루션이다. 

아스테크니카는 3일(현지시간) 애플이 텍스트를 입력해 새로운 이미지를 생성하는 오픈소스 AI 이미지 합성 모델인 '스테이블 디퓨전'을 공개했다고 보도했다.

애플이 이번에 공개한 SD는 윈도우즈 또는 리눅스 PC에서 로컬로 실행할 때 엔비디아의 고급 GPU에서 이미지를 가장 빠르게 생성한다. RTX 3060에서 512×512 이미지를 생성하는 데 약 8.7초가 걸린다. 

이에 비해 M1 맥 미니(Mac Mini)에서 최적화되지 않은 SD를 사용해 512×512 이미지를 생성하는 데 약 69.8초가 걸렸다.

깃허브(Github)의 애플 벤치마크에 따르면 애플의 새로운 SD 최적화는 35초 안에 M1 칩에서 512×512 50단계 이미지를 생성할 수 있다. M2는 23초 만에 작업을 수행하며 애플의 가장 강력한 칩인 M1 울트라(Ultra)는 단 9초 만에 동일한 결과를 얻을 수 있다. 이는 생성 시간을 거의 절반 이상 단축하는 극적인 개선이다.

애플의 SD 최적화 모델은 SD 모델을 파이토치에서 애플 프레임워크인 코어(Core) ML로 변환하고 macOS 13.1 및 iOS 16.2 이상의 애플 칩이 탑재된 맥, 아이패드 및 아이폰에 배포할 수 있는 파이썬 패키지다. 최적화는 SD 1.4, 1.5 및 새로운 2.0에서 작동한다.

애플은 또한 맥 또는 애플 장치에서 로컬로 AI 생성 모델을 실행하는 이점으로 개인 정보 보호 및 클라우드 컴퓨팅 비용 방지를 언급한다. 

애플은 "사용자가 모델에 대한 입력으로 제공한 모든 데이터가 사용자의 장치에 남아 있기 때문에 최종 사용자의 개인 정보가 보호된다”며 "초기 다운로드 후 사용자는 모델을 사용하기 위해 인터넷 연결이 필요하지 않고 이 모델을 로컬에 배포하면 개발자가 서버 관련 비용을 줄이거나 없앨 수 있다"고 설명했다.

박찬 위원 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지