이미지 생성 인공지능(AI)에서도 '세계 최고 성능'을 주장하는 새로운 모델이 등장했다. 전직 스태빌리티 AI 연구원들이 설립한 독일 스타트업 블랙 포레스트 랩스가 이미지 생성 인공지능(AI) 모델 ‘플럭스.1(FLUX.1)’를 출시했다.
아스테크니카는 2일(현지시간) 블랙 포레스트 랩스가 텍스트-이미지 생성 AI 모델 ▲최고급 상업용 버전 ‘플럭스.1 프로(pro)’ ▲비상업용 오픈 소스 버전 ‘플럭스.1 데브(dev)’ ▲로컬 개발 및 개인 사용 목적의 상업용 오픈 소스 ‘플럭스.1 쉬넬(schnell)’ 등을 출시했다고 보도했다. 이중 플럭스.1 쉬넬(schnell) 버전이 가장 빠르고 가벼운 모델이다.
이들은 플럭스.1이 스태빌리티 AI의 '스테이블 디퓨전 XL', 미드저니의 '미드저니 6', 오픈AI의 '달리 3'보다 성능이 뛰어난 세계 최고 성능의 이미지 생성 모델이라고 주장했다.
플럭스.1 모델은 트랜스포머와 확산(Diffusion) 기술을 결합한 하이브리드 아키텍처를 사용, 최대 120억개의 매개변수로 확장 가능하다. 특히 다양한 포즈에서 사람의 손을 생성하는데 탁월하다고 강조했다.
벤치마크에서 결과, 플럭스.1 프로와 플럭스.1 데브는 시각적 품질과 프롬프트 충실도, 크기 및 종횡비 가변성, 타이포그래피, 출력 다양성 측면에서 미드저니 6, 달리 3, 스테이블 디퓨전 3-울트라 등을 능가하는 것으로 나타났다.
다만 블랙 포레스트 랩스는 플럭스.1 모델의 훈련 데이터를 어디서 얻었는지 언급하지 않았다. 스테이블 디퓨전을 훈련하는 데에도 사용된 레이온(LAION)의 데이터셋을 사용했을 경우, 저작권 문제가 발생할 수 있다는 분석이다.
한편 최근 앤드리슨 호로위츠가 주도하는 3100만달러(약 420억원) 규모의 시드 펀딩을 마무리했으며, 제너럴 카탈리스트와 매치VC로부터 추가 투자를 유치했다.
이 회사는 "우리는 생성적 AI가 모든 미래 기술의 기본 구성 요소가 될 것이라고 믿는다"라며 "우리 모델을 광범위한 청중에게 제공함으로써 우리는 모든 사람에게 이점을 제공하고, 대중을 교육하고, 이러한 모델의 안전성에 대한 신뢰를 높이고 싶다"라고 밝혔다.
비디오 생성으로 확장할 계획도 밝혔다. "우리의 동영상 생성 모델은 고화질과 전례 없는 속도로 정확한 제작과 편집을 가능하게 할 것"이라고 예고했다.
박찬 기자 cpark@aitimes.com
