카카오브레인(대표 김일두, 김병학)이 10일 사실감 넘치는 이미지를 3초 안에 그려내는 이미지 생성 인공지능(AI) 모델 ‘칼로(Karlo) 2.0’을 출시했다. 기존 '칼로 1.4' 모델 오픈 API를 '칼로 2.0'으로 업그레이드 한 모델이다.
카카오브레인은 칼로 2.0이 약 3억장 규모의 텍스트-이미지 데이터셋을 학습한 AI 아티스트로, 글로벌 톱 티어 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다고 설명했다.
예를 들어 ‘밝은 파란 눈동자를 가진 고양이'와 같은 복잡한 프롬프트를 입력해도 이를 명확히 이해하고 그려낼 수 있다고 전했다.
해상도는 최대 2048x2048을 지원한다. 생성 이미지의 해상도가 높을수록 다양한 이미지 사이즈로 작업이 가능, 사용자는 표현하고자 하는 이미지를 심도 있고 섬세하게 그려낼 수 있게 됐다고 밝혔다.
더불어 이미지 상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등을 보강해 실사에 가까운 고품질 이미지 생성이 가능하다고 강조했다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축해 3초 만에 사용자가 원하는 이미지를 만들어낼 수 있다는 설명이다.
또 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 프롬프트 이해도와 더불어 부정 명령어(Negative Prompt) 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 제어한다.
카카오브레인은 칼로 2.0 오픈 API를 선보이며 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만장까지 대폭 확대했다. 일반 스타트업 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대함으로써 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 의지가 담았다고 강조했다.
칼로 2.0 API에 대한 자세한 내용은 카카오디벨로퍼스 내 칼로 페이지에서 확인할 수 있다.
김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습해 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.
이주영 기자 juyoung09@aitimes.com
