시작적 스타일을 통일해 적용한 이미지 (사진=미드저니)
시작적 스타일을 통일해 적용한 이미지 (사진=미드저니)

이미지 생성 인공지능(AI)의 대표 격인 미드저니가 통일된 시각적 스타일을 적용할 수 있도록 하는 기능을 추가했다. 이는 기업이나 브랜드에 초점을 맞춘 기능으로, 미드저니도 결국 돈이 되는 기업 대상 서비스에 집중하는 모습이다.

벤처비트는 3일(현지시간) 미드저니가 사용자 고유 스타일의 이미지를 생성하고 이를 모든 이미지에 적용할 수 있도록 하는 ‘스타일 튜너(Style Tuner)’ 기능을 출시했다고 소개했다. 

이전까지는 미드저니에서 여러 이미지에 일관된 스타일을 생성하기 위해서는 사용자가 텍스트 설명을 일일이 반복해야 했다. 하지만 이미지 생성 AI 특성상 랜덤한 출력물을 내놓기 때문에 사실상 불가능한 작업이었다.

이제는 프롬프트 대신 스타일 튜너를 사용, 스타일을 선택하고 향후 모든 작업에 적용할 코드를 얻어 동일한 스타일을 유지할 수 있게 됐다. 이는 통일된 스타일의 결과물이 필요한 기업과 브랜드 등에 큰 도움이 된다.

미드저니 디스코드 서버로 이동해 ’/tune’을 입력한 다음 프롬프트 작업을 하면 된다. 예를 들어 이미지에 눈이 많이 내리는 장면과 아늑한 공간을 포함하고 싶다면, ‘/tune’ 뒤에 ‘로봇이 포근한 스웨터를 입고 벽난로 앞에 앉아 머그잔에 담긴 핫초콜릿을 마시고 있다’라는 프롬프트를 입력하는 식이다.

이에 미드저니 디스코드 봇은 스타일 튜너 프로세스를 설명하고 사용자에게 계속할지 묻는 메시지를 내놓는다. 이 메시지에는 사용자의 입력 프롬프트를 기반으로 시각적 스타일을 생성할 수 있도록 ‘스타일 방향’과 ‘모드'를 선택할 수 있는 두개의 드롭다운 메뉴가 포함돼 있다.

스타일 튜너를 통한 스타일 설정 (사진=미드저니)
스타일 튜너를 통한 스타일 설정 (사진=미드저니)

스타일 방향 설정은 미드저니가 사용자의 프롬프트에서 생성할 이미지 수를 나타내며, 각 이미지는 뚜렷하게 다른 스타일을 보여준다. 사용자는 이런 이미지 중에서 스타일을 선택하거나 결과 이미지를 결합해 새로운 메타 스타일을 만들 수 있다.

미드저니는 여기에서 유료 모델을 세분화했다. 다양한 옵션으로 생성한 이미지 수에 따라 각각 다른 양의 GPU 크레딧을 적용한다. 예를 들어 16가지 스타일 방향은 0.15시간의 GPU 크레딧을 사용하고, 128가지 스타일 방향은 1.2크레딧을 사용한다.

모드 설정은 ‘디폴트’나 ‘원본’ 중에서 선택할 수 있다. 원본 모드는 필름이나 DLSR 카메라처럼 보이도록 거칠게 만들어진 이미지다.

이런 과정을 마치면 ‘스타일 튜너 준비 완료’라는 메시지와 함께 스타일을 공유할 수 있는 미드저니 튜너 웹사이트 URL이 표시된다.

스타일 튜너 설정 완료 (사진=미드저니)
스타일 튜너 설정 완료 (사진=미드저니)

제공된 URL 페이지에서 사용자는 입력한 프롬프트와 스타일을 조정하는 두가지 방법을 확인할 수 있다. 

URL 페이지에서 스타일 조정 옵션 선택 (사진=미드저니)
URL 페이지에서 스타일 조정 옵션 선택 (사진=미드저니)

‘한번에 두가지 스타일 비교’ 옵션은 스타일 방향 옵션에서 설정한 이미지 수만큼의 그리드에 두가지 결과 이미지를 표시한다. 스타일 방향으로 16을 설정했다면 16개 행마다 2개의 4x4  이미지 그리드가 포함된다. 사용자는 원하는 행에서 하나의 4×4 그리드를 선택할 수 있으며, 미드저니는 선택된 그리드의 조합에 따라 스타일을 생성한다. 선택한 그리드가 많을수록 미묘한 차이의 스타일을 생성할 수 있다.

‘한 번에 두 가지 스타일 비교’ 옵션 (사진=미드저니)
‘한 번에 두 가지 스타일 비교’ 옵션 (사진=미드저니)

‘큰 그리드에서 마음에 드는 것을 선택’은 사용자가 이전에 설정한 스타일 방향 수에 따라 생성된 모든 이미지의 전체 그리드에서 단 하나의 이미지만 선택할 수 있다. 32를 설정했다면 8×4 그리드로 배열된 총 32개의 이미지가 표시된다. 이 옵션은 ‘한번에 두 스타일 비교’ 옵션보다 더 정확하지만 반면 더 제한적이다.

큰 그리드에서 마음에 드는 것을 선택’ 옵션 (사진=미드저니)
큰 그리드에서 마음에 드는 것을 선택’ 옵션 (사진=미드저니)

사용자가 스타일의 기반으로 선택한 행이나 이미지 수에 관계없이, 미드저니는 해당 스타일을 자동으로 적용하고 이를 사용자가 앞으로 모든 프롬프트에 대해 수동으로 복사해 붙여넣을 수 있도록 단축 코드로 변환한다. 단축 코드는 사용자의 고유한 스타일 튜너 페이지 하단에 표시된다.

생성된 스타일에 대한 단축코드가 추가된 프롬프트 (사진=미드저니)
생성된 스타일에 대한 단축코드가 추가된 프롬프트 (사진=미드저니)

그다음 사용자는 이 코드를 저장하고 복사, 원본 프롬프트에 ‘--style’ 플래그와 함께 추가해 전체 스타일을 다시 실행할 수 있다.

원본 프롬프트와 새로 생성된 스타일을 사용하여 얻은 4×4 이미지 그리드 (사진=미드저니)
원본 프롬프트와 새로 생성된 스타일을 사용하여 얻은 4×4 이미지 그리드 (사진=미드저니)

최종적으로 사용자는 원본 프롬프트와 새로 생성된 스타일을 사용해 얻은  4x4 이미지 그리드에서 하나의 이미지를 선택할 수 있다. 

최종 선택된 이미지 (사진=미드저니)
최종 선택된 이미지 (사진=미드저니)

스타일 코드는 가로세로 비율이나 크기 등 다양한 매개변수와 함께 사용될 수 있다.

‘-ar 16:9’ 매개변수로 생성된 16:9 버전 (사진=미드저니)
‘-ar 16:9’ 매개변수로 생성된 16:9 버전 (사진=미드저니)

한편 최근 이미지 생성 AI는 기업을 대상으로 매출 확보에 돌입한 양상이다. 스테이블 디퓨전에는 지난주 게임이나 광고 등에 사용하기 적합한 3D 이미지 생성 기능이 추가됐다.

또 지난달 오픈AI가 내놓은 '달리 3'는 챗GPT 유료 버전인 ‘챗GPT 플러스’ 이용자와 기업용 ‘챗GPT 엔터프라이즈’에 통합됐다. 달리 3는 세부적인 사항을 추가할 수 있고 생성된 이미지에 대한 부분 수정 작업도 가능해, 역시 기업용으로 적합하다는 평가를 받고 있다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지