오픈AI(OpenAI)가 달리2(DALL‧E 2)가 생성한 이미지에 이미지나 배경을 추가하는 아웃페인팅(Outpainting) 기술을 공개했다.
달리2는 텍스트에서 이미지를 생성하는 AI 이미지 생성기다. 2022년 4월 이미지를 생성할 뿐 아니라 기존 이미지를 편집하는 인페인팅(Inpainting)이라는 기능이 구현된 바 있다.
오픈AI는 여기에 원본 이미지에 그려지지 않은 부분을 추가할 수 있는 새로운 아웃페인팅 기술을 블로그를 통해 발표했다. 오픈AI는 이 기능에 대해 자연어를 이용한 설명문 추가만으로 같은 스타일 비주얼 요소를 추가하거나 새로운 방향으로 스토리를 전개하거나 이미지 테두리를 넘어 이미지를 그려 사용자의 창의성을 확장할 수 있는 새로운 기능이라고 밝히고 있다.
달리2는 ‘앤디 워홀 스타일의 말을 탄 우주비행사’와 같은 텍스트 프롬프트를 사용해 이를 설명하는 9개의 1024x1024 픽셀 이미지를 생성한다. 무작위로 생성된 노이즈로 시작하여 프롬프트의 특징과 최대한 가깝게 일치하도록 편집하는 확산(diffusion)이라는 프로세스를 사용한다.
지금까지 달리2로 만들 수 있는 이미지의 크기는 1024x1024 픽셀의 정사각형만으로 제한되었다. 실제로 더 큰 이미지를 만들려면 포토샵과 같은 앱을 사용해 여러 섹션을 수동으로 연결해야 했다. 특히 가로와 세로의 길이가 다른 경우 이미지를 자를 수 있지만 전체 해상도가 감소했다.
아웃페인팅은 사용자가 이미지를 확장하려는 1024x1024 픽셀 정사각형 영역을 선택하고 추가할 이미지에 대한 프롬프트를 지정할 수 있다. 예를 들어, 말을 탄 우주 비행사에게 더 많은 배경을 추가하려면 프롬프트를 "앤디 워홀 스타일의 배경에 별이 있는 달 위에서 말을 탄 우주 비행사"로 변경할 수 있다.
아웃페인팅에선 그림자나 반사, 텍스처 등 이미지의 기존 시각적 요소가 반영되기 때문에 추가된 이미지가 전체의 일부처럼 보일 수 있게 이미지를 확장할 수 있다고 한다.
달리2의 아웃페인팅 발표에는 원래 크기보다 약 20배 확장된 요하네스 페르메이르(Johannes Vermee)의 ‘진주 귀걸이를 한 소녀(Girl with a Pearl Earring)’가 시연됐다. 단순한 초상화 대신 어수선한 집에 서 있는 젊은 여성의 모습을 보여준다. 너무 자세히 보지 않는 한 실제로 원본 그림의 연장선처럼 전체적인 스타일과 분위기가 잘 살아있다.
AI타임스 박찬 위원 cpark@aitimes.com
