이미지를 분석해 유사한 이미지를 만들 수 있는 텍스트 프롬프트를 생성해주는 인공지능(AI) 모델이 나왔다. 텍스트 명령어를 입력하면 이미지를 생성해주는 기존 이미지 생성 AI와는 정반대의 기능을 하는 AI 모델이다.
트위터에서 '@pharmapsychotic'라는 아이디를 사용하는 한 AI 제너레이티브 아티스트가 이같은 기능을 하는 AI 모델 '클립 인터로게이트(CLIP Interrogator)'를 개발해 대중에 무료로 공개했다고 스크린샷(ScreenShot)이 지난 25일(현지시간) 보도했다.
'클립 인터로게이트'는 이미지를 업로드하면 '달리(DALL·E)'를 비롯한 이미지 생성 AI 모델을 이용해 유사한 이미지를 생성할 수 있는 텍스트 프롬프트를 만들어 준다.
지난해 출시된 오픈AI의 CLIP(Contrastive Language-Image Pre-Training) 신경망을 기반으로 개발했다. 허깅 페이스(Hugging Face)에서 이용할 수 있다.
클립 인터로게이트가 생성한 텍스트는 배경과 인물을 포함해 이미지의 모든 것을 설명한다. 배경 설명은 매우 평범한 반면에 인물을 설명하는 방법은 매우 사실적이다. 예를 들어 이미지 속의 인물이 ‘위협적인 미소’를 가지고 있다거나 ‘눈썹이 없다’라고 설명한다.
이 AI 모델을 이용하면 저작권 때문에 마음대로 사용할 수 없는 이미지도 직접 제작해 활용할 수 있다. 물론 기존 이미지와 유사한 수준에 만족해야 한다.
예를 들어 온라인에서 마음에 드는 사진을 찾았다면 클립 인터로게이트에 업로드해 이미지 생성을 위한 텍스트 프롬프트를 제작할 수 있다. 이를 '달리'를 비롯한 이미지생성 AI에 입력하면 자신만의 이미지를 얻을 수 있게 된다.
셀카 사진을 올려 외모를 설명하는 방법을 보기 위해 사용할 수도 있다. 다만, 학습 데이터에 한계가 있어 가끔 유해하거나 편향된 텍스트를 생성할수 있다는 점은 감안해야 한다.
박찬 위원 cpark@aitimes.com
