미러보드(대표 유태형, 문해찬)는 생성 인공지능(AI) 기반 스톡 이미지 서비스 '스냅 바이 AI(Snap By AI)'를 운영 중이다. 

스톡 이미지 서비스에 생성 AI를 도입하는 곳은 이미 몇 군데 있다. 저작권이나 초상권의 문제 없이 새로운 이미지를 만들어 자유롭게 사용할 수 있다는 점은 스톡 이미지 사이트의 목적성에도 부합하기 때문이다. 

스냅 바이 AI는 다른 곳과 달리 '전문성'에 초점을 맞췄다. 특히 실감 나는 인물 사진에 집중, 초현실적인 아트나 그래픽이 아닌 '사람을 얼마나 실제처럼 구현해 내는가'를 차별성으로 내세운 것이다. 

하지만 기존 스톡 이미지 사이트에서 생성 AI를 사용한 결과는 그리 신통치 않았다. 모든 이미지 생성 AI가 그렇듯 정확하게 원하는 결과를 얻기 힘들었다.

그래서 미러보드는 프롬프트 입력의 어려움과 전문성의 한계를 뛰어넘기 위해 간단하고 획기적인 인터페이스를 구축했다고 설명했다. 특히 이미지 수정을 텍스트가 아닌 마우스와 클릭, 스크롤로 할 수 있다고 했다.

정확히 어떤 방식으로 어떤 결과물을 생성하는지 궁금해 졌다. 프롬프트 엔지니어에 도전하기 전 단계라고 생각하며 체험에 나섰다. 

(사진=스냅바이AI)
(사진=스냅바이AI)

우선 스냅 바이 AI 사이트에 접속하니 인물 사진이 여럿 등장했다. 결과물을 홍보하려 것이 아니라, 본인이 참고하고 싶은 예시 이미지를 선택하기 위한 것이다. 이곳에선 생성을 '0'부터 시작하지 않았다.

(사진=스냅바이AI)
(사진=스냅바이AI)

기타를 잡은 소녀의 사진을 클릭해 봤다. 밝은 배경에 틴에이지 분위기가 매력적이다. 이는 미러보드가 스테이블 디퓨전 기반의 생성 AI로 만든 예시로, 설정을 자유롭게 변환해 개인 맞춤형 이미지를 만들 수 있다.

(사진=스냅바이AI)
(사진=스냅바이AI)

사진 커스텀 옵션은 다섯 가지로 구성한다. ▲인종 ▲성별 ▲연령 ▲현실적인 피부 묘사 여부 ▲포즈 변화 여부 등이다. 사이트는 글로벌 사용자를 타깃으로 해 영어로 구성했다. 하지만 이용 방법은 정말 간단했다.

우선 인종을 클릭하면 랜덤, 아프리칸, 흑인, 동아시아인, 히스패닉, 중동, 남아시아인, 기타 등으로 다양한 옵션이 떴다. 성별과 연령도 클릭으로 바꿀 수 있다. 일단 무작정 해보는 게 가장 빠를 것 같았다.

(사진=스냅바이AI)
(사진=스냅바이AI)

첫번째는 설정을 전혀 안 바꾸고 탄생한 결과물이다. AI가 구현하기 어려운 손 부분의 오류를 제외하면, 고화질에 괜찮은 퀄리티다.

(사진=스냅바이AI)
(사진=스냅바이AI)

인종 및 포즈에 변화를 줘 봤다. 역시 손에 오류가 있지만, 설정 변화 자체는 성공적으로 반영했다.

(사진=스냅바이AI)
(사진=스냅바이AI)

성별까지 바꿔 봤다. 여러 번 생성할수록 결과물의 퀄리티가 나아가지는 것 같다. 손톱 끝부분까지 완벽한 구현은 아니지만, 손 모양도 점차 정교해지는 것이 느껴졌다.

(사진=스냅바이AI)
(사진=스냅바이AI)

다음으로는 '신체 부분'이 최대한 없는 이미지를 골랐다. 복잡한 구조 없이 얼굴 묘사에만 집중할 경우 얼마나 높은 퀄리티의 사진이 나올지 궁금했기 때문이다. 결과는 놀라웠다.

(사진=스냅바이AI)
(사진=스냅바이AI)

인종 및 나이를 변경, 이번엔 현실적 피부 묘사 옵션을 선택하지 않았는데도 높은 퀄리티의 사진이 나왔다. 실제 사진같이 보였다.

다음에는 정반대의 옵션을 시도해 보았다. 기존 사진이 젊은 여성에 백인인 걸 고려, 나이 든 남성으로 설정하면 안정적인 결과물이 나올 지 궁금했다.

(사진=스냅바이AI)
(사진=스냅바이AI)

오히려 원본보다 더 맘에 들었다. 주름, 머리카락 등 묘사가 아주 성공적이다.

몇번 시도 끝에 가장 궁금한 사실이 한 가지 남았다. 오류를 최소화하고 빨리 최적의 결과물을 얻으려면 어떻게 해야 할까.

인물이 두 명으로 늘어나는 오류 예시 (사진=스냅바이AI)
인물이 두 명으로 늘어나는 오류 예시 (사진=스냅바이AI)

우선 '안정성'을 중요시할 경우 포즈 변화 옵션을 꺼두는 게 유리했다. 원본 예시 이미지와 거의 동일한 포즈를 출력하기 때문에 신체 일부나 구조가 흔들릴 확률이 적어지기 때문이다. 실제 어떤 사진에서는 포즈 변화 옵션을 켜두면 한명이 두명으로 늘어나기도 했다. 몇번 일어난 현상이다.

시간이 넉넉하고 다양한 시도를 원한다면 얼마든지 선택해도 좋다. 확률적으로 여러번 생성할수록 더 높은 퀄리티를 나타냈기 때문에, 결국 오류 없는 사진을 만들어 낼 수 있다.

(사진=스냅바이AI)
(사진=스냅바이AI)

 

나이가 잘 반영되지 않는 오류 예시 (사진=미러보드)
나이가 잘 반영되지 않는 오류 예시 (사진=미러보드)

두번째는 변형의 최소화다. 위에서는 젊은 여성을 나이 든 남성으로 성공적이게 변환할 수 있었지만, 반대로 불가능한 경우도 존재했다. 특히 하얀 머리카락 등 노화를 상징하는 요소가 이미지 내에서 많은 부분을 차지하는 경우, 여러번 시도해 봐도 큰 변화를 보이지 않았다. 

세번째는 신체 노출의 최소화다. 물론 상황에 맞는 동작, 소품 등이 꼭 사진에 필요한 경우라면 어쩔 수 없다. 하지만 인물의 얼굴, 사실성, 저작권 없는 얼굴 사진이 필요한 경우엔 신체 노출 부분을 최소화하고 최대한 '얼굴'을 강조한 사진을 택하는 게 좋다. AI가 분석 및 묘사를 한곳에 집중하기 때문에 더 사실적인 이미지를 얻을 수 있다.

참고로 비교적 성공적이었던 최종 결과물을 첨부한다. 모두 원본 이미지가 아닌 변형 결과물이다.

(사진=스냅바이AI)
(사진=스냅바이AI)
(사진=스냅바이AI)
(사진=스냅바이AI)
(사진=스냅바이AI)
(사진=스냅바이AI)

물론 텍스트 프롬프트 기능도 제공한다. 사실적인 묘사를 위해 미세조정을 거친 생성 AI 모델이기 때문에 당연히 인물에 강점을 보인다. '컬러풀한 선글라스와 레더 재킷을 걸친 여성' 프롬프트로 결과물을 생성했다. 프롬프트는 영어로 지원한다.

(사진=스냅바이AI)
(사진=스냅바이AI)

다른 사진도 제작해 봤다. 여기에서도 꼬리와 다리 개수가 문제였지만, 동물도 제법 사실적으로 묘사가 가능한 것 같다. 오브젝트는 아직 오류가 잦은 듯하다.

(사진=스냅바이AI)
(사진=스냅바이AI)

결과적으로 스냅 바이 AI는 '생성 AI에 익숙해지는 훈련 과정' 같았다. AI가 특정 단어에 어떤 형상을 만들어내는지, 유독 어느 부분에 강하고 약한 지 등 일정 패턴을 알아낼 수 있었다.

동시에 창의적이었다. 텍스트 프롬프트 입력 방식이지만, 사용자의 직접 입력이 아닌 새로운 UI를 적용해 간단한 조절이 가능했다.

특히 생성 AI에 막 익숙해지려는 초보 사용자들에게 유용하지 않을까. 예시 이미지에는 사용 프롬프트가 함께 제시되는데, 문장과 표현 그리고 단어를 잘 참고한다면 직접 이미지를 생성할 때도 도움이 될 것 같았다. 

향후에는 비전문가도 보정 및 편집, 화보 제작 등 여러 작업을 전문가처럼 능숙하게 할 수 있게 되지 않을까. AI에 모든 것을 맡기는 것이 아니라, 내 의도를 적용해 '도구'처럼 사용한다는 점이 인상적이었다.

체험은 홈페이지에서 가능하다. 예시 이미지는 꾸준히 증가 중이다.

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지