딥러닝 알고리즘으로 온라인 쇼핑 추천 서비스
아마존, IEEE컨퍼런스에서 CVPR 논문 10건 발표

사진=셔터스톡
사진=셔터스톡

아마존은 연관 도서를 추천해주는 온라인 서점 시작, 세계 최대 쇼핑 사이트로 성장했다. 아마존의 발전은 인공지능, 빅데이터 등을 활용한 추천서비스가 밑바탕. 이 관련 기술 논문이 공개됐다.

22일 '인공지능 개발자 모임' 우종하 운영자는 페이스북을 통해 "아마존이 컴퓨터 비전으로 소비자들의 온라인 쇼핑에 도움이 되는 방법을 공개했다"면서 IEEE 컨퍼런스에서 아마존이 발표한 컴퓨터 비전 및 패턴 인식(CVPR) 논문 3편을 공유했다.

우종하 운영자는 "온라인으로 구매한 옷이 내게 어울리는지 판단하기 어려워 문제였다"면서 "아마존이 이런 고민을 해결할 기술을 개발, 공개한 것 같다"고 말했다.

공개된 '가상 피팅룸' 개발 기술은, 3단계로 구성된 GAN (Generative Adversarial Networks) 기반 시스템.

'가상 피팅룸'은 첫 단계에서 여러 검색 이미지를 입력한다. 이미지들은 최종 이미지 탬플릿으로 쓰인다. 다음 단계에서 입력된 이미지를 분할 및 분석. 최종 선택된 부분은 형태 생성 네트워크에서 모델 사진에 입혀진다. 옷을 입은 의상의 모델은 외형 생성 네트워크로 전달된다. 마지막 단계에서는 앞의 두 네트워크를 복습해 변수들을 조정한다. 이 과정에서 원본 이미지를 손상시키지 않으면서 자연스러운 합성본을 완성한다.

사진=Amazon Science
사진=Amazon Science

GAN은 딥러닝 네트워크 중 하나로 이미지 생성과 자연어처리 등 다양한 분야에서 성과를 보이고 있다. 이름을 풀어보면 △Generative=생성하다 △Adversarial=대립하다 △Network=네트워크(신경망). 생성 모델과 평가  모델이 서로 경쟁하듯 성능을 개선해 나가는 시스템이란 뜻.

사진=Amazon Science
사진=Amazon Science

아마존은 쇼핑에 도움이 될 만한 GAN 기반의 컴퓨터 비전 기술 3가지에 관해 설명했다.

첫 번째는, 고객이 원하는 제품 이미지에 대해 설명함으로써 검색어 범위를 좁히는 시스템. 고객이 "밝은 꽃 패턴을 원합니다"라고 입력하거나 말하면 이미지 변경이 가능하다.

두 번째는, 고객이 선택한 색상, 스타일, 질감 등을 기반으로 어울리는 제품을 추천하는 시스템이다.

세 번째는, 다른 화면에서 선택한 제품들을 착용한 모델의 모습을 보여준다.

제품 검색어 이미지를 텍스트를 사용하여 수정할 때 △텍스트 설명과 이미지 기능을 하나로 통합하는 방법 △다른 수준의 해상도에서 융합을 수행할 수 있는 능력 △고객의 요구에 맞춰 이미지 기능을 유지하도록 네트워크를 훈련하는 방법 등에 대한 필요성이 제기됐다.

아마존 연구팀은 위 문제를 세 가지 입력으로 학습시킨 훈련망을 통해 해결했다. 입력된 데이터는 원본 이미지, 입력된 텍스트 복습, 텍스트 복습 시 일치하는 이미지이다. 연구팀은 "새롭게 학습한 시스템이 기존 시스템보다 58% 향상된 성능을 가지고 있다"고 전했다. 

한편, 아마존은 6월 IEEE 컨퍼런스를 통해 모두 10편의 CVPR 논문을 발표했다. IEEE컨퍼런스는 컴퓨터 비전 분야의 선두(Top-Tier)로 꼽힌다.

[AI & Tech] 아마존, AI 의류 검색 기능 강화…키워드만 입력하면 '척척'

[Life & 교육] '모두를 위한 AI'는 인공지능계 칸 아카데미