딥러닝 알고리즘으로 온라인 쇼핑 추천 서비스
아마존, IEEE컨퍼런스에서 CVPR 논문 10건 발표
아마존은 연관 도서를 추천해주는 온라인 서점 시작, 세계 최대 쇼핑 사이트로 성장했다. 아마존의 발전은 인공지능, 빅데이터 등을 활용한 추천서비스가 밑바탕. 이 관련 기술 논문이 공개됐다.
22일 '인공지능 개발자 모임' 우종하 운영자는 페이스북을 통해 "아마존이 컴퓨터 비전으로 소비자들의 온라인 쇼핑에 도움이 되는 방법을 공개했다"면서 IEEE 컨퍼런스에서 아마존이 발표한 컴퓨터 비전 및 패턴 인식(CVPR) 논문 3편을 공유했다.
우종하 운영자는 "온라인으로 구매한 옷이 내게 어울리는지 판단하기 어려워 문제였다"면서 "아마존이 이런 고민을 해결할 기술을 개발, 공개한 것 같다"고 말했다.
공개된 '가상 피팅룸' 개발 기술은, 3단계로 구성된 GAN (Generative Adversarial Networks) 기반 시스템.
'가상 피팅룸'은 첫 단계에서 여러 검색 이미지를 입력한다. 이미지들은 최종 이미지 탬플릿으로 쓰인다. 다음 단계에서 입력된 이미지를 분할 및 분석. 최종 선택된 부분은 형태 생성 네트워크에서 모델 사진에 입혀진다. 옷을 입은 의상의 모델은 외형 생성 네트워크로 전달된다. 마지막 단계에서는 앞의 두 네트워크를 복습해 변수들을 조정한다. 이 과정에서 원본 이미지를 손상시키지 않으면서 자연스러운 합성본을 완성한다.
GAN은 딥러닝 네트워크 중 하나로 이미지 생성과 자연어처리 등 다양한 분야에서 성과를 보이고 있다. 이름을 풀어보면 △Generative=생성하다 △Adversarial=대립하다 △Network=네트워크(신경망). 생성 모델과 평가 모델이 서로 경쟁하듯 성능을 개선해 나가는 시스템이란 뜻.
아마존은 쇼핑에 도움이 될 만한 GAN 기반의 컴퓨터 비전 기술 3가지에 관해 설명했다.
첫 번째는, 고객이 원하는 제품 이미지에 대해 설명함으로써 검색어 범위를 좁히는 시스템. 고객이 "밝은 꽃 패턴을 원합니다"라고 입력하거나 말하면 이미지 변경이 가능하다.
두 번째는, 고객이 선택한 색상, 스타일, 질감 등을 기반으로 어울리는 제품을 추천하는 시스템이다.
세 번째는, 다른 화면에서 선택한 제품들을 착용한 모델의 모습을 보여준다.
제품 검색어 이미지를 텍스트를 사용하여 수정할 때 △텍스트 설명과 이미지 기능을 하나로 통합하는 방법 △다른 수준의 해상도에서 융합을 수행할 수 있는 능력 △고객의 요구에 맞춰 이미지 기능을 유지하도록 네트워크를 훈련하는 방법 등에 대한 필요성이 제기됐다.
아마존 연구팀은 위 문제를 세 가지 입력으로 학습시킨 훈련망을 통해 해결했다. 입력된 데이터는 원본 이미지, 입력된 텍스트 복습, 텍스트 복습 시 일치하는 이미지이다. 연구팀은 "새롭게 학습한 시스템이 기존 시스템보다 58% 향상된 성능을 가지고 있다"고 전했다.
한편, 아마존은 6월 IEEE 컨퍼런스를 통해 모두 10편의 CVPR 논문을 발표했다. IEEE컨퍼런스는 컴퓨터 비전 분야의 선두(Top-Tier)로 꼽힌다.
[AI & Tech] 아마존, AI 의류 검색 기능 강화…키워드만 입력하면 '척척'
[Life & 교육] '모두를 위한 AI'는 인공지능계 칸 아카데미
무단전재 및 재배포 금지
기사제보 및 보도자료 news@aitimes.com