(사진=라이트닝AI)
(사진=라이트닝AI)

하나의 데이터 소스에만 의존하는 전통적인 추천 모델과 달리 텍스트, 그래프, 이미지 등 다양한 유형의 데이터를 결합해 향상된 추천 시스템을 만드는 방법이 등장했다.

월마트는 10일(현지시간) 멀티모달 데이터를 통해 인공지능(AI)의 추천 성능을 높이는 새로운 프레임워크 'TMF(Triple Modality Fusion)'에 대한 논문을 아카이브에 게재했다.

TMF 프레임워크는 월마트의 온라인 쇼핑 데이터를 활용해 학습했다. 전자제품과 반려동물 용품, 스포츠 용품 등 다양한 카테고리에서 발생한 고객 행동을 포함하며, 조회와 장바구니 추가, 구매와 같은 행동 패턴 정보를 추출했다. 구매가 이뤄지지 않은 데이터는 제외, 각 카테고리에서 복잡하지만 유효한 고객 행동 분석 데이터셋을 생성했다.

멀티모달 기능을 활용했다는 것이 핵심이다. TMF는 시각적, 텍스트, 그래프 데이터를 결합해 더 나은 추천을 제공한다는 설명이다.

시각적 데이터는 제품의 외관과 특성을 나타내고, 텍스트 데이터는 사용자 관심사와 제품 특성에 대한 세부 정보를 제공하며, 그래프 데이터는 사용자 행동과 제품 간의 관계를 보여준다.

TMF 프레임워크 (사진=아카이브)
TMF 프레임워크 (사진=아카이브)

이 프레임워크는 '라마2-7B'를 베이스로 사용하며, 'CLIP'을 이미지와 텍스트 데이터의 인코더로, 그래프 기반 기술인 'MHBT'를 사용해 아이템과 행동 간의 관계를 분석한다. 실험에서는 추천 정확도를 평가하기 위해 실제 항목을 찾아내는 방법을 사용해 TMF와 다른 모델들의 성능을 비교했다.

실험 결과, TMF 프레임워크는 모든 기준 모델을 능가하는 성과를 보여줬다.

전자 제품과 스포츠 데이터셋에서는 적중률 38% 이상을 기록, 사용자와 아이템 간 복잡한 상호작용을 잘 처리했다는 것을 입증했다. 반려동물 데이터셋에서도 라마2 를 능가, 추천 정확도를 향상했다.

또 아이템과 사용자 비율을 비슷하게 유지하면서 성능을 추가로 개선할 수 있다는 결과가 나왔다. 

연구진은 "기존 추천 모델은 단일 데이터 소스에 의존해 사용자 행동과 품목 기능의 복잡하고 다면적인 특성을 완전히 이해하는 능력을 제한한다"라며 "이번 연구는 다양한 데이터 모달리티를 통합해 시스템 성능을 향상하고 사용자 선호도와 품목 특성에 대한 보다 깊고 포괄적인 이해를 보장한다는 것을 보여줬다"라고 밝혔다.

한편, 이처럼 추천 알고리즘에 생성 AI를 도입하려는 움직임은 며칠 전에도 등장했다. 메타는 지난 3일 전통적인 추천 알고리즘에 사용자와의 상호작용을 통해 의도를 이해하도록 생성 AI를 결합한 하이브리드 추천 시스템 ‘라이거(LIGER)’를 선보였다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지