뉴스 피드(News Feed)에 뜨는 게시물 선정 방법 공개
게시물 순서 정렬 방식 ▲기계 학습 ▲경량화 모델 ▲신경망 사용

페이스북 사용자라면 한 번쯤은 "뉴스 피드(News Feed)에 있는 게시물들은 어떤 이유로 나에게 추천되었을까?”라고 생각해 보았을 것이다.

(사진=셔터스톡)

26일 (현지시간), 페이스북 엔지니어링에서 기계 학습이 어떻게 뉴스 피드 순위를 설정하는지 공개했다. (원문링크)

뉴스 피드는 페이스북의 핵심 서비스로써, “친구, 가족뿐 아니라 사용자가 관심을 가지고 있는 사람, 장소 및 기타 항목에 대한 콘텐츠”를 보여준다.

페이스북은 가상의 사용자 후안(Juan)을 통해 사용자에게 제공되는 콘텐츠 선택 방법을 밝혔다.

어제 후안이 마지막으로 로그인한 이후 그의 친구 A는 반려견 사진을 올렸다. 또 다른 친구 B는 아침 달리기 영상을 올렸다. 또 후안이 즐겨 찾는 뉴스페이지에서는 은하수에 대한 흥미로운 기사를 출고했으며, 그가 팔로우하는 요리 그룹은 새로운 제빵 레시피를 공유했다. 이 모든 콘텐츠는 후안과 그의 친구들이 팔로우하거나 관심있는 페이지에서 나왔다. 그러므로 후안에게 관련ㆍ관심 있는 주제다.

이러한 정보를 바탕으로 페이스북은 기계 학습을 통해 후안이 관심 있을만한 후보 콘텐츠를 추출, 선택한다.

다음으로 콘텐츠를 뉴스 피드에 띄울 순위를 결정하기 위해 각 게시물에 점수를 부여한다. 콘텐츠를 공유한 사람과 사용자 간의 친밀도, 사용자가 자주 보는 콘텐츠과의 연관성을 심사 조건으로 점수를 매긴다.

구체적으로는, 이용자나 콘텐트를 항목으로 삼아 '선호도 행렬'을 작성하고, 행렬 분해 등 수학적 처리를 거쳐 코사인 유사도(Cosine similarity), 자카드 유사도(Jaccard similarity),  피어슨 상관계수(Pearson correlation coefficient)와 같은 각종 유사성 연산기법을 활용한다. 추천 알고리즘은 평균 제곱근 오차라는 평가지표, RMSE(Root mean squared Error)를 기초로 다양한 평가방법을 통해 수정되고 보완한다.

경량화 (Lightweight) 모델은 후보 콘텐츠들을 심사해 사용자 화면에 띄어줄 최종 콘텐츠를 선발한다. 또 더 강력한 신경망(Neural Network)을 사용해 콘텐츠 배치 순서를 결정한다.

마지막으로, 시스템은 뉴스 피드에 다양한 콘텐츠가 포함되도록 다양성 기능을 추가한다.

이 모든 과정은 사용자가 페이스북에 로그인하는 순간부터 콘텐츠가 화면에 나타나기까지, 급속도로 이루어진다.

AI타임스 배준영 기자 jybae0127@aitmes.com

키워드 관련기사
  • 핀란드 OTT 위앨에 아레나, AI를 이용해 넷플릭스를 뛰어 넘었다
  • ‘마음 읽어내는 장치’ 페이스북 손에서 나올까
  • [특별 기획] AI, 저널리즘을 부탁해! ① : 기자와 기레기
  • 키워드

    Tags #페이스북