페이스북, AI 딥페이크 탐지 기술 개발 위해 DB 10만개 공개
‘딥페이크 탐지 챌린지(DFDC)’ 결과 공유…우승 모델 정확도 65%

(사진=Facebook).
이 중 1, 4, 6번만 진짜고 나머지 2, 3, 5번은 딥페이크다. (사진=Facebook).

어느 것이 딥페이크(Deepfake) 영상이고 어느 것이 진짜 영상일까?

페이스북이 딥페이크 퇴치를 위해 10만개의 딥페이크 데이터베이스를 공개했다. 전 세계적으로 딥페이크 확산에 따른 피해를 우려하는 목소리가 높아지는 상황이어서 이같은 페이스북 행보가 딥페이크 근절에 어느만큼 기여할 수 있을지 주목된다.

MIT테크놀로지리뷰를 비롯한 외신은 페이스북이 인공지능(AI) 딥페이크 탐지 기술 개발 촉진을 위해 지난해 12월부터 지난 3월 31일까지 개최한 ‘딥페이크 탐지 챌린지(DFDC, Deepfake Detection Challenge)' 결과를 공유하고, 그동안 확보한 10만개 분량의 데이터베이스(DB)를 공개했다고 12일(현지시간) 전했다.

딥페이크는 딥러닝과 페이크의 합성어다. AI 기술 기반 알고리즘을 활용해 조작한 이미지나 동영상을 말한다. 최근 딥페이크를 악용하는 사례가 늘어나 사회적 문제가 되고 있다. 사이버보안 전문업체 딥트레이스랩스가 지난해 10월 발표한 보고서에 따르면 온라인에 게재된 딥페이크 수가 지난 7개월간 약 1만5000개로 집계되며 빠르게 증가하고 있는 것으로 나타났다.

이에 페이스북을 비롯한 소셜미디어 기업들은 AI를 활용해 딥페이크 퇴치에 나서고 있다. 페이스북은 딥페이크 영상을 식별하도록 AI를 훈련시키기 위해 3426명의 배우를 바탕으로 기존 페이스 스와핑 기술 등을 사용해 제작된 10만개 이상의 클립영상인 딥페이크 데이터세트를 내놨다.

(사진=Facebook).
(사진=Facebook).

또 페이스북은 ‘딥페이크 탐지 챌린지’의 우승자도 발표했다. 이번 챌린지는 마이크로소프트(MS)와 아마존웹서비스(AWS) 등과의 협업으로 진행됐다. 총 2114명이 대회에 참가해 페이스북의 데이터세트로 훈련받은 3만5000여개의 모델을 제출했다.

챌린지의 우승은 매핑 데이터 스타트업인 ‘맵박스(Mapbox)’의 셀림 세페르베코프 기계학습 엔지니어에게 돌아갔다. 세페르베코프가 개발한 모델은 페이스북이 만든 새로운 영상과 기존 인터넷상의 영상을 혼합하는 등 이전에 볼 수 없었던 1만 개의 클립 세트에서 테스트한 결과 65%의 정확도로 딥페이크 영상 여부를 식별해낼 수 있었다.

페이스북은 챌린지 수상 모델 가운데 어떤 모델도 자사의 사이트에서 사용할 계획이 없다고 밝혔다. 약 65%의 정확도로는 충분하지 않다는 이야기다. 일부 모델의 경우 훈련 데이터에서는 80% 이상의 정확도를 보이기도 했으나 처음 보는 클립에서는 정확도가 크게 떨어졌다.

페이스북은 이미지나 영상 그 자체 분석을 넘어 맥락이나 출처 등을 평가하는 기술을 활용하면 디페이크 탐지 성능을 개선할 수 있을 것이라고 설명했다.

이번 챌린지에서 수상한 모델들은 오픈소스로 이용 가능하다. 현재 페이스북은 자체 딥페이크 탐지 제품을 개발 중인 것으로 알려졌다.

 

[관련기사] 딥 페이크, 신기술의 빛과 그림자

[관련기사] 페이스북, '딥페이크' 조작 동영상 게재 금지한다