기계학습 툴 사용···서사의 요소·연결성을 그래프로 표시해 구별

각 게시물에 숨겨진 이야기 한 조각 취급···사람·장소·사물 식별

실제사건은 요소가 제거돼도 살아남아 연결망 지속 가능성 암시

가짜 사건 음모론, 사람·장소·사물관계 제거하자 상호연결성 단절

 

▲캘리포니아대의 연구진은 사람, 장소, 사물, 그리고 그들의 관계에 기초해 서술내용(내러티브)를 식별할 수 있는 기계학습 도구 세트를 개발했다. 이 기계학습 알고리즘은 대량의 데이터를 처리해 데이터안에서 사물의 범주를 결정한 다음 특정 사물이 어떤 범주에 속하는지 식별한다. (사진=위키피디아)
▲캘리포니아대의 연구진은 사람, 장소, 사물, 그리고 그들의 관계에 기초해 서술내용(내러티브)를 식별할 수 있는 기계학습 도구 세트를 개발했다. 이 기계학습 알고리즘은 대량의 데이터를 처리해 데이터안에서 사물의 범주를 결정한 다음 특정 사물이 어떤 범주에 속하는지 식별한다. (사진=위키피디아)

 

온라인상에 떠도는 음모론 서술(이야기)과 실제 음모를 구분해 주는 인공지능(AI) 도구가 미국에서 개발됐다. 연구진의 AI 툴 분석 결과, 진짜 음모는 점과 그래프로 표시된 몇 가지 서사 요소를 제거해도 연결성이 유지된 반면, 가짜인 음모론은 서술을 구성하고 있는 사람들·장소·사물·관계 요소를 제거하자 현실을 보여주는 그래프 연결성이 단절됐다. 

미국 하버드대 니먼랩은 16일(현지시각) 미 캘리포니아대 연구팀이 음모론 구별 AI툴을 개발해 지난 2016년 있었던 미국의 대표적 음모론인 ‘피자게이트(Pizaa gate)’의 사례와 실제 발생한 정치보복 음모인 ‘브릿지게이트(Bridgegate)’ 등에 적용해 성과를 확인했다며 이를 소개했다. 

브와니 로이초두리와 티모시 탠저리니가 이끄는 캘리포니아대 문화분석 그룹은 소셜미디어에서의 대화가 언제 음모이론화의 숨길 수 없는 징후를 반영하는지 자동 판단하는 접근법을 개발했다.

이들은 이러한 방법들을 피자게이트 연구, 코로나19 팬데믹, 그리고 예방접종 반대 운동에 적용해 성과를 확인했다. 이들은 지난 2016년 4월부터 2018년 2월까지 피자게이트가 논의된 소셜미디어 사이트 레딧과 포챈(4chan) 포럼에 올라온 1만7498개의 게시물을 분석해 이를 확인했다.

2016년 당시 한 남자가 총을 들고 워싱턴D.C.의 한 피자집에 침입했는데 경찰이 긴급출동해 남자를 수갑채워 수색하면서 “왜 그곳에 있었느냐”고 묻자 그는 “소아성애자 범죄단을 조사하라”고 대답했다. 의아해 하는 그에게 또다른 경찰이 끼어들어 “피자게이트, 피자게이트 얘기를 하고 있는 거야”라고 말했다. 그는 4년 징역형을 선고 받았다. 이 남자가 말한 ‘피자게이트’는 지난 2016년 미국 대선에 앞서 피자게이트의 지지자들이 코멧핑퐁(Comet PingPong) 피자집을 가상의 아동성범죄 집단과 연결시켰으나 허구로 드러난 대표적 음모론이다.

2016년 3월 힐러리 클린턴 선거대책본부장이었던 존 포데스타의 개인 이메일 계정이 스피어피싱 공격으로 해킹당하며 유출된 그의 이메일을 그 해 11월 위키리크스가 공개하면서 음모론이 제기되기 시작했다. 이 이메일에 몇몇 민주당 고위 관리들과 미국 식당들이 인신매매 및 아동섹스 범죄 집단과 연관된 암호화된 메시지가 포함되어 있다고 피자게이트 음모론의 지지자들이 거짓으로 주장하기 시작했다. 이 이메일을 놓고 클린턴 기소를 촉구했던 극우 보수 언론인 등은 4챈(4chan), 8챈(8chan), 트위터 등 소셜미디어에 음모론을 퍼뜨렸다.

이에 노스캐롤라이나 출신의 한 남자가 그 음모를 조사하기 위해 코멧 핑퐁 피자집으로 가서 식당 안에서 AR15 소총을 발사하는 사건으로 이어졌다. 식당 주인과 직원들도 음모론자들로부터 살해 위협을 받았다. 피자게이트는 또다른 미국 우파 중심 음모론인 큐아논(QAnon) 음모론의 전신으로 여겨진다. 피자게이트는 미 대선의 해인 올해 부활했다.

이 AI툴 개발자는 “상당한 피해를 줄 수 있는 잠재력을 지닌 음모론들이 소셜 미디어에서 환영받는 고향을 찾고 있을 때 중용의 길에서 자유로와진 이곳 SNS 포럼은 같은 생각을 가진 사람들과 대화할 수 있게 해 주었다.

이들은 여기서 자신들의 이론을 발전시키고 그들이 밝혀낸 위협에 대항하기 위한 행동을 제안할 수 있다”며 이를 분간해 내는 AI툴 개발배경을 설명했다. 그는 이 툴이 잘못 이용될 가능성도 배제하지 않았다. 

◆기계학습 도구 사용해 서사의 요소와 연결을 그래프로 표시

소셜미디어에 뜨는 서사(narrative)들이 근거없는 음모론인지 어떻게 알 수 있을까? 

연구진은 기계학습 도구를 사용해 서사의 요소와 연결을 그래프로 표시함으로써 음모론과 진정한 음모를 구별할 수 있다는 것을 보여주었다고 밝혔다. 

이러한 도구들은 현실세계에서 위협을 가하는 온라인 상의 이야기들을 당국에 알리기 위한 조기 경고 시스템의 토대를 형성할 수 있다.

캘리포니아대 연구진은 현재 이런 방법들을 ‘큐아논(QAnon)’ 음모론 연구에 적용해 연구하고 있다.

큐아논(QAnon)은 미 민주당 유력인사와 유명인들을 ‘딥 스테이트(Deep State)’의 하수인으로 보고, 도널드 트럼프를 이에 맞서 세계를 구할 메시아로 여기는 ‘음모론’ 집단과 그 집단의 이론을 총칭한다.

큐아논 음모론의 뼈대는 딥 스테이트들이 영생을 위해 아이들의 몸에서 특수한 물질을 뽑아내며, 이를 위해 아이들을 인신매매한다. 아이 납치를 막기 위해선 트럼프를 지지해야 하며, 이는 ‘백인 아이들의 미래’를 지켜야 한다는 백인 우월주의 세계관으로 이어진다.

뉴스위크는 야후 온라인조사를 인용, ‘트럼프 지지자는 17%만이 큐아논 음모론을 믿지 않는다’고 보도했다. 트럼프 지지자들의 87%가 큐아논 음모론을 믿는다는 해석이 가능한 조사 결과다. 대표적 SNS인 페이스북과 유튜브가 미국의 인종주의 단체이자 신흥 극우주의 음모론 사이트인 큐아논의 계정에 대한 차단 조치를 내렸다.

페이스북은 지난달 6일 큐아논 관련 계정 전면 폐쇄 결정을 내렸다. 유튜브는 10월 15일 자로 음모론을 담은 동영상에 관해 새로운 규칙을 적용했지만 전면 폐쇄하지는 않았다. 

◆음모론과 음모의 차이···협업을 통해 구성되고 빠르게 형성되는가?
 
실제 음모들은 고의적으로 숨겨져 있고, 자신의 악의적 목적을 위해 함께 일하는 사람들의 실제 행동이다. 

이와는 대조적으로 음모론은 협력적으로 구성되며 공공연하게 전개된다. 음모론은 의도적으로 복잡하며 포괄적인 세계관을 반영한다. 음모론은 한 가지를 설명하려고 하는 대신 대개 존재하지 않아 그대로 숨겨져 있었을 인간 상호작용 영역들 사이의 연결성을 발견해 모든 것을 설명하려고 노력한다. 

음모 이론가의 인기 있는 이미지는 외로운 늑대가 사진과 붉은 끈으로 엉켜 있는 혼란스런 관계를 형성하는 사진이었지만, 소셜미디어 시대에는 더 이상 적용되지 않는다.

이제 음모 이론화는 온라인으로 옮겨갔고 집단 스토리텔링의 최종 산물이 됐다. 참여자들은 이야기에 들어가는 사람, 장소, 사물, 그리고 그들의 관계와 같은 서술적 틀의 매개변수를 알아낸다.

음모론 이론화라는 온라인상의 성격은 연구자들에게 일련의 체계없는 루머와 이야기 조각들로 이뤄진 기원에서부터 완벽한 서사에 이르는 이 이론들의 발전과정을 추적할 수 있는 기회를 제공한다.

AI개발자들에게 지난 2016년 발생한 저 유명한 ‘피자게이트(Pizzagate)’는 캘리포니아대 연구진들의 음모론을 분간해 내는 AI툴 개발 작업을 위한 완벽한 주제를 제시했다.

피자게이트는 대선을 앞둔 지난 2016년 10월 말부터 개발되기 시작했다. 한 달 만에 완전히 형성되었으며, 그렇지 않았다면 연결되지 않았던 일련의 도메인에서 완전한 등장인물이 만들어졌다.

즉, 민주당의 정치, 민주당 힐러리 선거대책본부장 포데스타 형제의 사생활, 캐주얼한 가족 식사, 흉악한 소아성애자들의 인신매매 이야기가 날조됐다. 이와 상관 없는 다른 이질적 도메인들과의 연결고리가 된 것은 위키리크스가 지난 2016년 10월 마지막 주에 공개한 유출된 이메일에 대한 공상적인 해석이었다.

◆AI의 음모론 서술 분석 방식

연구진은 사람, 장소, 사물, 그리고 그들의 관계에 기초해 서술내용를 식별할 수 있는 기계학습 도구 세트를 개발했다. 이 기계학습 알고리즘은 대량의 데이터를 처리해 데이터 안에서 사물의 범주를 결정한 다음 특정 사물이 어떤 범주에 속하는지 식별한다.

연구진은 지난 2016년 4월부터 2018년 2월까지 피자게이트가 논의된 소셜미디어 사이트 레드딧과 포챈(4chan) 포럼에 올라온 1만7498개의 게시물을 분석해 봤다. 

이들의 AI 모델은 각각의 게시물을 숨겨진 이야기의 한 조각으로 취급하고 그 이야기를 밝히기 시작한다. 이 소프트웨어는 게시물에 있는 사람, 장소, 사물을 식별하고 어떤 요소가 주요 요소인지, 어떤 요소가 사소한 요소인지, 어떻게 이들이 모두 연결되는지 판단했다.

AI모델은 피자게이트, 민주당 정치, 민주당 선거캠프의 포데스타 형제, 캐주얼 식사, 사탄주의, 위키리크스 등의 경우에서 주요 층이 무엇인지, 그리고 그 층들이 어떻게 합쳐져 전체적으로 이야기를 형성하는지를 결정했다. 

연구진은 이 방법이 정확한 결과물(아웃풋)을 냈다는 것을 확인하기 위해 자신들의 AI모델이 만든 서술형 프레임워크 그래프를 뉴욕 타임즈에 게재된 삽화와 비교했다. 이 그래프는 그 그림들과 일치했고, 또한 사람들, 장소, 사물들과 그들의 관계에 대한 더 세밀한 수준의 세부사항들을 제공했다.

◆굳건한 진실 vs 깨지기 쉬운 허구

연구진은 이 AI툴로 음모론과 실제 음모를 구분할 수 있는지 알아보기 위해 공화당 출신 크리스 크리스티 주지사 부하직원들이 민주당 출신 포트 리 뉴저지 시장에 대해 행한 정치적 보복 작전인 브릿지게이트(Bridgegate)를 살펴봤다.

두 개의 별개 수집 내용을 사용해 기계학습 시스템의 결과를 비교했을 때, 음모론의 서술적 프레임워크에서 두 가지 뚜렷한 특징이 두드러졌다.

먼저 브릿지게이트에 대한 서술형 그래프가 만들어지기까지는 2013년부터 2020년까지 기간이 필요했던 반면, 피자게이트의 그래프는 한 달 기간만으로도 완전히 형성돼 안정됐다.

둘째, 브릿지게이트의 그래프는 요소가 제거된 채 살아남아 스캔들로 인한 핵심 인물과 관계가 삭제되더라도 뉴저지 정치가 하나의 연결망으로 이어질 것임을 시사했다.

이와는 대조적으로 피자게이트 그래프는 더 작은 서브그래프로 쉽게 분할됐다. 위키리크스가 발표한 이메일의 해석에서 직접 나온 사람들, 장소, 사물, 관계를 제거했을 때 현실을 보여주는 그래프는 ‘서로 연결되지 않는’ 정치, 캐주얼한 식사, 포데스타 형제들의 사생활, 괴상한 사탄주의의 세계 같은 영역으로 떨어졌다. 

아래 그림에서 녹색 평면은 서술(음모론 이야기)의 주요 층이고 점은 서술의 주요 요소들이다.  파란색 선은 층 내부 요소들 사이의 연결부, 빨간색 선은 층을 가로지르는 요소들 사이의 연결부들이다.

보라색 평면은 점들이 어떻게 연결되어 있는지 보여주면서 모든 층들을 보여준다. 위키리크스 평면을 제거하면 점들이 작은 그룹들과만 연결된 보라색 평면이 나온다.

▲그림에서 녹색 평면은 서술(음모론 이야기)의 주요 층이고 점은 서술의 주요 요소들이다.  파란색 선은 층 내부 요소들 사이의 연결부, 빨간색 선은 층을 가로지르는 요소들 사이의 연결부들이다. 보라색 평면은 점들이 어떻게 연결되어 있는지 보여주면서 모든 층들을 보여준다. 위키리크스 평면을 제거하면 점들이 작은 그룹들과만 연결된 보라색 평면이 나온다. (사진=캘리포니아대)
▲그림에서 녹색 평면은 서술(음모론 이야기)의 주요 층이고 점은 서술의 주요 요소들이다.  파란색 선은 층 내부 요소들 사이의 연결부, 빨간색 선은 층을 가로지르는 요소들 사이의 연결부들이다. 보라색 평면은 점들이 어떻게 연결되어 있는지 보여주면서 모든 층들을 보여준다. 위키리크스 평면을 제거하면 점들이 작은 그룹들과만 연결된 보라색 평면이 나온다. (사진=캘리포니아대)

 

◆조기 경보 시스템?...오히려 악용될 수도 

연구자들은 이 작업 결과에도 명백한 윤리적 과제들이 제기된다고 밝히고 있다. 예를 들어 이 방법들은 토론의 뿌리에 있는 이야기 틀에 맞는 음모론적 논의에 추가 게시물을 생성하는 데 사용될 수 있다. 마찬가지로, 어떤 도메인 세트가 주어진다면, 누군가는 그 도구를 사용하여 완전히 새로운 음모론을 개발할 수 있을 것이다. 

그러나 AI개발자들이 소셜미디어 포럼에 대한 연구에서 분명히 밝히고 있듯이 이러한 스토리텔링의 무기화는 이미 자동적인 방법을 사용하지 않고도 일어나고 있다.

연구 공동체(커뮤니티)의 역할은 그 무기화가 어떻게 발생하는지를 알아내고, 다른 사람들이 이를 이해할 수 있도록 돕고, 공공안전과 민주기관을 지키는 사람과 단체를 위한 도구를 개발하는 것이다. 

음모론 서술의 출현과 정렬을 추적하는 조기 경고 시스템 개발은 연구자 및 당국에 이러한 서술에 기반해 사람들이 취하게 될 실제 행동에 대해 경고할 수 있다. 

그런 시스템이 갖춰져 있었더라면, 지난 2016년 경찰이 워싱턴 D.C.에 있는 피자집에 AR 15총을 들고 들어간 남자를 체포하면서 “왜 이 집에 왔느냐?”고 물었을 때 나온 그의 대답에 당황하지 않았을 것이다. 

키워드 관련기사
  • GPT-3 기반 인공지능이 사람행세 고민 상담하다 들통
  • 美 연구진, GPT3 가짜뉴스 생성 가능성 경고
  • 트위터, 코로나 가짜뉴스에 ‘경고 라벨’
  • 키워드

    Tags #AI #SNS #음모론