(사진=셔터스톡).
(사진=셔터스톡).

2020년 미 대통령 선거가 조 바이든 전 부통령의 승리로 막을 내렸다. 바이든 당선인은 트럼프 대통령이 패배를 인정하지 않고 있음에도 불구하고 인수위원회를 구성하는 등 백악관 입성을 위한 준비를 서두르고 있다.

이번 대선은 그 어느 때보다 치열했던만큼 두 후보를 대상으로 실시하는 지지율 여론조사 역시 큰 뉴스거리였다. 그러나 한편으로는 전통적인 여론조사보다 AI가 큰 두각을 나타낸 대선 정국이기도 했다. 미 테크놀로지 전문매체 벤처비트는 최근 기존 여론조사 방법보다 훨씬 정확하게 승자를 예측한 AI 알고리즘에 대해 보도했다. 그러나 벤처비트는 아직까지는 AI를 절대적으로 믿을 수는 없다고 강조했다.

K코어 애널리틱스, 엑스퍼트AI, 어드밴스드 심볼릭스는 모두 이번 대선에서 바이든의 승리를 예측하는 AI를 개발한 회사 이름이다. 이들은 트위터, 페이스북 등 소셜미디어(SNS) 속 검색어를 빅데이터화 해 이같은 결론을 내렸다. 결과만 놓고 본다면 AI가 맞았다. 그러나 AI가 그와 같은 결론을 내기까지의 과정을 본다면 적지 않은 수의 오류를 발견할 수 있다. 세 AI 알고리즘이 각기 다른 퍼센티지로 바이든의 승리를 점친 것이다.

먼저 K코어 애널리틱스의 AI는 SNS 검색어에서 바이든이 우위에 있는 것을 이유로 들어 그가 약 8~9 퍼센트 격차로 ‘무난히’ 이길 것이라고 예측했다. 이탈리아 소재 엑스퍼트AI는 바이든이 50.2%, 트럼프가 47.3%의 득표율일 것이라고 결론지었다. 캐나다 오타와 대학이 개발한 어드밴스드 심볼릭스의 폴리는 전체 선거인단 투표 중 바이든이 372석을 확보할 것이라고 예상했다.

이같은 예측은 여지없이 빗나갔다. 실제 바이든 당선인은 선거인단의 과반인 270석을 얻는데까지 하루 이상의 시간이 걸렸다. 5개 경합주에서 두 후보는 역전을 반복했다. 여론조사와 마찬가지로 AI 예측결과 역시 어떠한 방법으로 사용했느냐에 따라 일부 차이가 날 수 있다.

엑스퍼트AI는 엔티티 식별 그래프를 활용하고 모델링함으로써 결과를 도출한다. 이 회사의 AI 알고리즘은 1부터 100까지 등급을 매겨 라벨의 순위를 매기고 여기에 바이든과 트럼프 이름이 검색어에 노출된 횟수를 곱한다. 이후 이들의 이름이 적힌 게시글 내용이 부정적인지 긍정적인지를 검토해 최종적으로 당선 가능성을 매기는 지표를 생성한다.

K코어 애널리틱스는 AI를 조금 다르게 활용해 바이든의 당선을 예측했다. 이 업체는 종단간 프레임워크를 활용해 10억개가 넘는 트윗 중 해시태그와 키워트를 분류했다. 폴리는 SNS상에서 게시글과 채팅으로 식별된 실제 미 유권자들의 28만개 이상의 포스팅을 기반으로 샘플을 수집했다.

K코어 애널리틱스의 AI가 SNS상에서 수집한 해쉬태그. 업체의 AI는 이를 기반으로 바이든과 트럼프 지지층을 나눠 최종 바이든이 대통령에 당선될 것이라고 예측했다. (사진=Kcore Analytics).
K코어 애널리틱스의 AI가 SNS상에서 수집한 해쉬태그. 업체의 AI는 이를 기반으로 바이든과 트럼프 지지층을 나눠 최종 바이든이 대통령에 당선될 것이라고 예측했다. (사진=Kcore Analytics).

AI로 선거 결과를 예측할 때 중요한 것은 실제 선거인단 개표와 일치하기 위해 다양한 모델을 학습하도록 알고리즘을 훈련해야 한다는 것이다. 또 지방 소도시와 소수집단 사정을 모두 고려해 알고리즘에 반영돼야 한다.

어드밴스드 심볼릭스는 자사가 운용하는 AI 폴리에 대해 이 점에서 완전히 실패했다고 말한다. 폴리는 바이든이 플로리다주에서 52.6%로 이길 것이라고 예측했지만 결과는 보기 좋게 트럼프의 승리였다. 업체는 AI 예측이 빗나간 이유에 대해 공화당 후보를 지지하는 쿠바계 미국인을 샘플에 포함시키지 못했기 때문으로 분석했다. 소수인종은 진보적 성향의 민주당을 지지할 것이라는 스테레오 타입이 잘못 작용한 탓이다.

시골지역도 AI가 예측하기 힘든 곳이다. 고령층이 주로 거주하는 지역으로 이들은 소셜미디어와 친숙하지 않다. 도시에서 벗어날수록 ‘샤이(숨어있는) 유권자’ 수는 증가한다. 이번 대선 기간 동안 이들을 AI 알고리즘에 포함하는 방법을 찾은 회사는 없었다.

그럼에도 불구하고 K코어 애널리틱스는 AI모델이 기존 여론조사보다 우수하다고 주장한다. 편향 문제만 해결한다면 잠재적 유권자를 대규모로 끌어모아 신속하게 결과를 예측할 수 있기 때문이다. K코어 애널리틱스의 AI는 과거 영국의 유럽연합 탈퇴 와 대만 총선을 80% 비율로 정확히 예측한 이력을 갖고 있다.

그러나 AI에게 선거결과 예측을 온전히 맡기기에는 넘어야 할 장애물이 많다. 최근 경제전문지 포춘은 언제든지 바뀔 수 있는 유권자·선거인단 마음, 법적문제 등을 이유로 들며 AI 알고리즘의 한계를 지적했다. 성소수자나 이민자 집단에서도 얼마든지 트럼프 지지자가 나타날 수 있는데 AI는 그와 같은 예외보다 대세를 따르는 경우가 많은 것이다.

앤드류 갤먼 컬럼비아대 통계학 및 정치학교수는 “이번 대선에서 AI가 소셜미디어 검색어를 주요 예측 툴로 사용한 것은 아쉬운 부분”이라며 “예를 들어 지난 2016년 정당 투표 점유율을 기반으로 알고리즘을 조정했다면 좀더 정확한 수치로 바이든의 승리를 예견했을 것”이라고 조언했다.

바이든과 트럼프 합친 AI, 진정한 미국대통령은?

아마존ㆍMS 등 빅테크 기업이 바이든 대통령 당선을 축하한 이유는

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지