소셜 미디어·검색 키워드 빅데이터 분석했으면 가능할 듯
"역대 선거 결과 데이터로만 분석한다면 예측 불가능"
정확도 높이기 위한 표본추출 편향 등 변수 보완 필요

이준석 국민의힘 당대표 후보가 여론조사에서 당내 중진 후보들을 압도하고 있다. 이 같은 초유의 현상을 인공지능은 예측할 수 있었을까. 전문가들은 SNS 키워드 분석을 통해 충분히 가능했을 것이라 분석한다. AI 분석 프로그램 등이 향후 선거 결과 분석 측면에서 활발하게 활용될 것으로 전망된다.  
이준석 국민의힘 당대표 후보가 여론조사에서 당내 중진 후보들을 압도하고 있다. 이 같은 초유의 현상을 인공지능은 예측할 수 있었을까. 전문가들은 SNS 키워드 분석을 통해 충분히 가능했을 것이라 분석한다. AI 분석 프로그램 등이 향후 선거 결과 분석 측면에서 활발하게 활용될 것으로 전망된다.   (사진=셔터스톡, 뉴스1) 

국민의힘 대표 경선에서 이준석 국민의힘 후보(전 최고위원)의 돌풍이 일고 있다. 이준석 후보는 지난 5월 28일 예비경선에서 종합 득표율 41%를 얻어 4~5선의 쟁쟁한 중진들을 제치고 1위에 올랐다. 국회의원 경력이 전무한 이른바 ‘30대, 0선(選)’의 신예가 중진 의원들을 압도한 것은 이변 중 이변이다. 초유의 '이준석 돌풍', AI는 예측할 수 있었을까.

이준석 후보는 지난 5월 30일 광주 김대중컨벤션센터에서 열린 제1차 전당대회 광주·전북·전남·제주 합동연설회에 참석해 “저는 80년 광주에 대한 개인적인, 시대적인 죄책감을 뒤로하고 광주민주화운동의 정신을 자유롭게 체득한 첫 세대”라며 "호남의 젊은 세대와 소통해 나가겠다"고 했다. 이 후보의 최근 행보를 놓고 호남 지역민들은 "1962년 박정희 대항마로 부상하던 김영삼(35세)·김대중(38세)의 30대 기수론 이후 처음 겪는 현상"이라고 평가한다.

실제 우리 정치사에서 ‘0선’의 30대가 이렇게 파란을 일으킨 사례는 60년대 이후 처음이다. 30~40년 정치 경력을 가진 정가 관계자들도 예측하지 못했다는 반응이다. 정치적 경험과 경륜로 분석이 되지 않는다는 것. 그렇다면 인공지능이라면 이 같은 현상을 예측할 수 있었을까. 전문가들의 의견을 종합해, 결론부터 얘기하자면 '충분히 가능했다'이다.

지난해 11월 예측불허 접전으로 전개됐던 미국 대통령 선거는 인공지능(AIㆍArtificial Intelligence)이 전 세계적 관심을 받는 계기였다. 뉴욕시립대 통계물리학자인 헤르난 막세 박사가 개발한 AI 프로그램은 대선 며칠 전부터 "바이든이 당선될 것"이라고 예측했다. AI는 트위터를 중심으로 소셜 미디어를 정밀 스캔, 수많은 사람들의 의견을 수집함으로써 누가 당선될지를 예측했다. 그리고 AI는 차기 대통령을 정확히 맞춰냈다.

지난해 전 세계의 관심을 받았던 미국 대통령 선거에서 AI 프로그램이 조 바이든을 당선자로 예측한 바 있다. 예측을 위해 트위터 내 트윗 10억 개를 조사한 것으로 알려졌다. 
지난해 전 세계의 관심을 받았던 미국 대통령 선거에서 AI 프로그램이 조 바이든을 당선자로 예측한 바 있다. 예측을 위해 트위터 내 트윗 10억 개를 조사한 것으로 알려졌다. 

연구진은 지난 선거부터 지금까지 수집한 방대한 양의 정보를 토대로 신경망을 훈련시켜 AI 기계학습(ML)을 이용해 소셜 미디어 사용자의 의견을 예측하고자 했다. 이를 통해 결과에 대한 통계분석을 거쳐 유력 후보를 점쳐보는 것이다. 트위터에서 조사한 트윗의 수는 거의 10억 개에 달했다는 후문이다.

'이준석 돌풍'도 이 같은 소셜 미디어와 검색 데이터로 예측이 가능했다는 게 전문가들의 의견이다. 허정규 전남대학교 통계학과 교수는 "미국 대선 적용됐던 것처럼 검색 빈도수나 연관검색어의 긍정 또는 부정을 분석하면 가능할 것으로 보인다. 핵심은 그런 키워드가 얼마나 빈번하게 검색되는가를 살펴봐야 한다"며 "SNS나 검색 결과가 아닌 그간의 선거 결과를 데이터로 분석했다고 가정하면 이 같은 현상을 예측하긴 어렵다"고 밝혔다.

한편 소셜 미디어 분석 결과에 대한 정확성 논란은 꾸준히 이어지고 있다. 트위터나 페이스북 같은 SNS의 경우 특정 연령대와 특정 성향의 소비자가 몰리기 때문에 표본추출이 편향적이라는 것이다. 이에 대해 한 AI 업계 관계자는 "표집 편향성과 투표율 예측 등 과제를 해결할 수 있다면 기존 여론조사 보다 AI의 예측이 더 정확해질 것"이라며 "선행 사례들을 살펴봤을 때 기술의 발전 속도가 더욱 빨라질 것으로 전망된다"고 말했다.

허정규 전남대학교 교수도 "AI가 선행지식 등 더욱 다양한 데이터를 수집한다면 표집 편향성 문제를 해결할 수 있을 것"이라고 밝혔다. 앞서 국내에서도 한 AI 전문 업체가 제19대 대통령 선거 당선자를 예측결과를 발표한 바 있다. 해당 업체도 SNS 검색 데이터를 활용해 분석했고, 후보별 당선율을 거의 유사한 값으로 맞췄다. 업체 연구진은 “인터넷 상의 후보자별 관심도를 나타낸 단순 데이터지만 여론 조사의 지지율 추이와 일부 비슷한 흐름으로 선행하는 모습”이라고 밝힌 바 있다.

AI타임스 유형동 기자 yhd@aitimes.com

키워드 관련기사
  • 바이든 당선 예측성공한 AI, 아직 고칠 게 많다
  • “트럼프냐 바이든이냐”…인공지능(AI)의 선택은?
  • "AI‧IoT 기술로 낙지 농사까지"…4차 기술로 똑똑해지는 전남 농어촌