미 MIT 연구진, AI 기반 자동 텍스트 생성 시스템 개발
오래된 정보 식별·수정…인간의 작성·편집 스타일 유지
아직 상용화 단계 아냐…향후 가짜뉴스 근절 기여 기대

(사진=Christine Daniloff, MIT). ©AI타임스
(사진=Christine Daniloff, MIT). ©AI타임스

(AI타임스=윤영주 기자) 최근 미국 매사추세츠공과대학교(MIT) 연구진이 온라인 백과사전 위키피디아(Wikipedia)에 게재된 부정확하고 오래된 정보를 식별·수정해 자동으로 업데이트할 수 있는 AI 시스템을 개발했다.

위키피디아는 인터넷 상에서 누구든지 자유롭게 정보를 올리고 기존에 작성된 내용을 수정·보완할 수 있는 집단지성에 기초한 온라인 백과사전이다. 현재 위키피디아에는 300여 개의 다양한 언어로 작성된 5천만 건 이상의 글들이 게재돼 있고 하루에도 수많은 글들이 올라온다. 또 그 글들은 대개 사람들이 자발적으로 참여해 수동으로 작성돼 왔다. 그러다보니 최신 정보가 곧바로 업데이트되기 어렵고 올라온 정보 가운데 잘못된 정보나 오래된 정보도 그대로 방치되는 경우가 많다.

미국 IT 전문매체 ‘엔가젯(Engadget)’ 등 외신보도에 따르면 MIT의 연구진은 이 같은 위키피디아의 문제점을 보완·해결하고자 기계학습을 통한 AI 기반 자동 텍스트 생성 시스템을 개발했다. 해당 시스템은 위키피디아에 올라와 있는 글들 가운데 수정이 필요한 내용을 찾아내 인간이 작성·편집했던 방식과 유사하게 원문의 문체를 그대로 유지하면서 업데이트할 수 있다.

그러나 인간의 역할이 없는 건 아니다. 우선 전용 인터페이스에 새롭게 업데이트된 정보를 입력하는 작업이 필요하다. 입력 시 문체나 문법사항은 신경 쓰지 않아도 되며 완벽한 문장일 필요도 없다. 이후 AI가 위키피디아 문서를 검토하며 최신 정보와 모순된 내용이 담긴 문장을 찾아내 해당 정보를 원문의 나머지 내용들과 조화롭게 가독성 높은 자연스러운 문장으로 재작성하는 것이다.

이번에 MIT가 개발한 AI 시스템은 아직 초기단계로 상용화되기까지 시간이 필요하다. 시스템 정확성에 대한 평가 결과 해당 시스템은 정보 업데이트 영역과 문법 영역에서 5점 만점 기준 각각 4점과 3.85점을 받았다. 물론 기존의 다른 텍스트 생성 시스템들과 비교하면 고무적인 성과임에는 틀림없다.

향후 이 AI 시스템이 상용화될 경우 위키피디아 문서의 자동 업데이트를 통해 편집 시간을 단축하고 정보의 신뢰성을 높일 수 있는 것은 물론 더 나아가 가짜뉴스를 근절하는 데 기여할 수도 있을 것이다. 연구진은 이 시스템이 가짜뉴스 탐지 장치 훈련을 위한 데이터 세트 보완 작업에 사용될 수 있을 것으로 기대하고 있다. 특히 익명성을 악용해 특정인의 명예를 훼손하고 거짓 정보를 올리는 등 사이버상의 질서를 파괴하는 사이버 반달리즘(vandalism) 예방에도 도움이 될 전망이다.