하버드 연구팀, 카네기멜론대 및 런던대와 협업으로 예측 알고리즘 개발

(사진=셔터스톡).
(사진=셔터스톡).

미국 연구진이 구글과 트위터를 실시간으로 모니터링해 코로나19 발생 건수를 2주 전에 예측할 수 있는 알고리즘을 개발했다.

뉴욕타임스(NYT)는 2일(현지시간) 마우리시오 산틸라나 하버드대 교수팀이 카네기멜론, 런던컬리지 연구팀과 협업, 인터넷 검색어와 스마트폰 모빌리티 데이터를 스트리밍하는 방법으로 각 지역의 코로나바이러스 확산 추이를 연구해 이같은 알고리즘 시스템을 개발했다고 보도했다.

미국은 최근 플로리다, 캘리포니아, 텍사스 등지에서 정확한 경보 시스템이 없어 코로나 바이러스가 무서운 속도로 확산되고 있다. 플로리다는 1일 하루 동안 1만명 이상 확진자가 발생했다. 캘리포니아는 누적 확진자 24만명을 넘어섰고, 텍사스는 전체 확진자가 18만2000명에 달한다.

로렌 메이어스 텍사스 오스틴대학 생물학ㆍ통계학 교수는 "이번 연구는 차세대 데이터 출처가 코로나19 유병률 상승의 초기 신호를 제공할 수 있다는 것을 보여준다"고 설명했다.

연구팀은 연구 결과를 담은 논문을 아시브.org에 게재했다. 네 가지 출처의 실시간 데이터를 분석해 알고리즘을 완성했다는 내용이다. 출처는 구글과 트위터 및 구글과 애플 협업으로 개발한 위치 추적기와 그 외 이동경로를 확인할 수 있는 앱 데이터, 킨사에서 개발한 온도계와 실시간 연동할 수 있는 앱이다. 이 네 가지 소스는 사람들이 어떻게 움직이고 상호작용하는지 기초해 노딕대학에서 개발한 정교한 예측 모델과 데이터 스트림을 통합했다.

새로운 시스템은 앞으로 네브라스카와 뉴햄프셔는 추가 조치를 취하지 않을 경우 앞으로 몇 주 동안 사례가 증가할 것으로 예측하고 있다.

연구팀을 이끈 산틸라나 교수는 “각 주정부나 공중보건소에서 이 시스템을 도입한다면 큰 확진세를 보이기 14일 전에 그에 맞는 솔루션을 준비할 수 있을 것”이라고 말했다. 바이러스 재확산을 막고 의료기관과 정부가 빨리 대처할 수 있도록 돕는 역할을 한다는 것이다.

연구팀은 각 주에서 3월과 4월에 사건 및 사망 건수와 상관관계가 어떻게 있는지 살펴 데이터 스트림 추세의 예측 가치를 시험했다.

예를 들어, 뉴욕에서 코로나바이러스 관련 트위터 글의 급격한 증가 추세는 3월 중순에 사례 수가 폭발하기 일주일 전에 시작됐다.

연구진은 모든 데이터 소스를 결합해 다가올 코로나 확진사례 증가를 가정해 각각의 데이터 출처에 가중치를 부여했다. 연구진은 이렇게 합쳐 완성된 알고리즘이 평균 21일까지 발병을 예상했다고 밝혔다.

이렇게 실시간 데이터 분석을 통해 질병 진행 상황을 가늠하는 연구는 처음이 아니다. 지난 2008년 구글 엔지니어들은 감기 증상·관절 통증·타미플루 복용량 등과 같은 단어의 검색 추이를 추적 실험을 시작했다.

이른바 ‘구글 독감 트렌드 알고리즘’은 그 당시 성능이 좋지 않았다. 검색을 실시간 모니터링 해 빅데이터로 축적하는 과정에서 오류가 생긴 것이다. 시스템은 의료진단이나 증상추이를 계속해서 과대평가 했다. 당시 구글팀은 실제 질병과 무관한 내용까지 잡아내는 데이터 한계와 외부 요인의 영향을 절감했다.

그 이후 연구원들은 구글 검색과 다른 종류의 데이터를 결합하면서 이 접근법에 대해 여러 가지 조정을 시도했다. 카네기멜론 대학, 유니버시티 칼리지 런던, 텍사스 대학은 실시간 데이터 분석을 통합한 모델을 가지고 있다. 산틸라나 하버드대 교수 연구팀은 이들과 협업해 빅데이터를 구축할 수 있었다.

일각에서는 빅데이터 분석이 모든 사회적 상황을 예측하기는 어렵다며 알고리즘 개발을 놓고 회의적인 입장을 내놓고 있다. 예를 들어, 조지 플로이드의 살해 이후 전국적 폭력 시위를 예측한 알고리즘은 없는 것이다.

그러나 적어도 코로나 대유행병에 있어 현재 미국내 공중보건기관 보다 알고리즘이 뛰어난 것만은 사실이다. 대부분 의학 전문가들은 코로나바이러스의 지속적인 확산세와 공중보건 인프라가 불충분하다는 점을 고려할 때 이번 연구팀이 개발한 알고리즘을 환영하고 있다.

[관련기사] 스탠포드, 역동적 환경에 맞는 AI 강화학습 발굴

[관련기사] 美 ‘국가 AI연구클라우드’ 추진···중국 AI패권 저지 목적