'COVID-19 문헌지식 그래프 작성 및 약물 복용 보고서 생성' 보고서

(사진=셔터스톡)
(사진=셔터스톡)

해외 연구진이 코로나19 연구에 도움을 줄 수 있는 인공지능(AI) 시스템을 개발했다. 수만 건에 달하는 연구 보고서를 빠르게 살펴볼 수 있는 시스템이다.

벤처비트는 2일(현지시간) 미국 고등연구계획국(DARPA)을 비롯해 컬럼비아와 브랜다이스, UCLA, UIUC 등 연구진이 논문 속 방대한 양의 생물의학 지식을 빠르게 확인 및 분석할 수 있는 새로운 프레임워크 'COVID-KG'를 개발했다고 전했다.

연구진이 발표한 'COVID-19 문헌지식 그래프 작성 및 약물 복용 보고서 생성' 보고서에 따르면, COVID-KG는 노드와 엣지로 구성된 멀티미디어 지식 그래프를 구축할 수 있도록 논문을 읽고 과제를 해결한다. 노드는 논문 텍스트와 이미지에서 추출한 개체 및 개념을 말하고, 엣지는 노드 속 개체와 관련한 관계를 뜻한다.

COVID-KG는 유전자와 질병, 화학 물질 등을 포함한 개체 유형, 메커니즘, 치료법을 수집한다. 또 바이러스성 단백질과 진화, 면역 반응 등 오픈 소스 데이터 세트에서 주석을 단 개체에도 활용할 수 있다.

시각 정보를 추출할 수도 있다. 현미경 이미지나 상관관계 도표 등에서 시각적 정보를 추출, 지식 그래프 질적 정보를 높인다. 우선, 각각의 문서에 담긴 이미지 해설이나 참조 내용에서 수치를 검출 및 분리한다. 이후 컴퓨터 비전을 적용해 중복하지 않는 영역을 포착 및 분리하고, 각 도표 내 분자 구조를 인식한다.

COVID-KG는 태그 클라우드와 적외선 열지도(Heat Map) 등 시각화를 제공해 연구자가 수천 개의 논문에서 선별한 관계를 한 눈에 볼 수 있도록 한다. 이 기능으로 키워드 검색이나 간단한 단어 클라우드, 적외선 열지도 화면에서 놓칠 수 있는 다양한 자료 관계를 식별할 수 있다.

연구팀은 이번 연구 보고서를 통해 베나제프릴ㆍ로사르탄ㆍ아모디아콰인 3가지 약물을 대상으로 기존 보고서에서 언급한 질문 11개를 제시했다. 2만5534건의 약물 용도 변경 보고서에서 얻은 지식을 바탕으로, COVID-KG는 상세증거ㆍ지식서브그래프ㆍ이미지세분화 등 분석 결과와 함께 각 질문에 대한 해답을 제공했다. 연구팀은 'COVID-KG가 제시한 답변이 유익하고 타당하다'는 임상의 및 의대생의 소견도 함께 보고했다.

매체는 연구팀이 앞으로 연결고리를 예측해 새로운 가설 설정을 자동화할 수 있도록 시스템을 확장할 계획이라고 설명하며, 문헌간 공통 의미 공간을 생성 및 적용해 COVID-KG의 멀티미디어 지식 기초ㆍ추론ㆍ전이를 향상시킬 것이라고 전했다.

이번 연구 공동 저자는 논문을 통해 "연구자 및 임상의가 COVID-KG를 이용해 과학 문헌으로부터 중요하고 신뢰할 수 있는 답변을 얻을 수 있다"며 "보다 중요한 가설 시험에 집중할 수 있고, 후보 탐색 방향을 위한 분석 노력의 우선순위를 정할 수 있다"고 전망했다.

 

[관련 기사] 수학 활용해 코로나19 대응한다

[관련 기사] 코로나 검체 비대면으로 채취한다