MIT는 EHR에서 의사가 필요로 하는 정보를 자동으로 찾아 프로세스를 간소화할 수 있는 기계 학습 모델을 개발하기 시작했다.(사진=셔터스톡)
MIT는 EHR에서 의사가 필요로 하는 정보를 자동으로 찾아 프로세스를 간소화할 수 있는 기계 학습 모델을 개발하기 시작했다.(사진=셔터스톡)

전자 건강 기록(EHR)에서 의사가 필요로 하는 정보를 자동으로 제공할 수 있는 기계 학습 모델이 나왔다. 이 모델은 방대한 수의 실제 의학적 질문을 생성한 다음 이러한 질문을 사용해 의사가 환자 기록에서 원하는 정보를 찾아서 제공한다.

의사는 종종 환자의 EHR에서 치료 결정을 내리는 데 도움이 되는 정보를 찾지만 연구에 따르면 의사가 EHR을 사용하도록 훈련을 받은 경우에도 한 가지 질문에 대한 답을 찾는 데 평균 8분 이상이 소요될 수 있다.

MIT 뉴스(MIT News)에 따르면 MIT(Massachusetts Institute of Technology)의 CSAIL(Computer Science and Artificial Intelligence Laboratory) 연구원들은 EHR에서 의사가 필요로 하는 정보를 자동으로 찾아 프로세스를 간소화할 수 있는 기계 학습 모델을 개발하기 시작했다. MIT CSAIL, MIT-IBM Watson AI Lab, IBM Research 그리고 연구에 참여한 의사 및 의료 전문가가 공동으로 작성한 연구 논문은 전산 언어학 북미 연례회의에서 발표될 예정이다.

효과적인 모델을 교육하려면 의학적 질문에 대한 방대한 데이터 세트가 필요하며, 이는 종종 개인 정보 보호 제한으로 인해 얻기 어렵다. 기존 모델은 의사가 묻는 질문을 생성하는 데 어려움을 겪으며 종종 올바른 답을 성공적으로 찾을 수 없었다.

이러한 데이터 부족을 해결하기 위해 MIT의 연구원들은 의료 전문가와 협력해 의사가 EHR을 검토할 때 묻는 질문을 연구하고 2,000개 이상의 임상 관련 질문으로 공개 사용 가능한 데이터 세트를 구축했다.

임상 질문을 생성하고 답변하는 데 사용되는 AI 모델 파이프라인 구성도.(사진=MIT)
임상 질문을 생성하고 답변하는 데 사용되는 AI 모델 파이프라인 구성도.(사진=MIT)

데이터 세트를 사용해 머신 러닝 모델을 훈련하고 임상 질문을 생성했을 때 의료 전문가의 실제 질문에 비해 해당 모델이 고품질의 실제 같은 질문을 60% 이상 했다는 것을 발견했다. 이 데이터 세트를 사용해 방대한 수의 실제 의학적 질문을 생성한 다음 이러한 질문을 사용해 의사가 환자 기록에서 원하는 정보를 더 효율적으로 찾는 데 도움이 되는 기계 학습 모델을 훈련할 계획이다.

CSAIL의 피터 스졸로비츠(Peter Szolovits) 교수는 "현실적인 데이터는 작업과 관련이 있는 모델을 훈련하는 데 매우 중요하지만 찾거나 생성하기 어렵다"며 "환자 사례에 대해 임상의가 묻는 질문을 신중하게 수집하는 것이 중요하고, 수집된 데이터와 일반 언어 모델을 사용해 더 그럴듯한 질문을 하는 방법을 개발할 수 있다"고 주장했다.

MIT 연구원들은 "고품질 데이터를 수집하는 것은 특히 의료 분야에서 기계 학습 작업을 수행하는 데 정말 중요하며 우리는 그것이 가능하다는 것을 보여주었다"라고 말했다.

데이터 세트를 구축하기 위해 MIT 연구원들은 개업 의사 및 의대생에게 100개 이상의 EHR 퇴원 요약(discharge summary)을 제공하고 요약을 읽고 궁금한 점이 있으면 질문하게 했다. 연구원들은 자연스러운 질문을 수집하기 위해 질문 유형이나 구조에 제한을 두지 않았다. 또한 의료 전문가들에게 EHR에서 각 질문을 하게 만든 "트리거 텍스트(trigger text)"를 식별하도록 요청했다. 예를 들어, 의료 전문가는 EHR에서 전립선암과 갑상선 기능 저하증에 환자의 과거 병력이 중요하다는 메모를 읽을 수 있다. 트리거 텍스트 ‘전립선암’은 전문가가 ‘진단 날짜?’와 같은 질문을 하도록 유도할 수 있다. 

연구원들은 대부분의 질문이 증상, 치료 또는 환자의 검사 결과에 초점을 맞춘다는 것을 발견했다. 이러한 발견을 예상치 못한 것은 아니었지만 광범위한 주제에 대한 질문 수를 정량화하면 실제 임상 환경에서 사용하기 위한 효과적인 데이터 세트를 구축하는 데 도움이 될 것이라고 연구원들은 말한다.

일단 질문 데이터세트와 그에 수반되는 트리거 텍스트를 컴파일한 후 이를 사용해 트리거 텍스트를 기반으로 새로운 질문을 하도록 머신 러닝 모델을 훈련했다.

그런 다음 의료 전문가들은 이해 가능성(인간 의사에게 질문이 이해가 될까?), 사소함(질문이 트리거 텍스트에서 너무 쉽게 답할 수 있는 것인가?), 의학적 관련성(내용을 기반으로 이 질문을 하는 것이 합리적일까?), 트리거에 대한 관련성(트리거가 질문과 관련이 있을까?) 등의 측면에서 좋은 질문인지 판단했다.

연구원들은 모델에 트리거 텍스트가 주어졌을 때 63%의 좋은 질문을 생성할 수 있었던 반면, 인간 의사는 80%의 좋은 질문을 할 수 있다는 것을 발견했다.

또한 구축된 공개 사용 가능한 데이터 세트를 사용해 임상 질문에 대한 답변을 찾도록 모델을 훈련했다. 그런 다음 그들은 이러한 훈련된 모델이 인간 의료 전문가가 묻는 좋은 질문에 대한 답을 찾을 수 있는지 테스트했다. 그러나 모델은 의사가 생성한 질문에 대한 답변의 약 25%만 복구할 수 있을 정도로 평가 결과는 좋지 못했다.

그 모델이 현실이 되기까지는 아직 해야 할 일이 많이 있지만 팀은 초기 목표인 EHR에서 의사의 질문에 자동으로 대답할 수 있는 모델을 구축하기 시작했다. 다음 단계에서는 구축된 데이터 세트를 사용해 수천 또는 수백만 개의 임상 질문을 자동으로 생성할 수 있는 기계 학습 모델을 훈련하고 궁극적으로 자동 질문 응답을 위한 새 모델을 구축해 갈 것이다.

AI타임스 박찬 위원 cpark@aitimes.com

[관련기사]의료 데이터, 공공 클라우드로 안전한 개방 가능할까

[관련기사]"가상 환자 만들어 진료 정확도 높인다"...코어라인, '메디컬 트윈' 시동

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지