칭화대 연구진이 인간의 개입 없이 인공지능(AI) 의사를 교육하기 위한 가상 병원을 구축했다. 이를 통해 AI가 높은 정확도로 환자를 진단하고 치료할 수 있게 됐다.
노트북체크는 16일(현지시간) 중국 칭화대 연구진이 인간의 개입 없이 가상 AI 의사를 양성하기 위한 가상 병원 ‘에이전트 호스피털(Agent Hospital)’을 구축했다고 보도했다.
에이전트 호스피털은 실제 병원, 환자, 병원 직원의 '디지털 트윈'을 만든 다음, 가상 의사가 수천명의 가상 환자를 치료해 기술을 연마하는 것을 목표로 한다.
이를 위해 연구진은 먼저 직원 및 환자와 전체 병원의 시뮬레이션 모델을 만들었다. 그다음 AI 의사에게 인간의 개입 없이 수천명의 가상 환자를 진단하고 치료하도록 했다.
AI 의사들은 실수하면서 빠르게 배웠고, 그 결과 진찰과 진단 및 치료에 대한 기술이 크게 향상됐다는 설명이다.
이처럼 가상 시뮬레이션, 즉 '시뮬라크럼(simulacrums)'은 안전하고 신속한 AI 교육을 위해 실제 환경을 복제한다. 아픈 환자가 나타날 때까지 기다릴 필요가 없으며 오히려 수백만명의 아픈 환자가 등장하도록 프로그래밍할 수 있다. 비용도 실제 교육보다 훨씬 저렴하다.
연구진은 '메드에이전트-제로(MedAgent-Zero)'라는 방법을 사용해 에이전트 호스피털 시뮬레이션에서 1만명의 가상 환자를 대상으로 AI 의사를 빠르게 훈련할 수 있었다고 설명했다.
이 방법은 대형언어모델(LLM)에 여덟가지 질병에 대한 정보를 입력해 1만명의 가상 환자를 위한 건강 기록을 생성한 것이다. 여기에는 급성 비인두염, 급성 비염, 기관지 천식, 만성 기관지염, COVID-19, 인플루엔자 A, 인플루엔자 B, 그리고 마이코플라스마 감염이 포함된다.
환자는 중증도와 증상이 다르게 입력했다. 또 테스트를 위해 별도의 500개의 환자 기록 세트를 생성했다.
'GPT-3.5 터보'로 구동하는 가상 의사는 1만명의 가상 환자를 진찰한 뒤 질병에 따라 환자를 검사, 진단 및 치료하는 데 각각 88%, 95.6%, 77.6%의 성공률을 기록했다.
또 연구진은 'GPT-4'로 메드에이전트-제로 훈련 방법을 테스트하고, 이를 GPT-3.5 터보와 비교했다. 여기에는 미국 의료 면허 시험과 유사한 메드QA 데이터베이스의 1273개 질문이 포함돼 있다.
그 결과 호흡기 질환 질문에서 GPT-4 기반 가상 의사의 정확도는 93.06%, GPT-3.5 터보 의사는 84.72%를 기록했다.
연구진은 "AI 의사들의 성과는 단 며칠 간의 가상훈련을 통해 거둔 것으로, 에이전트 호스피털 시뮬레이션은 미래의 AI 의사뿐만 아니라 실제 의사를 위한 빠르고 효과적인 훈련 방법을 제공할 수 있다"라고 강조했다.
박찬 기자 cpark@aitimes.com
