'AI와 의료'에 대해 AI의 혁신적 역할과, 이에 대한 법적 대비의 구체적 사례를 통해 새로운 의료 패러다임 구축과 규제의 방향성 제안 등을 보도한다. [편집자 주]

임상적 의사결정에 중요한 ASA-PS 1∼2등급(건강한 사람 및 경미한 전신질환)과 3등급 이상(중증도 전신질환 이상)의 환자를 구분하는 데 있어 거대언어모델의 오류율은 11.74%로, 마취통증의학과 전문의의 오류율 13.48%보다 우수했다. (사진=대한의협)
임상적 의사결정에 중요한 ASA-PS 1∼2등급(건강한 사람 및 경미한 전신질환)과 3등급 이상(중증도 전신질환 이상)의 환자를 구분하는 데 있어 거대언어모델의 오류율은 11.74%로, 마취통증의학과 전문의의 오류율 13.48%보다 우수했다. (사진=대한의협)

서울대병원이 개발한 수술 전 마취 위험 예측 AI 거대언어모델(LLM)은 수술 전 환자의 상태를 신속하게 평가하여 마취 위험도를 예측함으로써 환자 안전을 크게 향상시킬 수 있을 것으로 기대되고 있다.

서울대병원 이형철, 윤수빈 교수와 이현훈 교수(국가전략기술특화연구소) 공동 연구팀이 개발한 이 AI 모델은 ASA-PS(미국마취과학회 신체상태 분류체계) 등급 예측의 평균 정확도가 0.915에 달해, 전문의들의 분류보다 높은 성능을 보였다. 

연구팀은 수술 전 마취 위험을 평가하는 AI 거대언어모델(LLM)을 자체 개발, ASA-PS 등급에 대한 평균 예측 정확도(AUROC)를 담은 연구 결과를 디지털 헬스케어 분야의 네이처 파트너 저널 [npj Digital Medicine] 최근호에 발표했다고 지난달 28일 밝혔다.

ASA-PS 등급별 예측 정확도(AUROC). 모든 ASA-PS 등급에 대해 연구팀이 개발한 모델(빨간 곡선)의 예측 정확도는 평균 0.901로, 이 수치가 1에 가까울수록(곡선이 왼쪽 상단에 가까울수록) 완벽한 예측을 의미한다. (출처=서울대병원)
ASA-PS 등급별 예측 정확도(AUROC). 모든 ASA-PS 등급에 대해 연구팀이 개발한 모델(빨간 곡선)의 예측 정확도는 평균 0.901로, 이 수치가 1에 가까울수록(곡선이 왼쪽 상단에 가까울수록) 완벽한 예측을 의미한다. (출처=서울대병원)

AI는 마취 전 평가 요약문을 분석해 환자의 전반적인 건강 상태를 일관성 있게 평가하고, 중증도 분류에 객관적인 기준을 제시함으로써 의료진 간의 주관적 판단 차이를 해소할 수 있도록 돕는다.

이 모델은 71만 명의 수술 데이터를 바탕으로 학습했으며, 특히 의무기록 보안을 중시하여 환자 개인정보 보호에 특화된 거대언어모델로 설계되었다. 

이형철 교수는 "이 연구는 AI가 환자 안전과 의료 서비스 질을 높이는 데 실질적으로 기여할 수 있음을 보여준다"고 강조하며, "후속 연구를 통해 추가적인 의료 보조 도구로 활용 가능성을 확대할 계획"이라고 밝혔다.

왼쪽부터 서울대병원 마취통증의학과 이형철·윤수빈 교수, 국가전략기술 특화연구소 이현훈 교수
왼쪽부터 서울대병원 마취통증의학과 이형철·윤수빈 교수, 국가전략기술 특화연구소 이현훈 교수

양준석 기자 kailas21@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지