'부정확한 의료 학습 데이터가 AI에 미치는 부정적 영향' 연구 결과

인공지능(AI) 질병 예측 모델이 부정확한 학습 데이터로 학습을 하면, 오진의 가능성이 크다는 연구 결과가 나왔다. 

(사진=셔터스톡)
(사진=셔터스톡)

최근 중국 동화 대학교와 캘리포니아 대학교 연구팀은 '부정확한 의료 학습 데이터가 AI에 미치는 부정적 영향'을 연구한 결과를 사전논문 사이트 Arxiv.org에 게재했다고 벤처비트가 27일(현지시간) 보도했다.

합동 연구팀은 부정확성을 제어하는 ​​매개 변수를 사용, 부정확한 학습데이터를 생성하는 시스템을 설계했다. 또 이 시스템이 생성한 부정확한 학습데이터를 AI 예측 모델에 입력해 학습 시키는 형태로 실험을 진행했다. 

연구원팀은 상하이 루이진 병원의 2~10년 동안 감상선 기능 저하증 환자 2460명 기록을 부정확한 AI모델로 학습및 테스트를 10회 실행하고 결과를 평균화 했다. 또 실제 의료 데이터로 학습한 AI 예측 모델과 이를 비교했다.

그 결과, 부정확한 AI 모델이 예측한 데이터는 실제 환자의 갑상선 자극 호르몬 수용체 항체와 갑상선 자극 호르몬 수치보다 비정상적으로 낮거나 높은 수치를 기록했다. 부정확한 학습 데이터로 학습한 AI모델이 잘못된 계산을 수행해 라벨 표시 오류와 오진으로 이어질 수 있는 등 부정적인 결과를 보여준 것이다.

한편, 지난 4월 구글도 '안구 질환 예측 AI 시스템'이 실제 사용에 적합하지 않다는 분석을 담은 백서를 발간, 학습데이터의 품질을 부적합 판정 원인 중 하나로 꼽은바 있다.

[AI & 산업] AI 활용 '안저영상판독솔루션' 식약처 혁신의료기기 지정

[디지털 뉴딜] 비대면 생체신호 모니터링 시스템 나온다