세계 일류대학 교수 19명 논문 공저…네이처에 발표
유방암 진단 AI 시스템 비판…알고리즘 과정 공개해야

(사진=셔터스톡).
(사진=셔터스톡).

하버드·스탠퍼드·맥길 등 세계 일류대학 교수들이 구글헬스가 개발한 AI 유방암 예측 시스템을 비난하고 나섰다. 총 19명이 공저에 참여해 네이처지에 관련 내용의 논문을 발표한 것이다. 이들은 구글 AI 시스템이 “과학적 가치를 저하시킨다”며 알고리즘을 외부에 공개하는 투명성이 보장되지 않는다면 쓸모없는 기술이라고 주장했다.

구글헬스는 지난 1월 약 9만장의 맘모그래피(유방 촬영사진)로 훈련시킨 유방암 예측 AI 시스템을 개발했다. 방사선 전문의가 검사한 유방 스캔 오진율을 줄이기 위한 목적이었다. 그러나 하이퍼 패러미터(진단·예측 시 사용하는 변수)와 데이터 처리과정 등을 공개하지 않았다. 논문에서 공동저자는 이를 지적하고 있다.

캐나다 토론토에 위치한 프린세스 마가렛 암센터의 벤자민 케인 박사는 논문에서 “구글헬스 AI 시스템은 개발 의도만 본다면 ‘아름다운 일’이다”고 밝혔다. 그러나 “현직 의사들이 이 시스템을 통해 배울 수 있는 것이 없다면 존재이유에 물음표를 던져야 할 것”이라며 “과학적 진보는 연구결과를 면밀히 조사하고 결과를 통해 배우며 재현하는 능력에 달려 있다”고 강조했다.

이에 대해 구글 측은 AI 모델을 훈련시킬 때 사용한 코드는 내부 인프라와 하드웨어에 의존했기 때문에 공개할 수 없다고 해명했다. 또한 영국과 미국에서 익명의 환자에게 받은 데이터이므로 알고리즘을 공개할 경우 민감한 부분이 발생한다고 덧붙였다. 그러나 네이처 공저자들은 개인정보를 훼손하지 않고도 모델 예측과 데이터라벨을 공개할 수 있다고 주장한다.

네이처 공저자는 “구글의 대규모 머신러닝 애플리케이션은 과도하게 소프트웨어에 의존하는 경향이 강하다”며 “이를 적절히 통제할 환경조성이 필요하다”고 역설했다. 또 인간의 생명이 걸린 연구일수록 투명성에 대한 높은 기준이 필요하다고 강조했다. 이들은 기업 내부정책 등을 이유로 사회와 데이터를 공유할 수 없다면 독립된 기관을 설치해 데이터를 검증·분석하는 매커니즘을 구축해야 한다고 제안했다.

외부의 안전점검이나 데이터 조사가 결여된 모델은 실제 상용화 후 예상치 못한 장애물에 직면할 가능성이 있다. 실제 하버드대 연구진은 CT 스캔을 인식하고 분류하기 위해 훈련된 알고리즘이 특정 제조업체가 만든 CT를 스캔하는 데 편중된 결과를 낸다는 것을 발견했다. 또 영국 AI 의료 스타트업 기업 바빌론 헬스의 화상통화나 챗봇으로 진단 데이터를 확인하는 앱은 대형병원 데이터베이스만 있어 또다른 차별을 조장한다는 비판이 일고 있다.

저자들은 논문에서 “안타깝게도 생물의학 문헌에는 재현성 시험에 실패한 연구들이 어지럽게 널려 있고 이 중 상당수 원인은 소프트웨어와 데이터를 완전히 공개하지 못한 것”이라며 “구글헬스가 혁신적인 의료 시스템을 개발해놓고 관련 핵심 자료와 정보를 공유하지 않는 것은 아이러니하게도 폐쇄적 기업임을 스스로 인정하는 꼴”이라고 비판했다.

[관련기사] 의료용 인공지능(AI)이 실수하면 누가 책임질까?

[관련기사] [Monday News] AI와 헬스케어가 바꾸는 미래사회 ③AI 수술로봇, 그 명과 암