정부, 의료 데이터 개방 논의 비교적 활발한 상태
고 교수 "의료 데이터 공유, 법·비용적 한계 있어"
가톨릭중앙의료원, 공공 클라우드로 해결점 제시

의료 데이터를 병원 밖에서도 사용할 수 있어야 한다는 목소리가 커지고 있다. (사진=셔터스톡)
의료 데이터를 병원 밖에서도 사용할 수 있어야 한다는 목소리가 커지고 있다. (사진=셔터스톡)

의료 데이터를 병원 밖에서도 사용할 수 있어야 한다는 목소리가 커지고 있다. 해당 빅데이터는 의료 사업·연구에 큰 도움이 될 수 있어서다. 최근 가톨릭중앙의료원은 자체 개발한 아키텍처로 민감한 의료 데이터를 보유한 기관에서 데이터를 안전하게 공공화한 사례를 제시했다. 여기에 적용하는 시스템은 공공 클라우드다. 현재 이를 실제로 활용하려는 행정 프로세스도 구축 중이다.

의료 데이터는 전자의무기록(EHR), 의료 영상, 유전체, 전사체, 메타전사체, 데이터 청구기록, 웨어러블기기, 의료기기(IoT)등에서 나오는 데이터를 말한다. 국민건강보험공단 같은 공공기관, 병원, 보험회사 등 다양한 기업·기관이 보유하고 있다. 특히 병원은 다른 기관이나 기업이 갖고 있지 않는 치료내역, 치료 결과, 상세 검사 기록을 갖고 있다. 엑스레이(X-ray), CT, MRI, 대규모 영상 데이터와 유전체 검사 데이터도 있다. 

정부, 의료 데이터 개방에 앞장

 보건복지부는 ‘의료데이터 중심병원 사업’을 현재까지 진행 중이다. (사진=보건복지부 공식 홈페이지)
보건복지부는 ‘의료데이터 중심병원 사업’을 현재까지 진행 중이다. (사진=보건복지부 공식 홈페이지/편집=김미정 기자)

정부도 헬스케어 데이터를 주의 깊게 보고 있다. 2019년 국내에서 발표한 인공지능(AI) 국가전략에서도 주요 7대 산업 중 하나로 바이오 의료를 꼽았다. 보건복지부는 ‘의료데이터 중심병원 사업’을 진행 중이다. 각 병원이 가진 데이터를 정제해 관리하는 체계를 확립하는 사업이다. 향후 데이터 오·남용 없이 ‘목적형 데이터’를 공개할 목표다. 전국 상급종합병원 29곳, 종합병원 9곳, 전문병원 3곳이 해당 사업에 참여했다.

작년 보건복지부에서도 ‘보건의료 데이터-인공지능 혁신전략’을 발표한 바 있다. 이를 통해 올해 개방·공유 대상 데이터셋을 포함해 공개 범위 기준을 우선 마련할 방침이다. 내년부터 최소 단위 공통 데이터셋 기반의 데이터 관리·공유를 단계적으로 확대한다. 병원에서 질 좋은 데이터를 만들어 이를 가공해 외부에서 적재적소에 활용할 수 있도록 선제적으로 개방하겠다는 의미다.

"의료 연구 위한 헬스케어 데이터 공유, 법적·비용적 문제 아직 있어"

AWS 서밋코리아 2022에서 발표 중인 고태훈 서울성모병원 교수. (사진=AWS Summit Korea 2022 캡처/편집=김미정 기자)
AWS 서밋코리아 2022에서 발표 중인 고태훈 서울성모병원 교수. (사진=AWS Summit Korea 2022 캡처/편집=김미정 기자)

연구에 필요한 의료 데이터를 공유하기에는 아직 넘어야 할 산이 많다. 고태훈 서울성모병원 교수는 이달 10일~11일 진행한 'AWS 서밋코리아 2022' 행사에서 “법적으로 개인 민감정보를 비식별화, 가명화하 해도 ‘개인정보’다”며 “의도하지 않아도 개인을 식별할 수 있는 가능성이 완전히 없애기도 어렵다”고 밝혔다.

고태훈 교수는 “의료 데이터 활용은 '기관생명윤리위원회'를 통해 윤리심사도 거쳐야 한다”고 말했다. 생명윤리법에 의거한 의무이기도 하다. 또 그는 “해당 데이터가 정해진 기간 내 활용을 마쳤으면 폐기하는 절차도 필요하다”며 “의료기관 입장에서 데이터 반출과 폐기를 모니터링하는 것은 매우 어렵다”고 강조했다.

일각에서는 '온프레이스(On-premise)' 환경을 구축하면 외부에서도 데이터를 가져다 분석할 수 있다는 입장이다. 그러나 해당 인프라를 구축하고 유지하는 비용은 매우 높다. 의료기관이 '개인 클라우드(Private cloud)'환경을 조성하면 어떨까? 이도 역시 온프레미스 환경처럼 구축이나 유지 비용이 많이 든다.

공공 클라우드를 통한 안전한 의료 데이터 활용법

가톨릭중앙의료원이 진행한 프로젝트. (사진=AWS Summit Korea 2022 캡처/편집=김미정 기자)

고 교수는 “공공 클라우드로 의료 데이터를 병원 외부인이 안전하게 활용할 수 있는 체계를 만들 수 있다”고 주장했다. 고태훈 교수는 가톨릭중앙의료원에서 직접 실험한 과정을 설명했다. 가톨릭중앙의료원이 진행한 프로젝트 'AWS PoC'는 의료기관이 공공 클라우드를 통해 외부인이 데이터 활용과 폐기하는 진행 상황을 볼 수 있고, 이를 외부에 유출하지 않도록 막는 체계 형성이 목표다.

공공 클라우드안에는 계정이 두 종류다. 하나는 데이터를 보유한 의료기관이고, 나머지는 데이터를 활용하는 외부기관이다. 의료기관은 관리 계정을 보유하고 있다. 데이터 보관과 폐기도 결정하고, 분석 결과 반출까지 살핀다. 외부기관은 데이터 분석에 쓰는 컴퓨팅 리소스를 생성하고 이에 대한 비용을 지불해야 한다. 데이터 반출을 막기 위한 장치도 갖췄다. 

의료원은 보안 클라우드를 위한 아키텍처를 만들었다. 안전하게 공개된 NIH 흉부 엑스레이 데이터셋(Chest x-ray dataset)과 ‘MIMIC-III 데이터셋’으로 데이터 관제 테스트도 진행했다. 데이터 활용에 있어 병목현상은 없는지, 데이터가 외부로 반출될 수 있는 여지가 있는지까지 꼼꼼히 진행했다. 

테스트 결과 의료 데이터를 기존 온프레미스 환경과 똑같이 AI 개발과 연구에 활용할 수 있음을 확인했다. 고 교수는 "다각도 테스트를 통해 데이터를 외부로 유출되지 않게끔 아키텍쳐를 구성해 더욱 안전하다"고 강조했다. 

고태훈 교수는 "공공 클라우드를 통한 의료 데이터 공개 체계가 실제 활용되면 의료 연구에 시너지 효과가 될 것이다"며 "가톨릭중앙의료원과 서울성모병원 등 의료기관이 데이터를 개방하고 활용하는 첫걸음 되기를 바란다"고 말했다. 현재 가톨릭중앙의료원은 이를 실제로 활용하려는 행정 프로세스도 구축 중이다.

AI타임스 김미정 기자 kimj7521@aitimes.com

[관련 기사]포스트 코로나 대비한 보건의료 미래 혁신기술 탐색

[관련 기사]보건복지부, 올해 신약연구개발 등에 8,777억 투입

키워드 관련기사
  • 구글, AI 언어모델 'LaMDA 2'를 위한 베타 테스트 공개
  • 딥노이드 의료영상진단 '딥체스트' SW 품질인증 최고등급 획득
  • "AI 문턱 클라우드가 낮춘다"...AWS, 사용자 친화형 기능 고도화