엔비디아(Nvidia)가 신경과학의 미래를 위해 유망한 소식을 전했다. 킹스 칼리지 런던(King's College London)의 연구원들은 엔비디아의 케임브리지-1(Cambridge-1) 슈퍼컴퓨터와 인공지능(AI)을 사용해 세계에서 가장 큰 합성 뇌 이미지 데이터베이스를 구축했다.
데이터베이스에는 100,000개의 뇌 이미지가 포함되어 있으며 인지 질환 연구를 발전시키기 위해 의료 연구원이면 누구나 무료로 사용할 수 있다. 이 이미지는 킹스 칼리지 런던의 연구원인 죠지 카르도소(Jorge Cardoso)와 엔비디아와의 협력으로 탄생한 의료용 오픈 소스 AI 프레임워크인 모나이(MONAI, Medical Open Network for AI)의 창립멤버가 구축하고 기증했다.
카르도소는 "과거에는 많은 연구원들이 좋은 데이터를 충분히 얻을 수 없었기 때문에 의료 분야에서 일하는 것을 기피했지만 이제는 얻을 수 있다"고 말했다.
일부의 경우 실제 데이터를 얻는 것이 어렵기 때문에 실제 데이터의 대안으로 AI 모델링을 통해 생성된 합성 데이터(Synthetic data)가 빠르게 보편화되고 있다. 의료 이미지는 실제 이미지를 사용할 때 환자의 프라이버시가 우려되고 특정 병원의 환자 인구 통계가 반드시 광범위한 인구를 반영하지 않을 가능성이 있기 때문에 관리하기가 특히 어렵다.
합성된 3D 뇌 이미지는 남성 또는 여성, 젊은이 또는 노인의 이미지일 수 있으며 연구 요구 사항에 따라 주문 제작할 수 있다. 이미지가 시뮬레이션되었지만 연구원들은 고도로 훈련된 알고리즘의 결과로 실제 뇌 스캔처럼 보이고 반응한다고 주장했다.
이 연구는 뇌 질환을 암시할 수 있는 뇌 이미지의 이상한 구조를 식별하기 위한 프로젝트로 시작됐다. 연구팀은 먼저 건강한 뇌의 실제 이미지를 보여주고 건강하지 않은 뇌의 이미지를 추적해 AI 모델을 훈련했다. 또한 합성 이미지를 생성하기 위해 나이든 두뇌와 젊은 두뇌의 차이점을 모델에 가르쳤다. 엔비디아에 따르면 아주 큰 데이터 세트를 사용해 이미지 정확도가 향상됐고 모델이 실제 이미지만큼 결과를 잘 예측할 수 있도록 최적화됐다.
카르도소는 "모델이 뇌 유형의 분포를 학습했다는 것을 깨달았으므로 더이상 데이터 세트가 필요하지 않게 됐고 데이터는 모델의 일부가 됐다"라고 말했다.
합성 뇌 데이터를 생성하는 엔진은 각 이미지의 1600만 3D 픽셀을 처리하는 엔비디아의 케임브리지-1 슈퍼컴퓨터다. 케임브리지-1은 80개의 DGX A100 시스템, 640개의 엔비디아 A100 Tensor Core GPU, Bluefield-2 DPU 및 엔비디아 HDR InfiniBand 네트워킹을 기반으로 한다.
모나이는 파이토치(PyTorch)를 기반으로 하는 오픈 소스 딥 러닝 프레임워크다. 모나이 프레임워크는 도메인별 데이터 로더, 메트릭, GPU 가속 변환 및 최적화된 워크플로 엔진으로 구성된다. 이 작업은 CUDA 심층신경망 라이브러리(cuDNN)와 엔비디아 옴니버스(Omniverse) 시뮬레이션 플랫폼을 비롯한 다른 엔비디아 소프트웨어에서도 지원됐다. 엔비디아 소프트웨어 스택이 제공하는 가속화된 프로세스 덕분에 수백 개의 AI 모델이 몇 달이 아닌 몇 주 만에 훈련됐으며 모델 정확도가 하이퍼파라미터 조정을 통해 크게 개선됐다.
국가 저장소인 Health Data Research UK는 100,000개의 이미지를 호스팅할 예정이며 연구팀은 향후 필요한 모든 이지를 만들 수 있도록 AI 모델도 공유한다. 연구팀은 또한 이러한 모델이 MRI, CAT 또는 PET 스캔과 같은 모든 의료 영상 모드에서 인체 해부학의 모든 부분에 대한 3D 이미지를 만드는 방법을 탐구하고 있다.
AI타임스 박찬 위원 cpark@aitimes.com
[관련기사]다른 암과 구별 어려운 두경부암...AI가 치료 시기 앞당긴다
[관련기사]치매 조기 발견 AI가 책임진다
