GSK·노바티스·머크 등 세계 10대 제약회사 참여
통합 데이터 방식 적용 신약개발 시기·비용 단축

신약개발 플랫폼 멜로디에 참여한 세계 10대 제약회사와 기술공급 업체(사진=melloddy.com). 

글로벌 신약개발 플랫폼 멜로디(MELLODDY:Machine Learning Ledger Orchestration for Drug Discovery)가 공동 데이터셋으로 인공지능(AI)을 학습하는 방식으로 신약개발을 위한 기술을 공유하는 첫 걸음을 뗏다. 

멜로디는 지난 6월 암젠, 바이엘, GSK, 얀센, 노바티스 등을 포함한 세계 10대 제약회사와 유럽 주요 대학 및 바이오 스타트업 등이 참여해 설립한 머신러닝 기반 데이터 공유 플랫폼이다. 각 회사 독점 데이터가 아닌 공동 데이터셋에서 함께 AI를 훈련하며, 신약개발을 위한 기술을 공유한다.

유럽연합(EU)과 민간 제약산업 이니셔티브로 자금을 받아 운영한다. 현재 보유금액은 12만유로(약 220억원)에 이른다.

벤처비트는 17일(현지시간) 멜로디가 회사별로 분산된 훈련 데이터를 사용해 심층신경망(DNN)을 훈련하는 연합학습을 통한 첫번째 합동 연구를 마쳤다고 보도했다.

신약개발은 임상시험 가운데 오직 12% 미만이 제품화가 결정되는 까다로운 과정이다. 발견부터 상용화까지 걸리는 시간은 최소 10년이다. 미국 제약협회 보고서에 따르면 평균 7년간 임상시험을 진행하는 데 드는 연구개발비는 약 26억달러(약 3조196억원)에 이른다.

멜로디 공동설립자들은 연합학습이 이 과정을 가속화할 수 있다고 주장한다. 머신러닝에서 연합학습은 데이터 샘플을 교환하지 않고 데이터 샘플을 보관하는 분산형 장치에서 알고리즘을 훈련시킨다. 중앙집중식 서버는 알고리즘 단계를 조정하고 참조 역할을 위해 사용된다.

엔비디아는 멜로디 플랫폼 구축 기술 공급업체로 합류했다. 신약개발에 쓰일 머신러닝 솔루션 구현을 위해 자사 그래픽카드를 제공했다. 의료 데이터 플랫폼 업체 오우킨은 멀티태스킹 연합학습을 위해 자사 프레임워크 오우킨 커넥트를 제공했다. 벨기에 뢰벤 가톨릭대학교는 약물 발견에 특화된 머신러닝 모델을 훈련하기 위해 스파스캠이라는 오픈 소스 라이브러리를 제공했다.

멜로디 플랫폼 대변인은 모든 참여 제약사들이 데이터 구분 없이 통합된 방식으로 예측 모델을 동시에 교육할 수 있었다고 전했다. 또 첫 연구결과에 대한 과학적, 비즈니스 평가를 시작했다고 부연했다. 앞으로 2년 동안 멜로디는 연구결과를 과학 논문에 게재하는 동시에 계속해서 합동연구 성능을 향상시켜나갈 방침이다.

멜로디 프로젝트 출범이후 신약개발 및 헬스케어 시스템 구축을 위한 세계 트렌드도 변화하고 있다. 현재 인텔은 자사 AI 기술과 국립보건원의 데이터를 결합해 뇌종양을 식별하는 새로운 시스템을 개발 중에 있다. 펜실베니아주립대는 페렐만의과대학과 공동으로 세계 29개 국제의료센터와 연합학습을 활용한 AI 헬스 시스템을 양성하겠다고 발표했다.

미국방사선협회도 스탠퍼드, 오하이오주립대 등과 협력해 3만3000여건의 유방조영술 연구를 진행한 결과 연합학습 모델 개발에 성공했다. 엔비디아는 킹스컬리지런던과 협력해 코로나19 관련 연합학습 모델을 개발하고 있다.

[관련기사] 바이두, 신약 발굴 AI 스타트업 설립 위해 20억 달러 모금 추진

[관련기사] 엔비디아, ARM 인수 '확정'…젠슨 황, "AI 시대를 위한 결정"