SK C&C가 당뇨병, 비만과 같은 대사성질환에 대한 신약 개발 타겟(질환 유발 인자)을 발굴하는 인공지능(AI) 서비스 아이클루(iCLUE) 개발 계기부터 작동 과정, 효과까지 전격 공개했다. 신약 개발 비용을 크게 줄이는 만큼 해당 서비스 이용 시 한 프로젝트 당 3.8억원의 사회적 가치를 확보할 수 있다는 주장이다.
윤영석 SK C&C 헬스케어 수석은 5일 ‘SK ICT TECH SUMMIT 2020’서 런칭 준비 중인 AI 타겟 발굴 서비스 아이클루를 소개했다. SK C&C 신약개발 AI 서비스 아이클루는 아이클루앤애스크(iCLUE&ASK)와 아이클루티디엠디(iCLUE-TDMD)로 나뉜다. 아이클루앤애스크는 질병과 새로운 약물 간 연관성을 찾아낸다. 아이클루티디엠디는 대사성질환 중심으로 후보타겟 추천하며 명확한 추천 근거를 제시하는 것이 특장점이다.
아이클루애스크는 스타트업 스탠다임(Standigm)이 먼저 준비했던 신약 타겟 발굴 서비스로 SK C&C가 현재 함께 개발 중이다. 방대한 데이터 학습, 질병과 타겟 간 딥 뉴럴 네트워크 형성을 통해 새로운 질환 유발 인자, 즉 타겟을 예측한다.
이후 자연어처리(NLP)와 정제한 데이터베이스를 이용해 질병, 타겟, 합성물 중심으로 부작용(Side effect), 패스웨이(Passway) 등 다양한 정보를 바탕으로 지식 그래프 DB를 만들었다.
다음 단계로는 AI를 활용해 데이터베이스에서 모든 가능한 패스를 계산했다. 어텐션 매커니즘(Attention mechanism)을 통해 높은 정확도와 설명 가능한 패스를 지닌 질병 타겟을 추천하는 서비스를 만들었다.
아이클루앤애스크에 적용한 NLP 프로세스 아이캔은 퍼브메드(PubMed) 논문을 인풋값을 사용해 NER, 관계성 추출(relation extraction), 독립체 연결(entity linking) 단계를 거쳐 유전자와 질환 관계를 찾아낸다.
아이클루앤애스크 서비스의 중요한 특징 중 하나는 사용자가 데이터를 추가하고 조정하는 것이 가능하다는 점이다. 윤영석 수석은 “제약사가 자체 실험으로 확보한 오믹스(OMICS) 데이터를 나만의 공간에 업로드할 수 있다. AI 엔진이 해당 데이터를 기존 DB와 합쳐 유전자와 질환 관계를 업데이트하고 이를 토대로 인사이트를 발굴한다”고 설명했다.
아이클루티디엠디는 대사성 질환 중심으로 후보 타겟을 추천하며 추천 근거를 명확히 제시한다. 이 AI 시스템 효력 입증을 위해 SK C&C는 현재 쥐를 이용한 전임상실험을 진행 중이다. 아이클루티디엠디는 신약 개발 성공률을 높이는 피노타이픽(phenotypic) 스크리닝과 쥐실험으로 얻은 데이터를 사용해 타겟후보를 발굴하고 있다.
공공 데이터, 상업 데이터, 논문 수집으로 얻은 방대한 데이터를 정제한 후 티디엠디 내 결정엔진(Decision engine)이 점수를 매겨 우선 후보, 최고 후보 타겟을 추천하고 시뮬레이션 평가까지 진행한다. 추천 후보에 대한 근거는 유전자변형마우스와 사람의 표현형 분석 결과, 유전체 연구 결과, 방대한 문헌의 텍스트마이닝 등 7가지 요소를 기준으로 제시한다.
결과 리포트에서는 피노타입, 표현형 분석, 역효과 등 후보물질이 인체 대사에 발현하는 방식과 어떤 장기에 어떤 영향을 주는지, 부작용 관련 논문 현황 등을 제시한다. 직접 연관 이외에 2~4단계를 거쳐 일어나는 영향도 직관적으로 파악하기 쉽게 시각 리포트도 제공한다.
아이클루 서비스 개발 배경에 대해 윤영석 수석은 “신약 개발비는 매해 상승하는 반면 투자 회수율은 낮아져 이노베이션 갭이 커져가고 있다. 소규모 연구소의 경우 약 40만달러, 글로벌 제약사는 수백에서 수천만달러 투자금이 필요하다. 방대한 연구자료를 기반으로 후보를 선별해야 하기에 컴퓨팅 기술이 적합하다”고 말했다.
향후 아이클루 서비스는 서비스형 소프트웨어(SaaS) 형태로 제공할 계획이다. 윤동준 SK C&C 헬스케어그룹장은 “올 하반기 서비스 오픈을 목표로 개발에 박차를 가하겠다”고 전했다.
