광주과학기술원(지스트·GIST) 연구진이 약물 부작용 예측부터 신약 후보물질 탐색에 이르기까지 인공지능(AI) 기술을 활용한 신약 개발 연구분야에서 두각을 나타내고 있다. 남호정 지스트 전기전자컴퓨터공학부 교수 연구팀은 최근 유전자의 발현 데이터를 기반으로 약물 간 상호작용으로 인한 부작용을 예측하는 AI 기술을 개발했다.
병을 치료할 때 효과를 높이기 위해 여러 약물을 함께 처방 받아 복용하는 경우가 많다. 두 개 이상의 약물을 동시 복용하면 약물들이 서로의 약효에 영향을 미칠 수 있고 부정적 효과가 발생할 가능성도 커진다. 특히 이 같은 복합 처방의 대상이 주로 고령층 환자임을 감안할 때 약물 간 상호작용에 따른 부작용을 사전에 예측하는 것은 매우 중요하다.
문제는 이런 부작용이 신약 개발 단계에서 잘 관찰되지 않아 사전에 알아내기 어렵다는 데 있다. 그동안 이 문제를 해결하고자 컴퓨터를 활용한 다양한 부작용 예측 모델들이 개발돼 왔다. 하지만 신약 개발 단계에서 새로운 약물과 시판 중인 약물 사이의 부작용을 예측하는 데는 한계가 있었다. 또 부작용이 발생하는 원리를 규명 해내는 일도 쉽지 않았다.
이에 지스트 연구팀은 약물 처리 유전자 발현 데이터를 기반으로 약물 간의 상호작용을 예측하는 'DeSIDE-DDI' 인공지능 모델을 개발해냈다. 남호정 교수팀은 약물 개발 단계에 있는 다양한 화합물의 부작용을 예측하기 위한 약물 처리 유전자 발현 데이터 생성 모델과 이를 사용해 약물 간 상호작용을 예측하는 모델을 고안했다. 해당 모델은 기존 연구들과 비교해 높은 예측 정확도를 보이며 약물 간 상호작용과 관련된 유전자를 제시해줄 수 있어 부작용 발생 원리를 찾아낼 수 있다.
먼저 유전자 발현 데이터 생성 모델은 약물의 구조·속성 정보로부터 세포가 약물에 노출됐을 때 유전자 발현 데이터를 예측한다. 이를 통해 실제 실험정보가 없는 약물도 부작용을 예측할 수 있도록 돕는다. 이렇게 생성된 데이터를 사용해 약물 간의 상호작용에 대한 예측이 가능하다는 게 연구팀의 설명이다.
연구팀에 따르면 학습된 DeSIDE-DDI 모델은 높은 수준의 예측 성능을 보였다. 신규 약물에 대한 상호작용 예측에도 활용 가능함은 물론, 사용한 유전자 발현 데이터의 가중치 분석으로 관련성이 높은 유전자를 확인할 수 있다는 게 특징이다.
남호정 교수팀이 수행한 이번 연구는 '설명가능 인공지능 기반 약물 후보의 독성·부작용 예측 시스템 개발(한국연구재단 중견연구자지원사업)'과 '사업단 실험 데이터 통합·적용을 통한 가상인체 약물반응 분석시스템 개발(과학기술정통부 유전자동의보감사업)' 사업의 지원을 받아 수행됐다.
남호정 교수는 "복합약물 처방에 따른 부작용을 사전에 예측함으로써 약물 안정성 모니터링 시스템으로 활용 가능한 중요한 연구"라고 밝혔다. 이번 연구에 제1저자로 참여한 김은영 학생은 "상호작용으로 인한 부작용 발생 시 해당 메커니즘을 설명해줄 수 있어 신약개발 단계에서의 안정성 검증에 기여할 수 있다"고 말했다.
AI 활용한 신약 개발 연구분야 '앞장'
남호정 지스트 교수 연구팀은 앞서 단백질의 3차원 구조 정보 없이도 후보 물질을 발굴해 신약 개발이 가능한 AI 기술을 선보이기도 했다. 후보 물질 발굴은 신약 개발 초기 단계로 표적 단백질에 활성을 보이는 화합물을 찾아내는 것을 의미한다. 이는 수만⋅수십만 개의 화합물로부터 표적 단백질에 활성을 보이는 화합물을 찾아야 하는 힘겨운 과정에 해당한다.
그동안 약물과 표적 단백질 간 상호작용을 예측하는 여러 AI 모델이 개발돼 왔으나 좋은 예측 성능에도 불구하고 예측 결과에 대한 설명력이 부족했기 때문에 신약을 개발하는 데 적극 도입되기는 힘든 실정이었다. 남호정 교수팀은 AI 기술을 활용해 단백질 서열을 기반으로 약물과 표적 단백질의 결합지역·상호작용을 예측함으로써 신약 후보물질 탐색 시간을 단축, 신약 개발에 소요되는 기간과 비용을 획기적으로 줄일 수 있는 가능성을 열었다.
남호정 교수팀이 개발한 'HoTS' 모델은 약물과 표적 단백질이 결합하는 부분을 사전 학습한 후 예측하기 때문에 예측 정확도가 높다. 다른 딥러닝 모델들과 비교해 높은 예측력을 보였다는 게 연구팀의 설명이다. 결합지역 예측도 단백질 서열 정보만을 사용함에도 불구하고 3차원 구조 기반의 타 예측 모델과 비슷한 수준의 성능을 보여 주목을 받았다. 당시 남호정 교수는 해당 연구 성과에 대해 "3차원 구조 정보가 없는 신규 표적 단백질에 대한 신약 개발 가능성을 열어줬다는 데 의의가 있다"며 "향후 신약 개발 단계에서의 빠르고 효율적인 유효 화합물 발굴이 가능할 수 있을 것으로 기대된다"고 밝힌 바 있다.
AI타임스 윤영주 기자 yyj0511@aitimes.com
