(사진=셔터스톡).
(사진=셔터스톡).

지난 3월 IBM은 백악관 과학기술정책국(OSTP)과 함께 코로나바이러스를 연구하는 과학자들에게 수백 개의 페타플롭스(FP) 슈퍼컴퓨터를 제공하겠다고 발표했다. 제공에 앞서 아직 많은 과정이 남아 있지만 마이크로소프트(MS), 인텔, 엔비디아 등 코로나19 퇴치를 위해 컨소시엄에 참여하는 세계 거대 IT 기업은 '상당한 진척을 보이고 있다'고 평가했다.

슈퍼컴퓨터는 연구자들이 역학, 생물정보학, 분자 모델링에서 많은 양의 계산을 빠르게 수행하도록 도와준다. 클라우드에서도 사용할 수 있기 때문에 세계 어디에서든 원격으로 협력할 수 있게 해준다.

티에리 펠레그리노 델 테크놀로지스 부사장은 벤처비트와 인터뷰에서 "현 시대 기술 진보는 전 세계에서 진행되고 있는 코로나19 연구의 중요한 부분"이라고 말했다. 또 "연구자들이 이 바이러스를 이해하고, 치료하고, 퇴치할 수 있는 도구(슈퍼컴퓨터)를 활용할 수 있다는 점은 어찌보면 특혜"라고 말했다.

세계 IT 대기업 및 기관은 미국, 독일, 스페인, 영국, 인도 등지에서 진행하는 약 62개 프로젝트를 구글 클라우드, 아마존웹서비스(AWS), MS 애저 클라우드, IBM 등 슈퍼컴퓨터와 결합시켰다.

이같은 콜라보레이션 연구는 500만 프로세서 코어 및 5만개 이상의 그래픽 카드를 포함하는 13만6000개 이상의 노드에서 실행된다. 또 컨소시엄의 40개 파트너가 관리하는 하드웨어 전체에서 483개 이상의 컴퓨팅을 제공하며 코로나19 퇴치를 위해 쉬지 않고 가동되고 있다.

MS

MS는 애저 클라우드 컴퓨팅 플랫폼에 구축한 슈퍼컴퓨팅 인프라 외에도 연구자에게 애저 HPC를 통해 워크로드 조정과 통합된 네트워킹 및 스토리지 리소스를 제공하고 있다. 지난 4월부터는 MS 클라우드 포 헬스케어 플랫폼에도 코로나19 관련 치료와 진단, 정확한 정보보급, 과학 연구 등 5대 핵심 분야 개발에 2000만 달러를 배정했다.

이 컨소시엄과 협력의 일환으로 MS는 AI, HPC, 양자 컴퓨팅 및 다른 분야의 컴퓨터 과학 분야에 걸쳐 있는 자사 연구팀에게 접근권을 제공하고 있다고 밝혔다. 지금까지 연구자들은 코로나19와 치료법 설계를 포함해 인간과 어떻게 상호작용하는지에 대한 기본적인 과학적 발견을 위한 노력을 아끼지 않았다.

MS는 또 코로나바이러스 연구를 위해 애저 사이클 클라우드, 최적의 애저 버추얼 머신 및 스토리지를 포함한 모든 애저 HPC 환경을 제공하고 있다. 

컨소시엄을 통해 MS의 AI 포 헬스(AI for Health)는 비영리 연구기관인 네팔 응용수학정보연구소(NAMII)를 지원하고 있다. 다양한 패턴의 가상 시나리오를 만들어 네팔에서 코로나19가 어떻게 확산될지를 시뮬레이션 한다. MS는 이 모델이 잠재적으로 생명과 생계를 구할 수 있는 패턴을 보여줄 수 있다고 믿고 있다.

듀크 대학 연구팀은 MS 애저 컴퓨팅을 활용해 다수의 코로나19 확진자가 동일한 인공호흡기를 사용할 수 있는 인공호흡기 분할을 조사하고 있다.

(사진=셔터스톡)
(사진=셔터스톡)

구글

구글도 클라우드 플랫폼을 활용해 컨소시엄 허가자에게 컴퓨팅, 스토리지, 워크로드 관리 서비스를 제공하고 있다. 최근 코로나19 치료법, 백신을 연구하는 학회 및 연구원을 위해 2000만 달러의 컴퓨팅 크레딧을 적립했다. 컨소시엄과의 협업의 일환으로 노스이스턴 대학 연구진과 역학 모델링 작업을 진행하고, 마드리드 콤플루텐세 대학과 의료 영상에 AI를 적용하고 있다.

또 하버드 글로벌 헬스 인스티튜드와 제휴를 맺고 기업, 정부 기관, 비영리 단체 및 코로나19 연구기관에 자금을 지원했다. 이외에도 MS가 후원하는 클라우드 회사 레스스케일과 코로나19 백신개발팀에게 HPC 자원을 무료로 제공한다. 레스스케일은 연구원들이 실험을 시작하고 결과를 기록하는 플랫폼을 제공하고, 구글과 MS는 백엔드 컴퓨팅 자원을 제공한다.

아마존

아마존은 구글과 마찬가지로 컨소시엄을 통해 매칭된 연구자들에게 컴퓨팅과 도구를 공급하고 있다. 현재 11개 이상의 팀이 아마존의 인프라를 사용하고 있으며, 매주 이 과학자들과 함께 아마존 웹 서비스(AWS) 솔루션 설계자 회의를 전담하고 있다.

또한 아마존은 AWS를 활용해 코로나19 진단을 더욱 발전시키고 있는 35개 이상의 기관과 민간 기업에 2000만 달러의 컴퓨팅 크레딧을 제공하고 있다. 테레사 칼슨 AWS 전 세계 공공 부문 부사장은 성명을 통해 “이번 코로나19 팬데믹 사태는 정부, 기업, 학계, 개인이 함께 협력해 이 바이러스를 더 잘 이해하고 궁극적으로 치료법을 찾아야 해결될 것”이라고 말했다.

MIT 미디어랩에서는 코로나19를 비활성화 할 수 있는 ACE2 수용체에서 ‘디코이’ 단백질을 이용해 연구에 매진하고 있다. ACE2 수용체에 대한 데이터에 대해 훈련된 머신러닝 모델을 사용해 AWS에서 실행되며, 연구원들은 변종세포가 체내 다른 단백질과 상호 작용하지 않고 해로운 부작용을 일으키는지에 관해 연구 중이다. 연구팀은 특별한 문제가 발생하지 않는 한 쥐를 이용한 실험이 곧 시작될 것이고, 이어 임상실험에 돌입할 것이라고 밝혔다.

이와는 별도로 AWS는 어린이 국립 병원 연구팀에게 수백 개의 데이터 세트를 결합해 코로나19를 치료할 수 있는 유전자 식별도 지원하고 있다. 아이오와 주립 대학 연구팀은 코로나19 변종들 사이의 관계를 조사하기 위해 공공 게놈 데이터 세트로 진화 모델을 두드리고 있다. 또한 에모리 대학 내 과학자들은 코로나19에 관한 핵심 개념을 추출하고 요약하는 웹 기반 도구인 tmCOVID를 개발하고 있다.

엔비디아

엔비디아는 14개 컨소시엄 프로젝트를 위해 미국 오크릿지 국립연구소에 있는 자사 슈퍼컴퓨터 서밋에서 300만 GPU 이상의 시간을 소비했다. 서밋은 세계에서 가장 빠른 슈퍼컴퓨터로 500위 안에 들어 있다. 또 2만 GPU 인프라인 새턴V를 제공하고 있다. 새턴V는 엔비디아 내 연구원들이 코로나19 연구 애플리케이션을 최적화하기 위해 사용하고 있다.

이 외에도 코로나19를 포함한 다양한 질병에 대한 치료법을 개발하기 위해 단백질 역학을 시뮬레이션하는 분산 컴퓨팅 프로젝트를 실행하고 있다.

MS와 협력해 UC 리버사이드와 양자화학 솔루션도 연구한다. 많은 전문가가 이 회사 오픈소스 툴인 HPC 컨테이너 메이커를 이용해 프로젝트를 주도했다. 또다른 디버깅 툴을 이용해 버그에 대한 해결책도 개발했다. 버그를 해결함으로써 기존 80만 GPU 시간을 30만 GPU 시간으로 단축시키고, 약 50만 달러를 절약할 수 있었다.

카네기멜론 대학에서는 엔비디아와 협력해 AI 알고리즘으로 생체 활성 분자를 식별하는 고투과 가상 선별이라는 과제를 수행하고 있다. 이 과정의 첫 단계는 AI를 활용해 화학회사에서 구매할 수 있는 분자 라이브러리를 분석해 시뮬레이션에서 선별을 준비하는 것이다. 이후 심사 우수 지원자는 AI가 강화된 분자역학을 시뮬레이션하고, 이를 통해 최종 심사에서 최고 선별작이 선정돼 파트너 연구소를 지정받게 된다.

(사진=셔터스톡)
(사진=셔터스톡)

IBM

데이브 튜렉 IBM 기술 컴퓨팅 부사장은 "코로나19 연구는 하드웨어로 구동되는 기계와 연구소와 기관 내에서 스펙트럼 전반에 걸쳐 파트너와 함께 계속 하고 있다"고 말했다.

그는 성명에서 “컨소시엄은 대규모 계약 없이도 자원을 공유하고 과학제안을 신속히 처리해 최상의 자원에 맞추는 방식으로 협력했다”면서 “그 팀들은 빠른 진전을 보이고 있고, 이 슈퍼컴퓨팅 프로젝트는 코로나바이러스를 이해하기 위해 새로운 접근법을 사용하고 있다”고 설명했다.

예를 들어 영국 IBM 연구원들은 분자 시뮬레이션을 AI와 결합해 코로나19 약품으로 용도 변경할 수 있는 화합물을 발견하는 연구를 수행하고 있다. 이들은 미 텍사스 첨단 컴퓨팅 센터(TACC) 내 트란테라 슈퍼컴퓨터를 사용해, 몇 시간 안에 몇 달간의 연구를 완수할 계획이다.

유타 대학 연구진은 IBM의 도움으로 국립 슈퍼컴퓨팅 센터 블루 워터스 슈퍼컴퓨터를 활용해 코로나19와 관련된 2000개 이상의 분자 모델을 생성했다. 이들은 분자의 전기장 에너지 추정치에 근거해 모델 순위를 매겼다.

연구팀은 N3라는 펩타이드 억제제로 단백질과 펩타이드를 분해하는 효소인 바이러스의 주 프로테아제 구조를 복합적으로 조사했다. 이후 이들은 분자 동적 시뮬레이션과 특정 구조의 최적화를 포함하는 에볼라 중지 분자를 식별하기 위해 개발된 접근법을 적용했다.

연구진은 분자역학 코드인 앰버를 사용해 센티미터의 1억분의 1 내에서 실험 결과를 관찰했는데, 이는 오직 슈퍼 현미경만이 감지할 수 있는 측정치다.

유타 대학 연구진은 “우리의 희망은 앞으로 몇 주 안에 실험적으로 검증할 수 있는 새로운 펩타이드 억제제를 발견하는 것”이라며 “우리는 펩타이드를 더 안전한 약물로 만들기 위해추가 설계를 할 것”이라고 말했다.

코로나19가 바이러스에 가득 찬 물방울을 통해 퍼지는 것은 잘 알려져 있는 사실이다. 공기 중 이 물방울은 에어컨, 바람, 그리고 다른 형태의 난기류에 의해 옮겨진다. 그러나 공중전송률은 여전히 논쟁의 대상이 되고 있으며, 일부 전문가들은 공중전송에 대한 증거를 수집하는 데만 수년이 걸리고 그 사이 코로나바이러스는 많은 생명을 앗아갈 수 있다고 말한다.

보다 안전한 선명성 추구를 위해 유타대와 로렌스 리버모어 국립 연구소 과학자들은 공중 호흡기 감염병의 개인간 전염을 연구하기 위해 컨소시엄의 슈퍼컴퓨팅 자원을 사용할 계획이다. 이들의 연구는 공기 내 물방울이 더 빨리 인간의 기도를 오염시킨다는 가설에서부터 시작했다. 단기 목표는 물방울 입자가 어디에 정착하는지를 이해하는 것이다. 연구진은 “이번 연구의 목적은 공기 중 호흡기 감염병 전염에 대한 우리의 이해를 근본적으로 향상시키는 것”이라고 밝혔다.

인텔

인텔은 LAMPS(분자역학 코드), 그로맥스(단백질, 지질, 핵산 시뮬레이션 패키지), NAMD(기타 분자역학 코드), 앰버 등 HPC 애플리케이션의 코드 최적화를 위한 엔지니어 인력을 보유하고 있다.

협력사와 툴과 아키텍처 지식 및 소프트웨어를 공유하며 코로나19 애플리케이션을 개선하고, 인텔 기반 하드웨어에서 성능을 확장하고 있다.

인텔이 중점적으로 다루는 분야 중 하나는 NAMD와 협력해 Xeon 프로세서에 대한 더 빠른 시뮬레이션을 제공하는 코드 버전을 출시하는 것이다.

연구자들이 바이러스 감염의 측면을 더 잘 이해할 수 있게 함으로써 코로나19 관련 분자의 시뮬레이션에서 더 긴 시간 수정을 달성할 수 있도록 할 계획이다. 이 업데이트는 이달 중에 조기 사용하기 위해 공개할 예정이다.

HP

휴렛팩커드엔터프라이즈(HPE)의 일부 작업은 컨소시엄을 통해 이뤄지며, 나머지는 다수의 고객과 파트너에 집중하고 있다.

지난해 9월 약 13억달러에 크레이를 인수, 다른 연구센터보다 더 많은 슈퍼컴퓨터와 HPC 시스템을 사용하고 있다.

HPE는 MS와 맺고 앨라배마 주립대학과 협력해 애저 클라우드를 통해 센티넬 슈퍼컴퓨터를 공급, 다양한 단계의 약물 설계 프로세스를 지원하고 있다. 연구자들은 둘 이상의 분자의 상호작용을 수반하는 생물정보학적 모델링의 일종인 분자 도킹 접근법을 사용하고 있다.

센티넬은 식물, 동물, 곰팡이 등 자연 화합물이 코로나19 단백질과 어떻게 상호작용하는지를 계산한다. 이전에는 2만개의 분자 도킹이 24시간 걸리던 것이 슈퍼컴퓨터를 활용하는 현재 7, 8분 만에 단백질 목표치를 계산할 수 있다. 연구팀은 하루에 120만개의 분자 도킹을 수행할 수 있다.

HPE는 또한 미 국립 아르곤 연구소에 있는 테타 슈퍼컴퓨터로 로렌스 리버모어 국립연구소 작업을 지원하고 있다. 연구진의 목표는 AI를 응용해 코로나바이러스 관련 수십억개의 분자 시뮬레이션 과정을 가속화하는 것이다. AI를 활용한 신속한 실험방법 덕분에 기존 1040명이던 실험참가자를 20명으로 줄였다. 

이외에도 HPE는 프랑스 국립과학연구센터, GENCI와도 협력해 HPE가 디자인한 GENCI의 장 제이 슈퍼컴퓨터를 활용한 연구에 박차를 가하고 있다. 이 팀은 쟝 제이 슈퍼컴퓨터를 사용해 여러 그래픽 카드로 작동하고 큰 생물학적 분자의 원자 수준에서 시뮬레이션 하도록 설계된 병렬 컴퓨팅 접근 방식인 팅커HP 소프트웨어를 최적화하고 있다. 팅커HP는 다양한 데이터 집약적인 계산을 동시에 수행해 다른 계산법보다 더 빠르게 분자 상호작용 3D 시뮬레이션을 생성한다.

민간 부문

컨소시엄 활동이 학문적인 것만은 아니다.  다수 스타트업도 방대한 계산 리소스를 사용해 코로나19를 표적으로 하는 치료, 분자 설계 및 약물 개발에 나서고 있다.

콜카타에 본사를 둔 노벨 테크사이언스는 3000 가지 이상의 식물 화학 물질을 식별하고 있고, 영국 포스트Er은 60개 이상의 단편적중을 기반으로 억제제를 생산하려는 문샷프로젝트를 감독하고 있다. 코로나19 분자 구조를 확인하기 위한 실험에서 분리, 기계학습 알고리즘을 실행해 제안을 심사하고 합성 계획을 생성하는 형태로 약 21개의 효과적인 분자설계를 식별하는 성과도 올렸다. 이프로젝트 결과는 몇 달 안에 동물을 대상으로 테스트할 예정이다. 이 실험이 성공하면 오픈소스 방식으로 첫 약물을 개발하게 된다.

이 회사는 성명서에서 “기계 학습은 이러한 화합물을 만드는 최적의 방법을 결정하는 시간을 줄일 수 있다"며 "우리는 전세계 과학계가 코로나19를 치료할 수 있는 약물 후보를 제안 할 수 있다고 믿는다"고 말했다.

또 다른 민간 부문 프로젝트는 런던의 AI 신생기업 큐아노가 주도하고 있다. 이 팀은 코로나19와 유사한 질병에 효과적인 약물을 디자인하는 연구를 진행하고 있다. 기존 항 바이러스 약물 관련 바인딩 데이터로 만든 딥러닝 분류 모델을 검색하는 유전자 알고리즘을 활용한다. 이러한 도구를 도킹 및 분자 역학 시뮬레이션과 결합해 결과를 향상시키고 항 바이러스 화합물로 합성하기 위해 분자 설계를 스코어링하는 데 사용할 수 있는 기계 학습 모델을 산출한다.

컨소시엄 주변의 추진력은 가속화되고 있다. IBM은 지난달 UKRI(UK Research and Innovation)와 CSCS(Swiss National Supercomputer Center)가 컨소시엄에 참여해 에든버러 대학의 ARCHER, 과학 기술 시설위원회의 DIRAC, 생명 공학 및 생물 과학 연구위원회의 얼햄 연구소, 세계 6위 슈퍼컴퓨터인 Piz Daint를 사용할 수 있게 됐다고 발표했다. 이로써 지난 3월 300FP, 5월 중순에는 437FP이던 연산능력을 최대 483FP까지 높일 수 있게 됐다.

튜렉 IBM 팁컴퓨팅 담당 부사장은 “코로나19 HPC 컨소시엄은 지금까지 만들어진 최대 규모의 공공-민간 컴퓨팅 파트너십"이라며 "어떤 종류의 대규모 계약도 없이 자원을 공유하고 컨소시엄에 제공된 과학적 제안을 신속하게 처리하고 최상의 자원과 일치시키는 프로세스를 관리하는 방식으로 함께 해오고 있다"고 컨소시엄 역할을 소개했다.

[관련기사] 코로나19 슈퍼컴 컨소시엄에 영국·스위스 가세

[관련기사] 코로나와 싸우는 컴퓨팅 파워...AI, 빅데이터, 슈퍼컴

 

키워드 관련기사
  • "가속 컴퓨팅으로 난제 해결'...엔비디아 'GTC 2020' 기조연설
  • '코로나19' 잡을 슈퍼컴 기사단 '제다이(JEDI)' 출현
  • KISTI, 코로나 19 치료제 약물 후보군 8종 확인