엔비디아가 대규모 언어모델 개발에 유리한 기반 기술을 공개했다. (사진=셔터스톡)
엔비디아가 대규모 언어모델 개발에 유리한 기반 기술을 공개했다. (사진=셔터스톡)

엔비디아가 대규모 언어모델(LLM) 개발과 배포를 단순화할 수 있다고 발표했다.

회사는 10일(현지시간) 진행된 'GTC 2021' 행사에서 수조 개의 매개변수가 있는 언어모델 훈련을 위한 '엔비디아 네모 메가트론(NeMo Megatron)', 새로운 도메인 및 언어에 대해 교육할 수 있는 맞춤형 대규모 언어모델인 '메가트론 530B' 등을 공개하며 이같이 밝혔다.

언어모델 개발 대표 지원 기업으로서 전 세계 각 기업에 대규모 언어모델을 쉽게 구축하고 확실한 성과를 낼 수 있는 기반 기술을 제공하고 있다는 설명이다.

◆정교한 자연어처리 모델 쉽게 훈련하는 '네모 메가트론' 공개

네모 메가트론은 엔비디아 연구진이 주도하는 오픈소스 프로젝트인 메가트론을 기반으로 한 프레임워크다. 이 툴을 통해 기업은 정교한 자연어처리 모델을 더욱 쉽게 훈련할 수 있다. 또 특정 도메인과 언어에 대한 대규모 언어모델 훈련도 가능하다.

네모 메가트론은 엔비디아의 대규모 가속 컴퓨팅 인프라인 'DGX 슈퍼POD(DGX SuperPOD)' 전반에서 확장할 수 있도록 최적화됐다. 데이터를 수집, 큐레이팅, 구성 및 정리하는 데이터 처리 라이브러리를 통해 대규모 언어모델의 복잡한 훈련을 자동화한다. 데이터, 텐서(tensor) 및 파이프라인 병렬화에 대한 고급 기술을 사용하여 수천 개의 그래픽처리장치(GPU)에 걸쳐 대규모 언어모델을 효율적으로 배포할 수 있다.

엔비디아 네모 메가트론과 DGX 슈퍼POD. (사진=엔비디아)
엔비디아 네모 메가트론과 DGX 슈퍼POD. (사진=엔비디아)

메가트론 530B는 세계에서 가장 큰 맞춤형 언어모델이다. 브라이언 카탄자로(Bryan Catanzaro) 엔비디아의 응용 딥러닝 리서치 부사장은 "대규모 언어모델은 전문 교육이나 감독 없이도 유연하고 능력 있게 심층 도메인 질문에 대답하고, 언어를 번역하고, 문서를 이해 및 요약하며, 스토리와 컴퓨팅 프로그램을 작성할 수 있는 것으로 입증됐다"면서 "새로운 언어 및 도메인에 대한 모델은 지금까지 가장 큰 슈퍼컴퓨팅 애플리케이션이고, 이제 이러한 기능을 전 세계 기업에서 쉽게 사용할 수 있을 것"이라고 말했다.

◆트리톤 추론서버로 추론 워크로드 확장 가능

네모 메가트론과 메가트론 530B는 엔비디아가 이번 GTC 행사에서 최신 업데이트 기능을 발표한 '트리톤 추론서버'에서 새로운 다중 GPU 다중 노드 기능을 통해 대규모 언어모델 추론 워크로드를 여러 GPU 및 노드에서 실시간으로 확장할 수 있다.

트리톤 추론서버를 사용하는 메가트론 530B는 두 개의 엔비디아 DGX 시스템에서 실행된다. 중앙처리장치(CPU) 서버의 처리시간을 1분 이상에서 0.5초로 단축하고 실시간 애플리케이션에 대규모 언어모델을 구현할 수 있다.

트리톤 추론서버는 전 세계 2만 5000명 이상의 고객들이 사용하는 AI 추론 플랫폼이다. 대표 고객사로는 캐피탈 원(Capital One), 마이크로소프트(Microsoft), 지멘스 에너지(Siemens Energy), 스냅(Snap) 등이 있다.
 
이 서버는 최근 업데이트로 모든 AI 모델과 프레임워크에 대한 교차 플랫폼 추론을 제공하는 오픈소스 엔비디아 트리톤 추론 서버 소프트웨어 및 AI 모델을 최적화할 수 있게 됐다. 또 엔비디아 GPU의 고성능 추론을 위한 런타임을 제공하는 텐서RT(Tensor RT)도 지원한다.

엔비디아가 이번 GTC 행사에서 '트리톤 추론서버'를 최신 업데이트 했다고 밝혔다. (사진=엔비디아)
엔비디아가 이번 GTC 행사에서 '트리톤 추론서버'를 최신 업데이트 했다고 밝혔다. (사진=엔비디아)

◆빈브레인·시디 등 글로벌 기업, 엔비디아 기반 기술로 대규모 언어모델 구축

엔비디아 기반 기술로 대규모 언어 모델을 구축한 업체로는 빈브레인(VinBrain), 시디(SiDi)  등이 있다. 

베트남 기반 AI 의료 회사인 빈브레인은 DGX 슈퍼POD을 통해 임상 언어 모델을 개발·배포했다. 이 모델은 방사선 전문의와 원격 의료를 위해 개발됐다. 현재 100개 이상의 병원에서 근무하는 600명 이상의 의료 종사자가 사용 중이다.

시디(SiDi)는 브라질 AI 연구개발 기관 중 한 곳이다. 2억 명이 넘는 브라질, 포르투갈어 사용자가 사용할 수 있도록 삼성의 가상 비서를 채택했다. 

존 이(John Yi) 시디 최고경영자(CEO)는 "우리 팀은 강력한 AI 성능과 특수 소프트웨어를 요하는 가상 비서 및 챗봇을 변화하는 언어의 뉘앙스에 맞게 훈련하고 조정하는 오랜 개발경험을 가지고 있다"면서 "엔비디아 DGX 슈퍼POD는 우리 팀이 선진화된 작업을 통해 브라질의 포르투갈어 사용자에게 세계 최고의 AI 서비스를 제공하는 데 이상적이다"라고 말했다. 

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사] [GTC 2021] 젠슨 황 엔비디아 CEO "엔비디아 생태계, 모든 산업으로 확대"...전방위적 기술 지원 자신

[관련기사] [GTC 2021] "엔비디아 제품으로 신약 개발 SW 만들었다"

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지