"생성 인공지능(AI)을 위한 모든 인프라를 지원하겠다."

젠슨 황 엔비디아 창업자 겸 CEO는 21일(현지시간) 온라인으로 진행한 'GTC 2023' 기조연설자로 등장, 기업의 생성 AI도입에 필요한 '풀 스택(Full Stack)' 서비스를 제공한다고 밝혔다.

황 CEO는 "현재 컴퓨팅은 빠른 속도로 발전하고 있다. 엔진은 가속컴퓨팅이고 연료는 인공지능(AI)이다"면서 "오늘 풀 스택, 즉 데이터센터 스케일의 가속컴퓨팅 플랫폼부터 새로운 칩, 시스템, 라이브러리, 클라우드 서비스 등 모든 것을 선보인다"고 말했다.

하이라이트는 AI 전용 슈퍼컴퓨터 DGX였다. 황 CEO가 'AI 필수기기' 또는 'AI 공장'이라고 칭한 이 시스템은 이미 오픈AI를 비롯, 포춘 100대 기업 중 절반 이상이 사용 중인 것으로 알려졌다.

더불어 엔비디아는 마이크로소프트(MS)와 구글, 아마존웹서비스(AWS)와의 제휴로 DGX를 클라우드로 공급한다고 발표했다. 즉 클라우드 기업을 위한 슈퍼컴퓨터 클라우드 서비스를 제공하는 셈이다.

DGX의 GPU 역할을 하는 칩 H100도 소개했다. 8개의 H100으로 구성되는 모듈은 생성 AI의 핵심인 '트랜스포머' 엔진 역할을 한다는 것이다. 이 제품은 하반기부터 본격 출시할 예정이다. 현재 MS 애저 서비스에서 프리뷰 형식으로 테스트 중이다.

또 엔비디아는 DGX 클라우드 기능을 활용해 기업이 맞춤형 생성 AI 모델을 생성하고 사용할 수 있도록 지원하는 'AI 파운데이션'도 출시했다. ▲LLM(거대언어모델)용 '네모' ▲이미지, 비디오 및 3D 애플리케이션용 '피카소' ▲생물학적 데이터를 기반으로 과학 텍스트를 생성하는 '바이오네모' 등이다.

개발자가 생성 AI 애플리케이션을 신속하게 구축할 수 있도록 설계된 4개의 추론 플랫폼도 선보였다. 여기에는 ▲비디오 생성 AI를 위한 'L4' ▲2D 및 3D 이미지 생성을 위한 'L40' ▲LLM을 위한 'H100 NVL' 및 ▲추천 시스템을 위한 '그레이스 호퍼' 등이 포함됐다.

이 밖에도 반도체 기업이 칩을 설계하고 개발할 수 있게 도와주는 쿨리토 등 라이브러리로 대거 선보였다. 어도비를 비롯해 다수 기업과 파트너십을 체결한 사실도 공개했다.

한편 이날 키노트는 총 1시간17분 가운데 56분을 AI 소개에 할애했다. 지난해까지 행사의 대부분을 차지했던 '메타버스'에 할애한 시간은 산업용 디지털 트윈 구축 도구 '옴니버스'의 클라우드 서비스와 파트너를 소개하는 20여분이 전부였다.

황 CEO는 "가속컴퓨팅으로 개발자의 성공을 돕고 R&D에 재투자하는 '가속컴퓨팅 에코시스템'을 구축했다"며 "우리는 전 세계가 이제까지 불가능했던 일을 해내도록 돕고 있다"는 말로 연설을 마쳤다.

임대준 기자 ydj@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지