엔비디아가 차세대 플래그십 인공지능(AI) 칩을 선보였다. 기대를 모았던 소식에 최근 하락하던 주가가 잠시 반등했지만 다시 하락 중이다.
엔비디아는 18일(현지시간) 미국 캘리포니아주 새너제이에서 열린 AI 개발자 콘퍼런스 ‘GTC 2024’에서 차세대 AI 칩 'B200'을 공개했다.
B200은 현존 최고 AI 칩으로 평가받는 엔비디아 호퍼 아키텍처 기반 'H100'의 성능을 뛰어넘는 차세대 그래픽처리장치(GPU)다. 기존 H100이 800억개의 트랜지스터로 구성된 반면, 새로운 ‘블랙웰(Blackwell)’ 아키텍처 기반의, B200은 2배가 넘는 2080억개 트랜지스터로 구성됐다.
현존 기술로는 이 정도 규모의 트랜지스터를 넣을 수 없는데, 이를 실현하기 위해 TSMC 4나노(nm) 공정 기술을 사용해 2개의 GPU를 하나로 연결했다.
엔비디아는 B200이 H100 대비 최대 30배의 성능 향상을 제공하며, 비용과 에너지 소비는 최대 25분의1 수준이라고 강조했다.
B200은 1조 매개변수 규모의 대형언어모델(LLM)에 대한 AI 훈련과 추론을 지원한다. 블랙웰은 2세대 트랜스포머 엔진을 갖추고 있으며, 4비트 부동 소수점 AI 추론 기능을 통해 컴퓨팅 및 모델 크기를 두배로 늘려, '챗GPT'와 같은 AI 모델이 응답을 생성하는 데 걸리는 추론 시간이 5배 빨라진다.
젠슨 황 엔비디아 CEO는 “30년 동안 우리는 딥 러닝 및 AI와 같은 혁신적인 혁신을 가능하게 한다는 목표로 가속화된 컴퓨팅을 추구해 왔다”라며 “생성 AI는 우리 시대를 정의하는 기술이다. 블랙웰 GPU는 이 새로운 산업 혁명을 촉진하는 엔진이다. 우리는 세계에서 가장 역동적인 기업들과 협력하여 모든 산업 분야에서 AI의 가능성을 실현할 것이다”라고 말했다.
엔비디아는 초당 900기가비트의 초저전력 NV링크(NVLink) 상호 연결을 통해 2개의 B200 GPU와 엔비디아 그레이스 CPU를 통합하는 새로운 GB200 그레이스 블랙웰 '슈퍼칩(Superchip)'도 공개했다.
이를 통해 최대 1.4엑사플롭(EF)의 AI 성능과 30테라바이트(TB)의 빠른 메모리를 갖춘 더욱 강력한 단일 GPU처럼 실행할 수 있다. 기존 H100 GPU 기반의 GH200 그레이스 호퍼 슈퍼칩에 비해 LLM 추론에서 최대 30배의 성능 향상을 제공한다.
또 엔비디아는 GB200 슈퍼칩 기반의 차세대 AI 슈퍼컴퓨터 'DGX 슈퍼포드(SuperPOD)'를 올 하반기 출시할 예정이다.
DGX 슈퍼포드는 단순한 단일 랙 서버가 아니라, 여러 DGX GB200 시스템의 조합이다. 각 DGX GB200 시스템에는 36개의 엔비디아 그레이스 CPU와 72개의 엔비디아 B200l GPU를 포함하는 36개의 GB200 슈퍼칩이 탑재돼 있으며, 5세대 엔비디아 NV링크를 통해 단일 슈퍼컴퓨터로 구축된다.
DGX 슈퍼포드는 8개 이상의 DGX GB200 시스템으로 구성될 수 있고 엔비디아 퀀텀 인피니밴드(Quantum InfiniBand)를 통해 연결된 수만개의 GB200 슈퍼칩으로 확장될 수 있다. 특히 LLM 훈련과 추론에 중요한 240테라바이트의 메모리를 제공하며, 11.5EF의 AI 슈퍼컴퓨팅 성능을 갖추고 있다.
새로운 GB200 기반 DGX 시스템은 엔비디아의 자체 DGX 클라우드와 AWS, 구글, 마이크로소프트(MS) 등 퍼블릭 클라우드 플랫폼에서 제공할 예정이다.
이와 함께 엔비디아는 기업이 최적화된 생성형 AI 환경을 더 쉽게 구축, 활용할 수 있도록 '생성 AI를 위한 마이크로서비스'를 선보인다고 밝혔다. 이 마이크로서비스는 컨테이너 형태로 제공되며, 쿠다(CUDA) 플랫폼과 엔비디아의 NIM 마이크로서비스를 포함한 풀 스택 구성과 사전 훈련된 모델을 갖췄다.
NIM 마이크로서비스는 엔비디아, A121, 어뎁트, 코히어, 게티이미지, 셔터스톡 모델과 더불어 구글, 허깅페이스, 메타, 마이크로소프트, 미스트랄 AI, 스태빌리티 AI 의 오픈 모델을 배포할 수 있는 프로덕션 AI 컨테이너를 제공한다. 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API도 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다.
한편 기대가 집중됐던 이벤트로 18일 뉴욕증시에서 0.7% 오른 884.55달러로 거래를 마친 엔비디아 주가는 B200 공개 후 시간 외 거래에서 2% 가까이 오히려 하락했다.
차세대 칩 루머에 주식을 매집했던 투자자들이 발표가 나오자 매도에 나섰다는 분석이다.
박찬 기자 cpark@aitimes.com
- 엔비디아, 차세대 GPU ‘B100’ 공개 예정…"GTC 기대감 역대급"
- 엔비디아, 'GTC' D-10 인터뷰..."역대 최대 규모 개최"
- 엔비디아, 3월 ‘GTC 2024’개최...생성 AI·가속컴퓨팅·로보틱스 혁신 공개
- 엔비디아 '블랙웰'에 빅테크 찬사 일색...오픈AI·메타·테슬라도 연내 도입
- 엔비디아, 양자 컴퓨팅 클라우드 서비스 합류...GPU·쿠다로 생태계 확장
- "젠슨 황, GTC서 록스타 같은 환호 받아"
- 엔비디아, 개발자 AI 모델 배포 돕는 NIM 서비스 정식 출시
- 젠슨 황이 밝힌 'CEO의 수학'...“GPU 많이 살수록 많이 절약”
- 모건 스탠리 “엔비디아 블랙웰 서버 한대당 41억 이상”
- [2024 결산] AI 챗봇 4종이 선정한 2024년 AI 뉴스 톱 10
