(사진=엔비디아)
(사진=엔비디아)

젠슨 황 엔비디아 CEO가 딥시크로 인해 GPU 수요가 줄어들 것이라는 예측에 대해 "전 세계가 틀렸다"라고 지적했다. 인공지능(AI) 수요가 훈련에서 추론으로 이동한다며 더 많은 칩이 필요할 것이라고 강조했다.

황 CEO는 18일(현지시간) 미국 캘리포니아 새너제이에서 열린 'GTC 2025' 기조연설에서 차세대 AI 플랫폼인 '블랙웰 울트라(Blackwell Ultra)를)'를 소개하고, 이를 AI 추론에 최적화된 제품이라고 소개했다.

그는 이번 행사를 "AI의 슈퍼볼"이라고 불렀다. 현장에는 행사 몇시간 전부터 수천명이 모여 환호를 보냈다. 

이어 "AI는 엄청난 도약을 이룩했다. 이제 추론과 에이전틱 AI가 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다. 우리는 바로 이 순간을 위해 블랙웰 울트라를 설계했다. 이 다목적 플랫폼은 사전, 사후 훈련과 AI의 추론을 더욱 쉽고 효율적으로 만들어준다”라고 말했다.

블랙웰 울트라는 지난해 등장한 블랙웰 아키텍처를 기반으로 하며, 'GB300 NVL72' 랙 스케일 솔루션과 'HGX B300 NVL16' 시스템을 포함한다. 전 세대인 'GB200 NVL72' 대비 1.5배 뛰어난 AI 성능을 제공한다는 설명이다. 

특히 테스트 타임 컴퓨팅, 즉 추론을 강화한다고 강조했다. 시간과 속도 면에서 가장 앞선 제품으로, 이를 통해 AI 에이전트나 물리 AI와 같은 애플리케이션을 가속한다고 덧붙였다. 이를 지원하기 위한 '다이나모(Dynamo)'라는 새로운 소프트웨어도 발표했다.

황 CEO는 지난 1월 등장한 딥시크로 인해 고성능 GPU 수요가 줄어들 것이라는 예측이 틀렸다며 "추론의 결과로 에이전트 AI에 필요한 계산량은 지난해 생각했던 것보다 100배 이상 많다"라고 말했다.

실제로 아마존과 마이크로소프트, 구글, 오라클 등 4대 퍼블릭 클라우드 공급업체는 지난해 호퍼 칩 130만개를 구매했지만, 이들은 현재 블랙웰 칩 360만개를 구매했다는 것이다. 수요가 "엄청나다"라는 말이다.

하지만 이날 발표한 내용은 최근 팟캐스트나 공식 블로그를 통해 밝혔던 내용과 큰 차이가 없다. 이날 엔비디아 주가는 3.2% 하락했다.

블랙웰의 뒤를 이을 새로운 아키텍처도 소개했다. 수십 테라바이트의 메모리와 '베라(Vera)'라는 맞춤형 설계 CPU를 탑재한 '베라 루빈(Vera Rubin)'은 2026년 하반기에 출시할 예정이다. 이를 업그레이드한 '루빈 울트라'는 2027년 하반기에 등장할 예정이다.

딥시크보다 뛰어나다는 추론 모델도 공개했다. '엔비디아 라마 네모트론 추론(Nvidia Llama Nemotron Reasoning)'이라는 모델은 정확도와 속도 면에서 딥시크-R1을 크게 앞지른다고 밝혔다. 이는 AI 에이전트 구축에 적합하다는 설명이다.

또 "AI 시대의 컴퓨터"라고 소개한 'DGX 스파크'와 'DGX 스테이션'을 공개했다. 사용자가 클라우드 접속 없이 엣지에서 다양한 크기의 AI 모델을 구축하고 미세 조정하고 실행할 수 있는 AI 개인용 슈퍼컴퓨터다.

개인용 AI 컴퓨터 ‘DGX 스파크’와 ‘DGX 스테이션’ (사진=엔비디아)
개인용 AI 컴퓨터 ‘DGX 스파크’와 ‘DGX 스테이션’ (사진=엔비디아)

이 밖에도 제너럴 모터스와 AI를 활용해 로봇과 공장을 강화하고 자동 주행을 강화하기 위해 협력을 확대한다고 밝혔다.

한편, 엔비디아는 보스턴에 양자 컴퓨팅 연구실을 설립한다는 계획을 발표했다. 선도적인 하드웨어 및 소프트웨어 제조업체와 협력해 양자 컴퓨팅 아키텍처 및 알고리즘을 개발하겠다는 내용이다.

임대준 기자 ydj@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지