엔비디아 'B200' GPU (사진=엔비디아)
엔비디아 'B200' GPU (사진=엔비디아)

엔비디아의 'H100' GPU 부족에 따른 배송 지연 기간(리드 타임)이 또 1개월가량 줄어들었다. 이대로라면 연말쯤에는 주문과 동시에 제품을 받아볼 수 있을 것이라는 전망이다.

디지타임스 아시아는 10일(현지시간) 테렌스 려 델 대만 총책임자의 말을 인용, 엔비디아 'H100' GPU의 리드 타임이 8~12주(2~3개월)로 단축됐다고 보도했다.

이는 지난 2월 3~4개월보다 한달가량 줄어든 것이다. 또 불과 6개월 전인 지난해 말까지만 해도 리드 타임은 40~52주(9~12개월)에 달했다.

물론 아직도 GPU에 대한 수요는 매우 높다. 특히 AI 서버에 투입되는 GPU의 수요가, 범용 서버 수요를 대체하고 있다.

하지만 공급망이 완화되고, 특히 GPU 사재기에 나선 일부 기업이 미사용 GPU의 재고 비용을 감당하기 위해 재판매에 나선 것을 큰 이유로 꼽고 있다.

이제 공급 제약으로 어려움을 겪는 기업은 오픈AI와 같이 대형언어모델(LLM)을 훈련하는 회사 정도인 것으로 알려졌다. 이들은 GPU가 수만~수십만개 필요하기 때문이다.

디지타임스는 "이처럼 리드 타임이 빠르게 줄어드는 추세가 유지된다면, 올말쯤에는 H100 주문과 동시에 배송이 이뤄져야 한다"라고 예측했다.

한편 엔비디아는 지난달 열린 GTC 2024를 통해 올해 후반기에 차세대 AI 칩 'B200'을 출시한다고 발표했다. 엔비디아는 이미 아마존과 마이크로소프트(MS), 구글, 오라클, 메타, 오픈AI, 델, 테슬라, xAI 등에 B200을 우선 공급한다고 밝혔다.

임대준 기자 ydj@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지