엔비디아는 복잡한 AI 및 고성능 컴퓨팅 워크로드에서 오늘날 가장 빠른 서버의 10배 성능을 제공하는 Arm 기반 프로세서인 엔비디아 그레이스 CPU를 제공한다.(사진=엔비디아)
엔비디아는 복잡한 AI 및 고성능 컴퓨팅 워크로드에서 오늘날 가장 빠른 서버의 10배 성능을 제공하는 Arm 기반 프로세서인 엔비디아 그레이스 CPU를 제공한다.(사진=엔비디아)

엔비디아는 21일(한국시간) GTC 2022에서 'H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPU)'가 본격 생산에 돌입했다고 밝혔다. 

이에 따라 델 테크놀로지스, 휴렛펙커드 엔터프라이즈, 레노버, 슈퍼마이크로와 클라우드 서비스 공급업체 AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 클라우드 등이 H100을 기반으로 한 제품 및 서비스를 출시할 계획이다.

지난 4월에 처음 공개된 H100은 800억개의 트랜지스터로 제작됐으며 다양한 기술 혁신이 적용됐다. 그중에는 트랜스포머 엔진(Transformer Engine)과 NV링크(NVLink) 인터커넥트가 포함돼 있는데, 이를 통해 고급 추천 시스템과 대용량 언어 모델과 같은 최대 AI 모델을 가속화하고 대화형 AI와 약물 발견과 같은 분야의 혁신을 주도할 수 있다.

젠슨 황 엔비디아 CEO는 "호퍼는 언어기반 AI, 로봇공학, 헬스케어, 생명과학의 발전을 이끄는 데 사용되는 수조개의 매개 변수를 가진 모델을 훈련시키기 위해 무수한 데이터를 처리하고 정제하는 AI 공장의 새로운 엔진"이라며 "호퍼의 트랜스포머 엔진은 성능을 수십배까지 끌어 올려 기업과 연구자의 손이 닿는 곳에 대규모 AI와 HPC를 배치한다"고 설명했다.

아울러, 세계 최고의 컴퓨터 제조업체들이 새로운 '엔비디아 그레이스 슈퍼칩(NVIDIA Grace Superchip)'을 채택해 자연어 처리, 추천시스템, 슈퍼컴퓨팅 등 AI 및 고성능 컴퓨팅(HPC) 워크로드를 차세대 서버에 맞춰 개발하고 있다고 발표했다. 그레이스 슈퍼칩은 제조업체가 현재 선도하는 데이터센터 CPU보다 최고의 성능과 두 배 향상된 메모리 대역폭 및 에너지 효율성을 제공하는 시스템을 구축할 수 있게 한다.

엔비디아 그레이스 CPU 슈퍼칩은 고대역폭, 저지연, 저전력의 엔비디아 NV링크(NVLink)-C2C 상호 연결을 통해 일관성 있게 연결된 두 개의 암(Arm) 기반 CPU를 특징으로 한다. 각 암 CPU는 초당 1테라바이트의 메모리 하위 시스템을 갖춘 최대 144개의 고성능 암 니오버즈(Neoverse) 코어로 구성된다.

그레이스 CPU 슈퍼칩은 최신 PCIe 5세대 프로토콜과 인터페이스해 최고 성능의 GPU는 물론, 안전한 HPC 및 AI 워크로드를 위한 '엔비디아 커넥트X-7 스마트 네트워크 인터페이스 카드(NIC)' 및 '엔비디아 블루필드-3 DPU'와의 연결을 극대화한다.

'그레이스 호퍼(Hopper)' 슈퍼칩은 NV링크-C2C와 연결된 통합 모듈에서 엔비디아 호퍼 GPU H100과 엔비디아 그레이스 CPU를 결합해 HPC 및 대규모 AI 애플리케이션을 처리한다.

엔비디아 그레이스 기반 시스템은 풀 스택 통합 컴퓨팅을 위해 엔비디아 AI 및 엔비디아 HPC 소프트웨어 포트폴리오를 실행한다.

엔비디아 그레이스 슈퍼칩은 제조업체가 현재 선도하는 데이터센터 CPU보다 최고의 성능과 두 배 향상된 메모리 대역폭 및 에너지 효율성을 제공하는 시스템을 구축하는데 필요한 청사진을 제공한다. 

슈퍼컴퓨팅이 엑사스케일 AI 시대로 접어들며 엔비디아 그레이스 CPU 슈퍼칩 및 그레이스 호퍼 슈퍼칩은 기후 과학, 에너지 연구, 우주 탐사, 디지털 생물학, 양자 컴퓨팅 등의 분야에서 이전에는 도달할 수 없었던 엄청난 과제를 해결할 수 있는 HPC 및 AI 플랫폼의 기반을 형성하고 있다.

박찬 위원 cpark@aitimes.com

[관련기사]엔비디아, GPU 벤치마크 테스트서 기술력 입증

[관련기사]핫칩스34에서 맞붙은 미래 반도체 전쟁

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지