경쟁 부족으로 인해 MLPerf에서 최신 H100과 A100 GPU를 기존 최고 성능 제품인 A100과 비교했다.(사진=엔비디아)
경쟁 부족으로 인해 MLPerf에서 최신 H100과 A100 GPU를 기존 최고 성능 제품인 A100과 비교했다.(사진=엔비디아)

엔비디아의 'H100' GPU와 'A100' GPU가 인공지능(AI) 훈련에 대한 MLPerf 벤치마크 테스트에서 각각 기업용 AI 워크로드 부문과 고성능 컴퓨팅(HPC) 부문에서 새로운 성능 기록을 세웠다고 포브스가 9일(현지시간) 보도했다.

MLPerf는 6개월 단위로 시행하는 AI 성능 측정을 위한 업계 표준 벤치마크 테스트다. 아마존, 암, 바이두, 구글, 하버드 대학교, 인텔, 메타, 마이크로소프트, 스탠포드 대학교, 토론토 대학교 등을 포함하는 광범위한 그룹의 지원을 받는다.

엔비디아 H100은 인텔의 Gaudi2 AI 칩 및 곧 출시될 Sapphire Rapids XEON 프로세서에 비해 속도가 빠르다.(사진=엔비디아)
엔비디아 H100은 인텔의 Gaudi2 AI 칩 및 곧 출시될 Sapphire Rapids XEON 프로세서에 비해 속도가 빠르다.(사진=엔비디아)

엔비디아 H100 GPU ‘호퍼(Hopper)’는 8개의 MLPerf 엔터프라이즈 워크로드 모두에서 훈련 모델에 대한 세계 기록을 세웠다.

기존 최고 성능의 A100 GPU보다 최대 6.7배 더 높은 성능을 제공했다. 엔비디아 A100 GPU는 MLPerf HPC 벤치마크 제품군에서 소프트웨어의 발전 덕분에 2.5배 더 높은 성능을 기록했다.

전 세계 테스트에서 A100 GPU는 훈련 속도와 처리량 모두에서 선두를 기록했다.(사진=엔비디아)
전 세계 테스트에서 A100 GPU는 훈련 속도와 처리량 모두에서 선두를 기록했다.(사진=엔비디아)

A100 GPU는 슈퍼컴퓨터에서 실행되는 천체 물리학, 일기 예보, 분자 역학, 의약품 개발과 같은 까다로운 과학적 워크로드에서 AI 모델 훈련의 모든 테스트를 휩쓸었다.

예를 들어 A100은 천체 물리학에 대한 코스모플로우(CosmoFlow) 테스트에서 AI 모델을 훈련했는데, 2년 전 MLPerf HPC 테스트 결과보다 9배 높은 결과를 얻었다.  이는 다른 경쟁 제품보다 66배 높은 수치다.

박찬 위원 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지