엔비디아가 MLPerf HPC 벤치마크에서 모델 훈련 속도와 칩당 효율성에서 높은 결과를 기록했다. (출처=엔비디아)
엔비디아가 MLPerf HPC 벤치마크에서 모델 훈련 속도와 칩당 효율성에서 높은 결과를 기록했다. (출처=엔비디아)

엔비디아가 MLPerf HPC 벤치마크에서 인공지능(AI) 성능을 입증했다. 5개 테스트 중 4개에서 우위를 점했다. 

MLPerf HPC 벤치마크는 2018년 5월 처음 시작한 딥러닝 분야 공식 벤치마크 대회다. 고성능컴퓨팅(HPC)을 활용한 과학 애플리케이션에 대한 AI 성능을 평가한다. AI를 사용해 슈퍼컴퓨터에서 시뮬레이션을 가속화하고 강화하는 컴퓨팅 스타일을 중점적으로 다룬다.

이번 벤치마크에서는 ▲코스모플로우(CosmoFlow)로 망원경의 이미지에 있는 물체의 세부 정보를 추정 ▲딥캠(DeepCAM)으로 기후 데이터에서 허리케인과 대기의 강(atmospheric river) 탐지를 테스트 ▲오픈 카탈리스트(OpenCatalyst)로 시스템이 분자 내 원자 간의 힘을 얼마나 잘 예측하는지 추적 등 세 가지 워크로드에서 AI 모델 훈련을 측정했다.
 
각 테스트는 시스템이 모델을 얼마나 빨리 훈련시키는지 측정하는 강력 스케일링(Strong Scaling)과 이에 상응하는 최대 시스템 처리량 수를 측정하는 약 스케일링(Weak Scaling) 두 부문으로 구성됐다.

엔비디아는 이번 벤치마크에서 작년에 시행된 MLPerf 0.7보다 5배 향상된 성과를 냈다. 딥캠 테스트에서는 약 7배 이상 성능 향상을 기록했고, 약 스케일링 부문에서는 작업당 16개의 노드와 256개의 동시 작업을 사용해 딥캠 테스트를 주도했다.

모든 테스트는 엔비디아 상업용 슈퍼컴퓨터인 '엔비디아 셀린(Selene)'에서 실행됐다.

# MLPerf 1.0에서 엔비디아 GPU를 사용한 팀은

이번 벤치마크에 참가한 조직 8개 중 7곳이 엔비디아 GPU를 사용한 결과를 제출했다. 독일 율리히 슈퍼컴퓨팅 센터, 스위스 국립 슈퍼컴퓨팅 센터, 미국 아르곤 및 로렌스 버클리 국립 연구소, 슈퍼컴퓨팅 애플리케이션 국립 센터, 텍사스 고급 컴퓨팅 센터 등이다.

#구체적 성과는

미국 로렌스 버클리 국립 연구소(Lawrence Berkeley National Lab)의 펄머터 페이즈1(Perlmutter Phase 1) 시스템은 6144개의 엔비디아 A100 텐서코어 GPU 중 512개를 사용했다. 이 연구소는 오픈카탈리스트 테스트의 강력 스케일링 부문에서 우위를 기록했다.

#엔비디아의 MLPerf 기록은

엔비디아는 이번 성과까지 포함해 데이터센터, 클라우드, 네트워크 에지 등의 MLPerf 벤치마크에서 8년 연속 최고 점수를 달성했다.

#MLPerf는 누가 주최하나

알리바바, 구글, 인텔, 메타 플랫폼스(구 페이스북), 엔비디아 등이 이끄는 산업 그룹인 ML커먼스(MLCommons)에서 주최한다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사]그래프코어, AI 연산 시스템 IPU-POD 모델군 확대...KT 초대규모 AI 컴퓨팅 환경 지원

[관련기사]퓨리오사AI가 출시한 AI 칩 '워보이', 엔비디아 T4보다 우위 입증

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지