엔비디아가 MLPerf HPC 벤치마크에서 인공지능(AI) 성능을 입증했다. 5개 테스트 중 4개에서 우위를 점했다.
MLPerf HPC 벤치마크는 2018년 5월 처음 시작한 딥러닝 분야 공식 벤치마크 대회다. 고성능컴퓨팅(HPC)을 활용한 과학 애플리케이션에 대한 AI 성능을 평가한다. AI를 사용해 슈퍼컴퓨터에서 시뮬레이션을 가속화하고 강화하는 컴퓨팅 스타일을 중점적으로 다룬다.
이번 벤치마크에서는 ▲코스모플로우(CosmoFlow)로 망원경의 이미지에 있는 물체의 세부 정보를 추정 ▲딥캠(DeepCAM)으로 기후 데이터에서 허리케인과 대기의 강(atmospheric river) 탐지를 테스트 ▲오픈 카탈리스트(OpenCatalyst)로 시스템이 분자 내 원자 간의 힘을 얼마나 잘 예측하는지 추적 등 세 가지 워크로드에서 AI 모델 훈련을 측정했다.
각 테스트는 시스템이 모델을 얼마나 빨리 훈련시키는지 측정하는 강력 스케일링(Strong Scaling)과 이에 상응하는 최대 시스템 처리량 수를 측정하는 약 스케일링(Weak Scaling) 두 부문으로 구성됐다.
엔비디아는 이번 벤치마크에서 작년에 시행된 MLPerf 0.7보다 5배 향상된 성과를 냈다. 딥캠 테스트에서는 약 7배 이상 성능 향상을 기록했고, 약 스케일링 부문에서는 작업당 16개의 노드와 256개의 동시 작업을 사용해 딥캠 테스트를 주도했다.
모든 테스트는 엔비디아 상업용 슈퍼컴퓨터인 '엔비디아 셀린(Selene)'에서 실행됐다.
# MLPerf 1.0에서 엔비디아 GPU를 사용한 팀은
이번 벤치마크에 참가한 조직 8개 중 7곳이 엔비디아 GPU를 사용한 결과를 제출했다. 독일 율리히 슈퍼컴퓨팅 센터, 스위스 국립 슈퍼컴퓨팅 센터, 미국 아르곤 및 로렌스 버클리 국립 연구소, 슈퍼컴퓨팅 애플리케이션 국립 센터, 텍사스 고급 컴퓨팅 센터 등이다.
#구체적 성과는
미국 로렌스 버클리 국립 연구소(Lawrence Berkeley National Lab)의 펄머터 페이즈1(Perlmutter Phase 1) 시스템은 6144개의 엔비디아 A100 텐서코어 GPU 중 512개를 사용했다. 이 연구소는 오픈카탈리스트 테스트의 강력 스케일링 부문에서 우위를 기록했다.
#엔비디아의 MLPerf 기록은
엔비디아는 이번 성과까지 포함해 데이터센터, 클라우드, 네트워크 에지 등의 MLPerf 벤치마크에서 8년 연속 최고 점수를 달성했다.
#MLPerf는 누가 주최하나
알리바바, 구글, 인텔, 메타 플랫폼스(구 페이스북), 엔비디아 등이 이끄는 산업 그룹인 ML커먼스(MLCommons)에서 주최한다.
AI타임스 김동원 기자 goodtuna@aitimes.com
[관련기사]그래프코어, AI 연산 시스템 IPU-POD 모델군 확대...KT 초대규모 AI 컴퓨팅 환경 지원
- 엔비디아, 대화형 AI 소프트웨어 '텐서RT 8' 출시...클라우드와 엣지에서 지원
- 그래프코어 IPU-POD 시리즈, MLPerf벤치마크서 AI 성능 입증
- 엔비디아, MLPerf 벤치마크에서 GPU 기술력 입증
- 자율주행차 4단계 가능하려면... "기술뿐 아니라 법, 제도, 윤리 모두 갖춰져야"
- 구글은 어떤 기업일까...AI 역량 강화 위해 글로벌·전략적 투자 속도 낸다
- 레드햇, 머신러닝 전용 클라우드 '오픈시프트 데이터 사이언스' 출시...AI·ML 도구 지원
- KT, GPU 자원관리 플랫폼 '하이퍼스케일 AI 컴퓨팅' 출시 목전...자체 AI 칩도 개발 중
- 엔비디아, 메타 AI 슈퍼컴퓨터에 A100 공급...5엑사급 성능 발휘
- 퓨리오사AI, 업스테이지의 '모두를 위한 AI'에 동참
