엔비디아 A100 GPU, AWS 최신 머신러닝·HPC용 서버에 탑재 < 산업일반 < AI산업 < 기사본문

A100 텐서코어 GPU, EC2 P4d 인스턴스에 채택
EC2 P4d 인스턴스, 머신러닝 훈련과 HPC 애플리케이션에 사용
A100, 훈련·추론 모든 영역에서 높은 성적 기록

양대규 기자
입력 2020.11.03 17:55
댓글 0

이 기사를 공유합니다

엔비디아 A100 GPU(그래픽처리장치)가 아마존웹서비스(AWS)의 최신 서버에 탑재됐다.

AWS는 머신러닝과 HPC(고성능컴퓨팅)를 위해 마련한 EC2 P4d 인스턴스에 8개의 엔비디아 A100 GPU를 채택했다.

A100을 장착한 EC2 P4d는 400Gbps 네트워킹을 제공해 머신러닝 모델 훈련 시간을 최대 6배 단축한다. A100은 최근 진행된 MLPerf 벤치마크에서 CPU대비 237배 빠른 성능을 보였다. (관련기사 = 엔비디아 최신 MLPerf 추론 결과 1위…단점은 가격·크기 )

인스턴스란?
AWS는 클라우드 서비스로 고객들에게 서버를 제공한다. AWS가 고객들에게 제공하는 서버를 '인스턴스'라고 말한다.

AWS는 범용, 컴퓨팅 최적, 메모리 최적, 가속화된 컴퓨팅, 스토리지 최적 등 다양한 EC2 인스턴스 서비스를 제공한다. 서비스에 따라 EC2 A1, EC2 T4g, EC2 M5 등으로 불린다.

엔비디아는 AWS의 새로운 EC2 P4d 인스턴스에 엔비디아 A100 텐서코어(Tensor Core) GPU가 탑재된다고 3일 밝혔다.

EC2 P4d 인스턴스는 머신러닝 훈련과 HPC 애플리케이션을 위해 최고 성능의 A100 GPU 기반 플랫폼을 지원한다.

기본 FP32 정밀도 대비 각각 FP16에서 최대 3배, T432에서 머신러닝 모델 훈련 시간을 최대 6배 단축한다. 또한 P4d 인스턴스는 탁월한 추론 성능을 제공한다. 지난달 MLPerf 추론 벤치마크에서 엔비디아 A100 GPU는 CPU 대비 최대 237배 빠른 성능을 보였다.