구글 슈퍼컴퓨터로 AI모델 학습 평균 25초
TPU ver3 보다 2.7배 성능 향상된 ver 4 소개

구글의 새로운 슈퍼컴퓨터가 MLPerf의 기록을 새로 세웠다. 최근 오픈AI가 일으킨 'GPT3 붐'에 맞서 구글이 25초 만에 인공지능 모델을 학습시키는 머신러닝 슈퍼컴퓨터를 30일(현지 시각) 발표했다(https://cloud.google.com/blog/ ). 

MLPerf는 구글, 하버드, 스탠포드 등 글로벌 기업 및 대학들이 주최하는 글로벌 AI칩 성능 테스트. MLPref 테스트 결과는 업계에서 AI하드웨어 성능 측정기의 지표로 활용되고 있다.

이번 MLPerf 훈련에 사용한 구글의 슈퍼컴퓨터는 지금까지 최고 기록을 세운 클라우드 TPUv3보다 용량이 4배 더 크다. 새로운 슈퍼컴퓨터는 TPU(Tensor Processing Unit) 칩 4096개를 탑재했다. TPU칩은 구글에서 자체 개발한 데이터 분석 및 딥러닝용 칩이다.

사진=구글 클라우드 블로그
사진=구글 클라우드 블로그

구글은 "슈퍼컴퓨터로 AI모델 학습 훈련 위해 텐서플로우, JAX, Lingvo등의 머신러닝 플랫폼 사용했다"며 "이번 MLPerf 성능 테스트에서 8개 카테고리 중 6부문에 새로운 기록을 세웠다"고 전했다.

사진=구글 클라우드
사진=구글 클라우드

버트(Bidirectional Encoder Representations from Transformers, BERT) △트랜스포머(Transformer) 등 6개 모델은 'from Scratch' 학습 테스트를 받았다. 각 모델이 학습 완료까지 걸린 시간을 25초 내외. 'from Scratch' 아무 사전 지식 없이 학습을 시작하는 것을 뜻한다.

구글은 4세대 TPU칩을 곧 상용화할 것으로 보인다. 4세대 TPU는 MLPerf에서 기존 3세대보다 2.7배 이상의 성능을 기록했다. 

[Life & 교육] GPT3, 전세계에 강펀치! 구글ㆍ네이버 검색량 최고치

[AI & Tech] GPT-3 활용 사례 BEST 5

키워드 관련기사
  • 에릭 슈미트 구글 전CEO, AI인재 양성 대학 설립
  • 애플·구글, 면접에서 뭘 질문할까?
  • GPT 인기몰이, 사례 모아놓은 닷컴 등장. 깃허브ㆍ트윗이어 웹사이트까지