구글의 반격! 25초 학습으로 GPT3와 경쟁한다
상태바
구글의 반격! 25초 학습으로 GPT3와 경쟁한다
  • 입력 2020-07-31 12:20
  • 댓글 0
이 기사를 공유합니다

구글 슈퍼컴퓨터로 AI모델 학습 평균 25초
TPU ver3 보다 2.7배 성능 향상된 ver 4 소개

구글의 새로운 슈퍼컴퓨터가 MLPerf의 기록을 새로 세웠다. 최근 오픈AI가 일으킨 'GPT3 붐'에 맞서 구글이 25초 만에 인공지능 모델을 학습시키는 머신러닝 슈퍼컴퓨터를 30일(현지 시각) 발표했다(https://cloud.google.com/blog/ ). 

MLPerf는 구글, 하버드, 스탠포드 등 글로벌 기업 및 대학들이 주최하는 글로벌 AI칩 성능 테스트. MLPref 테스트 결과는 업계에서 AI하드웨어 성능 측정기의 지표로 활용되고 있다.

이번 MLPerf 훈련에 사용한 구글의 슈퍼컴퓨터는 지금까지 최고 기록을 세운 클라우드 TPUv3보다 용량이 4배 더 크다. 새로운 슈퍼컴퓨터는 TPU(Tensor Processing Unit) 칩 4096개를 탑재했다. TPU칩은 구글에서 자체 개발한 데이터 분석 및 딥러닝용 칩이다.

사진=구글 클라우드 블로그
사진=구글 클라우드 블로그

구글은 "슈퍼컴퓨터로 AI모델 학습 훈련 위해 텐서플로우, JAX, Lingvo등의 머신러닝 플랫폼 사용했다"며 "이번 MLPerf 성능 테스트에서 8개 카테고리 중 6부문에 새로운 기록을 세웠다"고 전했다.

사진=구글 클라우드
사진=구글 클라우드

버트(Bidirectional Encoder Representations from Transformers, BERT) △트랜스포머(Transformer) 등 6개 모델은 'from Scratch' 학습 테스트를 받았다. 각 모델이 학습 완료까지 걸린 시간을 25초 내외. 'from Scratch' 아무 사전 지식 없이 학습을 시작하는 것을 뜻한다.

구글은 4세대 TPU칩을 곧 상용화할 것으로 보인다. 4세대 TPU는 MLPerf에서 기존 3세대보다 2.7배 이상의 성능을 기록했다. 

[Life & 교육] GPT3, 전세계에 강펀치! 구글ㆍ네이버 검색량 최고치

[AI & Tech] GPT-3 활용 사례 BEST 5

기자 프로필


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
유용한 리스티클
  • 지금 사면 좋은 AI 주식 3가지
  • 영국의 5대 AI 기업
  • 개발자가 가장 많이 사용하는 오픈소스는 '제이쿼리'
  • [DNA 우수기업] 〈2〉알서포트...원격지원 SW로 비대면 업무 보조
  • 네이버는 줄이고, 카카오는 늘리고...양사 계열사 현황
  • AI 접목 패션업계, 사용자 수 증가 효과