페브리스 모이잔 그래프코어 글로벌 세일즈 수석 부사장. (사진=그래프코어, 셔터스톡/편집=김미정 기자)
페브리스 모이잔 그래프코어 글로벌 세일즈 수석 부사장. (사진=그래프코어, 셔터스톡/편집=김미정 기자)

인공지능(AI) 개발과 운영에 사용하는 반도체 ‘지능처리장치(IPU, Intelligence Processing Unit)’에 주력하고 있는 그래프코어가 장치의 성능을 다시 한번 입증했다. 그래프코어는 올해 '보우(BOW) IPU' 프로세서와 AI 컴퓨터 시스템 '보우 팟(BOW POD)'을 출시해 성능을 더 높였다. 2024년에 상용화 예정인 초지능 AI 컴퓨터도 개발 중이다. IPU 시스템으로 대규모 AI 모델 발전 속도를 높이기 위해 최근 한국전자통신연구원(ETRI)과 업무 협약도 체결했다.

페브리스 모이잔(Fabrice Moizan) 그래프코어 글로벌 세일즈 수석 부사장은 7일 열린 기자간담회에서 “그래프코어는 2년 새 빠르게 성장했다”며 “투자액도 3억달러(약 3천900억원)에서 7억3천만달러(약 9천490억원)로 성장하고 그만큼 IPU 시스템 기능도 업그레이드됐다”고 강조했다.

그래프코어가 GPU 역할을 대신할 수 있는 반도체로 내세운 건 IPU다. AI 작업을 위해선 많은 병렬처리가 필요하다. 이때 전력을 줄이면서 효율성을 늘릴 수 있는 게 IPU다. 필 브라운(Phil Brown) 그래프코어 대형 시스템 개발 기획 부사장은 “현재 이미지 분류, 자연어 처리, 음성 변환등 대규모 AI 모델은 모두 IPU로 작동할 수 있다”며 “그래프코어가 개발한 프로세서로 사용할 때 퍼포먼스가 배로 늘어난다”고 강조했다.

'BOW-POD16', 엔비디아 DGX A100보다 31% 더 빨리 훈련해

모이잔 부사장은 'BOW-POD16'이 가진 우수성을 최근 열린 MLPerf 벤치마크 결과로 증명했다. (사진=그래프코어)
모이잔 부사장은 'BOW-POD16'이 가진 우수성을 최근 열린 MLPerf 벤치마크 결과로 증명했다. (사진=그래프코어)

모이잔 부사장은 'BOW-POD16'이 가진 우수성을 최근 열린 MLPerf 벤치마크 결과로 증명했다. MLPerf 벤치마크는 머신러닝(ML) 성능을 조사하는 벤치마크 중 하나다. 엄격한 규율을 토대로 칩 기능을 평가해 잠재 고객사에 칩 성능을 각각 비교할 수 있는 정보를 제공한다.

그래프코어는 최근 열린 MLPerf 2.0 벤치마크 테스트에서 IPU(Intelligence Professing Unit)를 기반으로 한 그래프코어 시스템이 엔비디아 대표 GPU ‘DGX A100’ 성능을 능가했다. 이미지처리 모델인 RESNETT-50과 자연어처리(NLP) 모델 BERT를 훈련하는 테스트에서 IPU 기반 시스템인 BOW-POD16의 성능 평가가 엔비디아 시스템보다 더 높게 나왔다.

실제로 BOW-POD16은 이미지처리 모델 ResNet-50을 훈련하는데 19분 6초를 기록했다. 엔비디아 DGX A100(28분 7초)보다 10분가량 빠른 속도다. 성능으로 따지면 31% 더 높은 셈이다. BERT에 대해서는 지난 MLPerf 1.1 벤치마크와 비교했을 때 성능이 37% 올랐다.

사람 두뇌 수준 메모리 갖춘 초지능 '굿 컴퓨터', 2024년 상용화

브라운 기획 부사장은 인간뇌 수준의 매개변수를 능가하는 초지능 AI컴퓨터를 2024년 상용화하겠다고 발표했다. (사진=그래프코어)
브라운 기획 부사장은 인간뇌 수준의 매개변수를 능가하는 초지능 AI컴퓨터를 2024년 상용화하겠다고 발표했다. (사진=그래프코어)

필 브라운 기획 부사장은 인간뇌 수준의 매개변수를 능가하는 초지능 AI컴퓨터를 2024년 상용화하겠다고 발표했다. 현재 이를 뒷받침할 IPU 시스템을 설계 중이다. 인간 두뇌에 가까운 초지능 컴퓨터인 '굿 컴퓨터(Good Computer)'를 만드는 게 목표다.

브라운 부사장은 “사람 수준 성능 구현을 위해 최대 100조 매개변수가 필요하다”며 “최대 1PB(페타바이트) 메모리가 있어야 한다”고 설명했다. 특히 그는 “2주 내에 백만 SGD(Stochastic Gradient Descent) 반복을 위해선 최대 2PB 메모리 대역폭이 필요하다”고 말했다. 결과적으로 연산이 지연 없이 되려면 해당 모델은 '희소 롸우팅'이 돼야 한다는 의미다.

인간뇌 메모리와 비슷한 IPU를 탑재한 굿 컴퓨터가 상용화되면 활용할 수 있는 범위가 넓다. 브라운 부사장은 “기초 AI 모델을 개발할 때 사용할 수 있다”고 말했다. 수조개 넘는 매개변수 모델을 학습하거나 추론할 때 용이한 셈이다.

과학과 산업계에 AI를 적용할 때도 용이하다. 그는 “유전체학 같은 분석이나 패턴 인식을 통한 관계 추출할 때 사용할 수 있다”고 설명했다. 기업에도 활용할 수 있다. 언어를 이해해 솔루션 분석 개발을 포함해 번역, 요약 등에 굿 컴퓨터 적용이 가능하다.

그래프코어-ETRI, 고효율 AI 컴퓨팅 개발 위해 맞손

강민우 그래프코어 한국 지사장. (사진=김미정 기자)
강민우 그래프코어 한국 지사장. (사진=김미정 기자)

그래프코어는 한국전자통신연구원(ETRI)과는 고효율 AI 컴퓨팅을 위한 새로운 소프트웨어(SW) 접근법을 개발하기 위해 이달 6일 협력을 체결했다. ETRI는 성능를 비롯한 편의성, 독립성을 높이기 위한 SW 개발을 담당한다. 그래프코어는 기술 검증과 상용화에 초점 맞춘다. 이를 위해 우리 정부가 자금을 2025년까지 지원한다.

이번 협력 목적은 우선적으로 대규모 AI 모델을 훈련하는데 필요한 컴퓨팅 리소스 유지 관리에 드는 비용을 줄일 방법을 찾을 방침이다. 개발자가 폭넓은 범위에서 효율적이고 경쟁력 있는 툴과 가속기 기술을 선택할 수 있는 환경도 구축한다. 또 시스템 최적화 기술을 새로운 모델에 쉽게 적용하는 방법을 찾는다. 

이번 협약을 통해 병렬화된 모델 개발에 필요한 비용과 복잡성을 최소화할 방침이다. 강민우 그래프코어 한국 지사장은 “AI가 발전하기 위해선 단순히 칩 개발만 중요한 게 아니라 관련 인프라 확충도 필요하다”먀 “그만큼 이번 협약이 중요하다”고 평가했다.

AI타임스 김미정 기자 kimj7521@aitimes.com

[관련 기사][찬이의 IT교실] AI 칩이 뭐길래… ③ AI 칩 설계도 진화한다

[관련 기사]AI 개발에 그래프코어 IPU 도입 증가...트위그팜 성능 10배 ↑

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지