CDNA 기반 AMD GPU 16일 공개…"엔비디아 A100보다 성능 좋아"
인텔, Xe 아키텍처로 GPGPU 시장 진입…제온 CPU 점유율 바탕으로 도전
엔비디아 vs AMD vs 인텔, 2021년 3파전 본격 시작!

 

(원본=셔터스톡)
(원본=셔터스톡)

 

[편집자주]인공지능(AI)의 핵심은 소프트웨어(SW) 기술이다. 어떤 모델을 구축하느냐, 어떤 언어를 사용할까, 데이터를 어떻게 분류할 것인가. 이런 질문에 대한 답이 SW에서 나오기 때문이다.

하지만 복잡한 AI SW를 구현하기 위해서는 높은 성능의 하드웨어(HW)가 필수적이다.

인공지능의 대표적인 방법론 중 하나인 머신러닝(ML). AI 성능을 대폭 끌어올린 딥러닝(DL). 인간 뉴런 구조를 본떠 만든 인공신경망(ANN, Artificial Neural Network).

이런 개념들은 80년대에도 활발히 연구됐다. 하지만 실제 구현은 불과 몇 년 밖에 안됐다. 컴퓨팅 성능이 그만큼 받쳐주지 못했기 때문이다. HPC(고성능컴퓨팅), AI 가속기, AI 프로세서, 고성능 메모리장치 등이 등장하면서 본격적인 AI 시대가 문을 열게 된 것이다.

칩러닝(ChipLearning)을 통해 AI를 구현하는 HW, 반도체 또는 '칩'이라고 불리는 HW 산업과 기술을 알아보자.

이 기사는  [AI칩러닝] AI의 핵심, GPU… 딥러닝의 유행을 불러오다 ①에서 이어집니다.

게이밍이나 포토샵, 영상편집을 위해 개발된 GPU(그래픽처리장치) 시장은 원래 엔비디아와 AMD, 두 회사가 독점을 하고 있다. 인텔이 일부 점유율을 가져가지만 노트북 CPU(중앙처리장치)에 종속된 내장형 GPU다.

인텔의 단독 GPU 모델은 최근에야 공개됐다. 인텔은 새로운 Xe 아키텍처를 통해 Xe-LP(저전력), Xe-HP(고성능), Xe-HPG(게이밍) 등의 모델과 함께 AI 데이터센터와 슈퍼컴퓨터 등의 GPGPU(General-Purpose computing on GPU)에 사용될 Xe-HPC 모델을 공개했다.

GPGPU 시장은 엔비디아가 쿠다(CUDA) API를 기반으로 거의 독점하다시피 했다.  

하지만 2위인 AMD도 꾸준히 기회를 엿보며 성장하고 있었다. 특히 최근에는 CDNA라는 새로운 아키텍처를 바탕으로 엔비디아의 최신 암페어 아키텍처 기반 A100보다 높은 성능의 제품을 개발 중인 것으로 알려졌다.

또한 인텔은 데이터센터 시장에서 90% 이상의 점유율을 가진 제온 CPU를 바탕으로 Xe GPU 점유율을 함께 넓혀갈 계획이다.

업계 일부는 AMD와 인텔의 등장으로 엔비디아가 독점한 GPGPU 시장이 일부 변화할 것을 기대하고 있다. 

AMD의 ML용 AI 가속기, 라데온 인스팅트 GPU (사진=AMD)
AMD의 ML용 AI 가속기, 라데온 인스팅트 GPU (사진=AMD)

◆ AMD, ATi와 OpenCL로 GPGPU 시장에 발 담궈

2006년 AMD는 엔비디아의 라이벌 회사인 ATi를 인수하며 GPU 시장에 본격적으로 뛰어들었다. ATi는 인수 후 AMD의 그래픽사업부가 됐으며, ATi의 라데온(Radeon)이라는 브랜드는 AMD에 흡수됐다.

ATi를 인수한 다음해 AMD는 테라스케일(TeraScale) 아키텍처 기반의 라데온 GPU를 개발했다. 

2007년은 엔비디아가 CUDA 소프트웨어 개발 키트(SDK)를 처음 배포한 해였다. 이와 함께 엔비디아는 GPGPU용 GPU 테슬라(Tesla)를 발표하고 AI와 머신러닝 기술의 진입장벽을 낮췄다.

엔비디아의 CUDA에 대항해, AMD는 테라스케일 기반 GPU에 머신러닝용 오픈소스 플랫폼 OpenCL(Open Compute Library)을 지원하며 GPGPU를 지원하기 시작했다.

OpenCL은 2009년 발표된 API(애플리케이션 프로그래밍 인터페이스)다. 애플이 개발했으며, 엔비디아, AMD, 인텔 등이 속한 비영리 산업체 크로노스 그룹(Khronos Group)이 이후 개발을 맡았다. 크로노스 그룹은 오픈 소스와 표준화된 API를 제작하기 위한 단체다. 앞서 호명한 4개의 기업 외에도 국내의 삼성전자, LG전자를 비롯해 ARM, 아마존, 어도비, 퀄컴 등 주요 ICT 기업들이 다수 가입했다. 

테라스케일 아키텍처가 OpenCL GPGPU를 지원했지만 그래픽 처리에 중점을 둔 아키텍처라 엔비디아의 '테슬라+CUDA'를 당해내기는 어려웠다.

이에 머신러닝의 중요성을 인식한 AMD는 테라스케일의 다음 세대인 GCN(Graphics Core Next) 아키텍처를 공개했다. AMD는 GCN에 새로운 블록을 추가해 테라스케일이 그래픽과 GPGPU를 병렬로 처리하지 못하고 번갈아 가면서 처리했던 구조적인 문제점을 해결했다.

GCN 아키텍처를 통해 AMD는 2016년 말 드디어 라데온 인스팅트와 같은 머신러닝 전문 제품군을 생산했다. 하지만 이미 머신러닝 시장은 엔비디아가 독점하고 있었고, AMD는 만년 2위의 자리를 벗어나지 못했다.

RDNA와 CDNA의 두가지 GPU 아키텍처를 선택한 AMD (자료=AMD)
RDNA와 CDNA의 두가지 GPU 아키텍처를 선택한 AMD (자료=AMD)

◆ CDNA 기반 AMD GPU, 엔비디아 A100보다 성능 좋다?

최근 AMD는 전략을 바꾸었다. 올해 초 AMD는 게임용 GPU(그래픽처리장치)와 인공지능(AI) 가속기로 사용되는 GPU의 아키텍처를 나눴다. 게임용의 명칭은 RDNA, 컴퓨팅용은 CDNA다. 두 GPU의 용도가 다른 만큼 각각 집중해서 개발하겠다는 계획이다.

엔비디아가 GPGPU에 적합한 맥스웰, 볼타 등의 개별 아키텍처를 만든 것과 비슷한 맥락으로 해석된다. 하지만 엔비디아는 최근 튜링과 암페어 아키텍처 등에서 게이밍과 GPGPU를 나누지 않고 통합 아키텍처로 공개했다. 결국 올해를 기점으로 게임과 HPC를 나눈 AMD는 엔비디아와 완전히 다른 전략을 선택한 셈이다.

두 개의 DNA는 후발주자인 AMD가 1위 엔비디아를 따라잡기 위한 전략이다. 1위와 같은 방법으로 시장에서 맞붙기에는 역부족이라는 판단으로 추정된다. 보다 대중적인 시장인 게이밍 시장에서 엔비디아의 점유율을 빼앗기 위해서 이같은 전략을 구사한 것. 엔비디아가 97%로 거의 독점하고 있는 AI 가속기 시장보다는 공략이 쉽기 때문이다.

실제 지난 3월 진행된 시장조사업체 JPR의 조사에 따르면, 게이밍을 포함한 PC용 GPU 시장에서 지난해 4분기 기준 AMD는 31.08%, 엔비디아는 68.92%의 점유율을 각각 기록했다. AMD의 점유율은 전분기 27.8%보다 2.12%p 오른 성적이다. 새로운 RDNA 전략이 어느 정도는 시장에 먹혔다는 의미다.

지난달 말 AMD는 RDNA2 기반의 라데온 GPU를 공개하며, 게이밍 시장의 점유율을 더욱 끌어올리겠다는 의지를 보였다. 하지만 머신러닝을 위한 CDNA 제품에 대한 공식적인 소식은 아직까지 들을 수 없었다. 

다만 최근 업계에 유출된 정보에 따르면 오는 16일 AMD가 CDNA GPU 기반의 AI 가속기 MI100을 공개할 것으로 알려졌다.

지난 3일 해외 IT매체 WCCF테크는 "AMD가 11월 16일 차세대 CDNA GPU 기반 본능 MI100 액셀러레이터를 공개할 예정"이라며 "이 정보는 차세대 데이터 센터와 HPC 가속기 라인업을 위한, 아직 미공개된 데이터시트의 일부에서 유출된 문건"이라고 보도했다.

문건에 따르면, 1세대 CDNA 아키텍처의 인스팅트 MI100을 11월 16일 출시할 예정이며, 엔비디아의 A100보다 높은 성능을 갖춰서 나올 전망이다. GPU당 FP32 기준 34TFLOP(테라플롭스), 최대 32GB HBM2e 메모리, 메모리 대역폭 1.225TB/s 정도로 추정된다.

또한 벤치마크에 따르면, 인스팅트 MI100은 암페어 A100 대비 약 13% 더 나은 FP32 성능, 볼타 V100 GPU 대비 2배 이상의 성능 향상을 기록했다.  성능 대 가치 비교(The perf to value ratio)에서는 V100S에 비해 약 2.4배, 암페어 A100에 비해 50% 더 나은 값이 나왔다.

드디어 엔비디아를 위협할만한 GPGPU가 등장한 것이다.

인텔의 Xe GPU 라인업 (사진=인텔)
인텔의 Xe GPU 라인업 (사진=인텔)

 

◆ 인텔, Xe 아키텍처로 GPGPU 시장 진입

AMD가 치고 나오는 중에 전통적인 CPU 강자 인텔도 GPGPU 싸움에 가세했다. Xe 아키텍처를 통해 본격적인 개발을 선언한 것이다.

인텔은 지난 8월 '2020 아키텍처 데이 프리젠테이션'에서 공개한 새로운 Xe GPU가 데이터센터에서 테라플롭스(TF, 1초에 1조회 연산)에서 페타플롭스(PF, 1초에 1000조회 연산)로 확장에 큰 도움이 될 것이라고 밝혔다.

행사에서 라자코두리 인텔 부사장은 "인텔은 머지 않아 모든 사람이 엑사스케일(초당 100경번 연산) 상당의 연산을 처리하는 컴퓨터를 사용할 수 있게 될 것이라고 믿는다"며 "약 1000억개의 지능적이고 연결된 기기가 우리가 상상할 수 없는 방식을 통해 우리 삶을 풍요롭게 하는 새로운 컴퓨팅 시대의 막을 열것이다. 이러한 미래는 나를 비롯한 모든 인텔 아키텍트들에게 자극과 영감을 준다"고 말했다. 

인텔에 따르면 인텔의 Xe GPU 아키텍처는 저전력 Xe-LP, 고성능 Xe-HP, 게이밍용 Xe-HPG, Xe-HPC 등이 있다. 

해외 IT 매체 WCCF테크는 인텔의 새로운 GPU가 4개의 타일과 최대 1만6384개의 코어를 탑재한 제품이라며 "최근 열린 아키텍처 데이에서 이 칩의 원초적인 성능을 과시했다"고 보도했다.

WCCF테크는 "인텔의 42테라플롭스는 단일 GPU로 가장 빠른 성능"이라며, 이같은 성능은 멀티칩모듈(MCM) 방식을 사용했기 때문이라고 분석했다. 인텔 외에 AMD가 MCM 접근으로 개발을 진행 했지만 인텔만큼의 성능을 내지는 못한 것으로 알려졌다.

인텔은 고성능 AI 서버에 Xe-HPC기반 GPU를 제공한다고 밝혔다. Xe-HPC는 페타플롭스 규모의 AI 성능과 EMIB 기술 기반의 단일 패키지에서 랙 수준의 미디어 성능을 제공하는 멀티 타일 고성능 GPU 아키텍처다. Xe-HPC는 향상된 슈퍼핀 기술을 활용할 예정이다.

몇 년전 인텔은 고성능 GPU가 없어 아톰 시리즈같은 저전력 저성능 CPU를 수십개 결합해 GPU와 비슷한 연산 능력을 보이는 '제온 파이' 시리즈를 개발했다. 1세대 라라비는 엔비디아와 AMD보다 낮은 성능으로 큰 빛을 보지 못했다.

하지만 인텔은 2세대 나이트 페리로 GPGPU 시장의 새로운 강자로 부상했다. CPU 기반의 AI 가속기로 기존 GPU보다 프로그래밍하기 쉽다는 장점, 당시 업계 1위인 인텔의 개발자 지원으로 지속적인 성장을 보였다.

하지만 인텔은 상업적인 실패와 당시 10나노 공정에도 난항을 보이며, 생산을 중단하고 포기했다.

최근 인텔은 10nm 전환에 일부 성공했으나, 목표만큼의 생산성이 나오지 않고 7nm 전환에 어려움을 겪고 있다. 이에 굳이 IDM(종합반도체업체)이라는 정체성에 목을 매지 않고 파운드리에 일부 반도체를 맡기겠다고 결정했다.

최근 해외 IT매체 하드웨어타임스(hardwaretimes)는 중국 빌리빌리(Chinese Bilibili) 포럼 보고서를 인용하며 "인텔은 현재 곧 출시될 Xe-HPC GPU의 엔지니어링 샘플을 테스트하고 있다. 이들 부품은 TSMC의 7nm 공정을 기반으로 하며 HBM2 메모리가 탑재될 것으로 알려졌다"고 보도했다.

최근 GPU는 그래픽 처리 외에도 AI나 데이터 연산 등 여러 용도로 쓰인다. GPGPU는 이런 범용적인 컴퓨팅에 쓰이는 GPU를 일컫는 말이다. (사진=셔터스톡)
최근 GPU는 그래픽 처리 외에도 AI나 데이터 연산 등 여러 용도로 쓰인다. GPGPU는 이런 범용적인 컴퓨팅에 쓰이는 GPU를 일컫는 말이다. (사진=셔터스톡)

◆ 엔비디아 vs AMD vs 인텔, 3파전 본격 시작!

AMD의 CDNA와 인텔의 Xe-HPC의 등장이 지금 당장 엔비디아의 독주체제를 무너뜨리기는 어려울 것으로 전망된다. AI 개발자 대부분이, AI 모델 대부분이 CUDA를 기반으로 만들어졌기 때문이다.

다만 앞으로 GPU 생태계가 단순히 엔비디아라는 하나의 회사만을 중심으로 돌아가지만은 않을 것으로 보인다. 최근 CPU 시장에서 인텔의 지위가 흔들리고 있는 것처럼 GPU 시장에도 영원한 절대 강자는 없다는 것이다.

AMD는 2위 CPU와 2위 GPU 회사에서 프로그래밍 가능한 반도체인 FPGA 1위 기업인 자일링스를 인수했다. CPU 시장과 게이밍 GPU 시장에서 1위 기업들을 위협할만큼 점유율을 높이고 있다.

곧 공개될 CDNA 기반의 인스팅트 GPU의 성능이 엔비디아 A100보다 높은 성능을 보인다면 세상의 평가가 바뀔 수도 있다. CUDA API의 점유율이 높다지만, 그것보다 조금이라도 더 높은 성능의 GPU를 찾는 층도 분명히 있기 때문이다.

인텔은 제온이라는 막강한 서버용 CPU를 가지고 있다. 엔비디아가 GPU를 독점한 것만큼 인텔은 데이터센터용 CPU 시장을 독점한 것이다. 인텔의 Xe-HPC는 어떤 GPU보다 제온 CPU에 친화적일 수밖에 없다. AI 생태계에 새로운 공룡으로 성장할 가능성이 높다는 것이다.

AI 가속기 시장이 엔비디아가 독주에서 3파전으로 변화할 가능성이 충분하다는 것이다. 

[관련기사] [AI칩러닝] AI의 핵심, GPU… 딥러닝의 유행을 불러오다 ①

[관련기사] 인텔 AI용 GPU 'Xe -HPC', TSMC 7나노 선택하나?

키워드 관련기사
  • "가상환경과 현실환경 달라, AI 실제 적용 어려워"…최종원 중앙대 첨단영상대학원 교수
  • 엔비디아 A100 GPU, AWS 최신 머신러닝·HPC용 서버에 탑재
  • AMD, 자일링스 인수…엔비디아·인텔 위협하는 AI 공룡 등장