엔비디아 GPGPU로 삼성전자 시총 뛰어넘어
GPGPU 기술 발전으로 딥러닝 성능 크게 향상해
엔비디아 외 AMD·인텔도 GPGPU용 제품 줄줄이 공개

GPU는 그래픽 처리 외에도 AI 등 여러 용도로 쓰인다. GPGPU는 이런 범용적인 컴퓨팅에 쓰이는 GPU를 일컫는 말이다. (사진=셔터스톡)
최근 GPU는 그래픽 처리 외에도 AI나 데이터 연산 등 여러 용도로 쓰인다. GPGPU는 이런 범용적인 컴퓨팅에 쓰이는 GPU를 일컫는 말이다. (사진=셔터스톡)

GPU 전문 생산업체 엔비디아의 시가 총액이 삼성전자를 넘어섰다. 지난 18일을 기준으로 약 358조원을 기록했다. 345조원인 삼성전자를 뛰어넘었다.

엔비디아는 GPU만 생산하는 기업이다. 반면 삼성전자는 스마트폰과 스마트폰에 들어가는 AP(애플리케이션 프로세서)를 비롯해 TV, 냉장고, 세탁기 등 다양한 제품을 생산한다. 물론 매출 규모는 삼성전자가 더 크다.

엔비디아의 지난해 3분기 기준 시총은 약 125조원이었다. 일 년이 안되는 사이에 3배 가까이 늘어난 셈이다. 

엔비디아를 포함한 나스닥 전체 주가가 크게 오른 덕이기도 하지만, 전문가들은 인공지능(AI) 기술 발전에 대한 기대감이 엔비디아에 대한 투자를 부추겼다고 분석했다. AI 시장이 늘어날수록 엔비디아 GPU 채택이 더욱 늘어날 것이기 때문이다.

현재 AI의 중심 기술인 딥러닝(DL)을 구동하기 위해서는 GPU가 필수다. 엔비디아 GPU는 이 시장을 거의 독점하고 있다.

◇ GPGPU 기술 발전으로 딥러닝 성능 크게 향상 

AI는 지난 몇 년간 딥러닝 기반의 머신러닝(ML) 기술 발전으로 크게 성장했다. 딥러닝은 수많은 데이터를 훈련하는 머신러닝 기법 가운데 하나다. 최근 데이터 과학자 사이에 주목받는 GPT-3은 딥러닝 기술을 가장 잘 사용한 케이스다.

GPT-3와 같은 최신 딥러닝 기술을 구현하기 위해서는 수많은 데이터를 처리하는 프로세서 기술이 보장돼야 한다. 초장기 딥블루에서 이세돌을 꺾은 알파고, 최근 압도적인 성능을 보여주는 GPT-3 등 AI 기술이 발전한 이유가 바로 프로세서의 처리 능력이 크게 높아졌기 때문이다.

프로세서가 AI 기술을 이끌고 있는 셈이다. 그 중심에는 GPU(그래픽처리장치) 기술의 발전이 있다.

GPU는 원래 이름 그대로 컴퓨터의 그래픽 요소를 처리하기 위해 만든 개념이다. 하지만 GPU가 일반적인 연산에도 유용하게 쓰인다는 것이 알려지면서 범용 컴퓨팅 처리를 위한 GPGPU(General-Purpose computing on GPU) 기술이 개발됐다.

영국 시장조사업체 키사코 리서치의 미카엘 아조프 수석연구원은 엔비디아가 GPGPU 기술을 공개한 2010년부터 딥러닝의 활용이 급격히 늘어났다고 설명했다. 딥러닝의 도입으로 수개월 걸리던 대형 신경망 네트워크의 교육 시간이 불과 몇 시간에서 며칠 사이로 줄었기 때문이다.

CPU와 GPU의 차이 (이미지=엔비디아)
CPU와 GPU의 차이 (이미지=엔비디아)

원래 컴퓨터 프로세서의 메인은 CPU(중앙처리장치)다. 사람의 뇌와 같은 기능을 한다. CPU는 여러개의 복잡한 작용을 빠르게 연산하는 데 적합하다. 코어 1개의 성능을 끌어 올리는 것이 중요하다.

GPU는 CPU와 사뭇 다르다. GPU는 그래픽과 같은 특정된 연산을 빠르게 수행하기 위해서 많은 성능을 제거한 단순화된 코어를 수백개 이상 연결했다. 

GPU의 이런 특징은 ML의 훈련 기술, 특히 딥러닝에 적합하다. 딥러닝은 빅데이터를 바탕으로 모델의 부피를 키워 성능을 높이는 시스템이다. 특정된 연산을 수없이 계산해야 한다. 계산이 많으면 많을수록 오차가 줄고 시스템의 정확도는 높아진다.

◇엔비디아 외 AMD·인텔도 GPGPU용 제품 줄줄이 공개

GPU 업체들은 GPGPU를 위한 제품을 지속적으로 내놓고 있다. 성과도 보인다. 최근 엔비디아는 AI용 암페어 A100 GPU를 공개했다. 540억개 코어를 집적한 것과 같은 성능을 제공한다.

엔비디아는  또 GPGPU 기술로 게이밍 GPU 회사에서 AI 컴퓨팅 회사로 체제를 전환하고 회사 규모를 키웠다. 지난 5월 공개한 A100 GPU로 기존 세대보다 높은 AI 가속 성능을 제공, AI칩 시장 1위 자리를 굳히겠다는 전략이다. 엔비디아는 4대 클라우드에 사용되는 AI 가속기의 97%를 점유하고 있다.

A100은 540억개의 트랜지스터를 집적한 것과 같은 성능을 지닌 GPU다. 최대 9.7테라플롭스(TF, 1초에 1조회 연산)의 FP64 연산 능력을 자랑한다. A100 GPU 8개로 구성한 DGX A100 서버는 5페타플롭스(PF, 1초에 1000조회 연산) 성능을 구현할 수 있다.

엔비디아의 성공에 AMD와 인텔 등 다른 반도체 기업도 AI용 GPU를 개발·생산하고 있다. 많은 GPU로 더 나은 성능을 발휘하는데 집중한다.

AMD는 AI용 가속기로 7나노 기반의 라데온 인스팅트 MI50과 MI60을 생산하고 있다. MI60은 331.46mm의 패키지에 132억개의 트랜지스터를 탑재했다. 최대 7.4TP FP64 연산 성능을 구현한다. 엔비디아 A100보다 트랜지스터의 수는 4분의 1 수준에 불과하고, 연산 성능도 부족하지만 아키텍처와 미세공정 개선으로 격차를 줄이고 있다.

CPU 명가인 인텔도 최근 Xe GPU 아키텍처를 개발하며 GPU 시장 진입을 선언했다. 인텔은 최근 열린 '2020 아키텍처 데이 프리젠테이션'에서 공개한 새로운 Xe GPU가 데이터센터에서 테라플롭스(TF, 1초에 1조회 연산)에서 페타플롭스(PF, 1초에 1000조회 연산)로 확장에 큰 도움이 될 것이라고 밝혔다.

 

[관련기사] AI 가속 'GPU 전쟁'…엔비디아 아성에 도전하는 AMD

[관련기사] AI칩 개발, '딥러닝'이 답일까?…"다양성 확보해야"

키워드 관련기사
  • 광(光) 프로세서는 어떻게 AI 기술을 혁신할까?
  • TSMC, AI와 기계학습으로 '무결점' 7나노 생산
  • 세레브라스, '세계 최대 크기의 AI 칩' 슈퍼컴퓨터에 적용