AI 기능 강화해 추론 성능 20배↑...내년 하반기 출시 예정
GPU·FPGA 등 AI 가속기 확장성 강화…메모리 성능도↑

온라인 간담회에서 파워10 프로세서에 대해 설명하는 한상욱 한국IBM 시스템즈 비즈니스 총괄 전무 (사진=한국IBM)
온라인 간담회에서 파워10 프로세서에 대해 설명하는 한상욱 한국IBM 시스템즈 비즈니스 총괄 전무 (사진=한국IBM)

"AI 관련 빅데이터의 추론 능력에서 한 번 더 기여할 수 있는 파워10 프로세서로 IBM이 테크놀로지 리더십을 가져갈 계획입니다."

한상욱 한국IBM 시스템즈 비즈니스 총괄 전무는 18일 온라인으로 열린 기자간담회에서 인공지능(AI) 역량을 강화한 IBM의 파워10 프로세서를 소개하며 이같이 말했다.

이날 IBM이 공개한 파워10 프로세서는 데이터센터용 중앙처리장치(CPU) 제품의 차세대 모델이다. 기존 파워9보다 AI 추론 능력이 크게 강화됐으며, AI 가속을 위한 시스템 반도체와 메모리 반도체의 확장성을 갖췄다.

IBM은 7나노(nm) 공정 기반의 파워10 프로세서가 이전 모델인 IBM 파워9보다 에너지 효율, 워크로드 용량, 그리고 컨테이너 밀도 부분에서 최대 3배 가까이 향상됐다고 밝혔다.

IBM 파워10 프로세서 모듈 (사진=IBM)
IBM 파워10 프로세서 모듈 (사진=IBM)

◇파워10, AI 기능 강화…추론 최대 20배 빨라

IBM은 기업용 하이브리드와 멀티 클라우드 전환을 위한 성능 향상과 함께 점점 증가하는 AI에 대한 요구에 맞춰 파워10의 성능을 개선했다고 강조했다.

IBM은 "파워10 프로세서는 별도의 추가적인 전문 하드웨어 없이 인코어 AI 추론 기능을 강화할 수 있도록 설계됐다"며 "행렬 연산 가속기(Matrix Match Accelerator)를 탑재해 이전 모델과 비교했을때 FP32, BFloat16, INT8 연산에서 각각 10배, 15배, 그리고 20배 빠른 AI 추론을 할 수 있으며 비즈니스 애플리케이션에 AI를 접목해 더 우수한 인사이트를 발굴 할 수 있도록 지원한다"고 설명했다.

IBM에 따르면 파워10은 새로운 프로세서 아키텍처 기반으로 구축돼 파워9보다 최대 20배 빠른 AI 추론(Inference) 성능을 제공한다.

허욱 한국IBM 시스템즈 비즈니스 총괄 사업부장은 "최근에 각종 엔터프라이즈(기업용) 애플리케이션에서도 AI 기반의 인사이트를 얻고자 하는 요구가 많고, 이런 기능들이 많이 탑재되고 있다"며 "이를 보다 효율적으로 처리하기 위해 파워10 프로세서는 ▲새로운 명령어 세트의 도입과 ▲데이터 세트의 제공 ▲강화된 행렬 연산 가속기를 도입해 기존보다 AI 추론 성능을 약 20배 이상 빠르게 제공할 수 있게 됐다"고 말했다.

또한 IBM은 파워10 프로세서의 AI 성능을 업그레이드하기 위해 다음 세대의 표준에 맞춰 I/O(Input/Output, 입출력)를 확장했다고 밝혔다.

◇ GPU·FPGA 등 AI 가속기 확장성 강화…메모리 성능도↑

파워10은 '파워 AXON'을 통해 CPU와 그래픽처리장치(GPU)를 연결하고, 오픈 CAPI(Coherent Accelerator Processor Interface) 프로토콜을 사용해 FPGA(Field Programmable Gate Array) 기반의 AI 가속기를 연결할 수 있다.

실제 AI용 데이터센터에는 다수의 GPU와 FPGA를 사용한 AI 가속기를 사용해 성능을 향상한다. 각각의 제품들은 서로 다른 언어와 사용자 정의로 연결을 위해서는 효율적인 프로토콜이 필요하다.

허욱 사업부장은 파워10에 메모리 인셉션 기능이 추가됐다며, "파워 AXON 인터페이스로 클러스터를 구축해 페타바이트 규모의 메모리 풀을 추가할 수 있다"고 덧붙였다.

또한 메모리 영역에서도 파워10은 OMI(Open Memory Interface) 메모리 버스를 채택해 성능을 향상시켰다.

온라인 간담회에서 파워10 프로세서에 대해 설명하는 허욱 한국IBM 시스템즈 비즈니스 총괄 사업부장 (사진=한국IBM)
온라인 간담회에서 파워10 프로세서에 대해 설명하는 허욱 한국IBM 시스템즈 비즈니스 총괄 사업부장 (사진=한국IBM)

허 사업부장은 "현재 사용하는 DDR4 메모리 반도체의 경우 소켓당 410GB/s의 메모리 대역폭을 제공할 수 있고, 차세대 DDR5 기반의 메모리도 800GB/s의 소켓당 메모리 대역폭을 제공한다"며, "현재 GPU 등 특수한 가속기를 사용하는 HBM에 맞먹는 메모리 대역폭을 제공할 수 있다"고 설명했다.

이 밖에 표준적인 I/O에서도 최신의 PCIe4보다 2배 이상 대역폭이 확장된 PCIe5 인터페이스를 제공한다.

허 사업부장은 "이러한 인터페이스들은 CPU, 메모리, I/O 어댑터뿐만 아니라, 메모리 인셉션 등 메모리 클러스터 구축, FPGA 기반의 스토리지 클래스 메모리 디바이스, 연산 가속기, 또는 OMI 인터페이스를 수용하는 스토리지 클래스 메모리를 탑재할 경우에도 다양한 슬롯을 제공한다"고 전했다.

AI 역량이 강화된 파워10 프로세서는 삼성전자의 7나노 EUV(극자외선) 공정을 통해 2021년부터 생산된다.

이날 간담회에서 한상욱 전무는 마지막으로 "포춘 100대 기업의 80% 이상이 미션 크리티컬한 업무로 파워 시스템을 사용하고 있다"며 "글로벌 헬스케어 10대 기업 모든 고객사가 파워 시스템을 사용하고 있으며, 10대 유통사 중 8개의 회사가 파워시스템을 사용한다"고 강조했다. 

거대 기업사들의 대부분이 절대 시스템이 다운되면 안 되는 근간 시스템인 '미션 크리티컬' 환경에 IBM의 파워 시스템을 필수적으로 사용하고 있다는 것이다.

현재 IBM의 파워 시스템은 IBM의 하이브리드 클라우드와 멀티 클라우드 환경에서 주로 사용되고 있다. 다른 대형 클라우드 기업 중 하나인 구글 클라우드는 이미 파워 시스템을 사용하고 있으며, 마이크로소프트도 애저에 파워 시스템 기반의 서비스 출시를 준비하고 있다.

[관련기사] 인텔, 42테라플롭스 GPU로 딥러닝 시장 도전

[관련기사] AI 가속 'GPU 전쟁'…엔비디아 아성에 도전하는 AMD

키워드 관련기사
  • 아마존, AWS기반 양자 컴퓨팅 서비스 ‘브라켓’ 출시
  • 모싸, '극한 환경' 견디는 AIoT 엣지 컴퓨터 출시
  • 애플이 스스로를 AI 리더라고 자신하는 까닭 〈상〉