SK하이닉스 부스 전경 (사진=SK하이닉스)
SK하이닉스 부스 전경 (사진=SK하이닉스)

SK하이닉스(대표 박정호, 곽노정)는 지난주 미국 콜로라도주 덴버에서 열린 ‘슈퍼컴퓨팅 2023(SC23)’에 참가해 인공지능(AI) 및 고성능 컴퓨팅(HPC) 솔루션을 선보였다고 20일 밝혔다.

이 행사는 미국 컴퓨터 학회(ACM)와 IEEE 컴퓨터 학회가 1988년부터 매년 개최, HPC와 네트워킹, 스토리지, 데이터 분석 분야의 최신 기술을 공유하는 자리다. SK하이닉스는 올해 첫 참가로, 제품 시연과 다양한 발표를 진행했다.

부스에는 AI 메모리 기술을 이끌어갈 차세대 제품을 전시했다. AI와 HPC에 특화한 고대역폭 메모리(HBM) 솔루션 'HBM3E'는 속도와 용량, 방열성, 전력 효율 등에서 업계 최고 수준을 구현했다. 특히 SK하이닉스의 HBM3를 적용한 AI용 고성능 GPU 엔비디아 'H100'과 함께 전시했다.

전시 중인 HBM3E (사진=SK하이닉스)
전시 중인 HBM3E (사진=SK하이닉스)

생성 AI 가속기인 'AiMX'도 시연했다. AiMX는 대형언어모델(LLM) 구현에 특화한 제품으로 PIM(프로세싱 인 메모리) 기반 'GDDR6-AiM' 칩을 탑재했다. 기존 GPU 중심의 생성 AI 시스템보다 데이터 추론 시간을 대폭 단축하는 동시에 더 낮은 전력으로 구동이 가능하다. 

'CXL' 역시 주목을 받았다. CXL은 고성능 컴퓨팅 시스템을 효율적으로 구축하기 위한 PCIe 기반 차세대 인터커넥트 프로토콜이다. 기존 D램 제품과 함께 서버 시스템의 메모리 대역폭을 늘려 성능을 향상하고, 쉽게 메모리 용량을 확대할 수 있는 차세대 메모리 솔루션이다.

이번에 공개한 ‘나이아가라(Niagara): CXL 분리형 메모리 솔루션’ 플랫폼 시제품은 AI와 빅데이터 분산처리 시스템에서 높은 수준의 성능 향상을 기대할 수 있는 풀드 메모리 솔루션(PMS)다.

CXL 기반의 CMS(Computational Memory Solution)도 선보였다. CMS는 미국 로스앨러모스 국립연구소(LANL)와 협업해 개발한 솔루션이다. HPC 물리 서버에 활용하는 응용 프로그램의 성능을 개선, 에너지 사용량을 줄여준다. 간접 메모리 접근을 가속화하는 동시에 데이터 이동도 크게 줄여준다. 향후 AI, 그래프 분석 등 다수 영역에도 적용 가능하다.

마지막으로 'DDR5 RDIMM'을 포함해 다양한 데이터센터 솔루션도 소개했다. DDR5 RDIMM은 5세대 10nm(나노미터) 공정 기술인 1b를 적용한 제품으로, 업계 최고 수준인 초당 6,400Mb(메가비트)의 전송 속도를 지원한다. 이와 함께 최대 초당 8800Mb의 데이터 처리 속도를 구현한 MRDIMM도 함께 전시했다.

최신 기업용 SSD(eSSD) 제품인 PCIe Gen5 기반 'PS1010 E3.S'와 'PS1030' 등도 전시했다. 이중 PS1030은 빅데이터와 머신러닝 등에 특화해 초당 1만 4,800MB(메가바이트)의 순차 읽기 속도를 구현한다. 이는 업계 최고라는 설명이다.

SK하이닉스 구성원들의 발표에서는 AI와 HPC용 메모리 솔루션의 기술력을 공개했다.

먼저 권용기 솔루션 개발 팀장은 ‘SK하이닉스의 AiM을 활용한 LLM 추론 솔루션으로 비용 효율 향상’을 발표했다. 권 팀장은 “오픈 AI의 GPT-3 모델의 대안으로 활용되고 있는 메타의 OPT(Open Pretraining Transforer) 언어 모델에 AiM을 활용할 경우, 최신형 GPU를 활용한 시스템보다 최대 10배 빠른 속도를 달성함과 동시에 비용과 에너지 소비를 줄일 수 있다”라고 말했다.

(사진=SK하이닉스)
이호균 팀장이 나이아가라(Niagara) CXL 솔루션의 효율성에 관해 설명하고 있다. (사진=SK하이닉스)

이어서 이호균 메모리시스템연구소 팀장이 ‘CXL 기반 AI와 HPC 서버의 작업량 분산을 위한 메모리 분리’를 주제로 발표를 진행했다. SK하이닉스의 나이아가라 CXL 솔루션은 엘라스틱 메모리(Elastic Memory) 기능으로 기존 분산 컴퓨팅의 과도한 네트워크 트래픽을 해소한다고 강조했다. 또 챗GPT에서 사용하는 분산 AI 프레임워크, 레이(Ray)를 사용해 메모리 공유 기능을 시연했다.

마지막은 김종률 메모리시스템연구소 팀장이 담당했다. ‘HPC 서버에서 객체 기반 컴퓨팅 스토리지를 이용한 데이터 분석 가속화’에 대해 발표했다. 김 팀장은 SK하이닉스와 미국 로스앨러모스 국립연구소(LANL)의 협업 사례인 객체 기반 컴퓨팅 스토리지(OCS)를 소개했다. 

김 팀장은 “OCS는 HPC의 데이터 분석을 위한 새로운 컴퓨팅 스토리지 플랫폼으로, 높은 확장성과 데이터 인식 성능을 갖췄다"라며 "덕분에 기존 데이터 처리 역할을 하는 컴퓨팅 노드의 도움 없이 스토리지가 스스로 데이터 분석을 수행하고 결과값만 전송할 수 있다”라고 말했다.

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지