인텔과 미국 아르곤 국립연구소는 22일(현지시간) 2엑사플롭스(EFLOPS)급 슈퍼컴퓨터 '오로라(Aurora)'의 설치를 완료했다고 블로그를 통해 발표했다.
2019년 3월 미국 에너지부와 인텔은 이전 슈퍼컴퓨터 대비 최대 1천 배 빠른 슈퍼컴퓨터 ‘오로라’를 2021년까지 구축하기로 했다.
인텔은 HPE와 협력해 크레이(Cray) 슈퍼컴퓨터 플랫폼에 4세대 제온 스케일러블 프로세서 ‘사파이어래피즈’와 데이터센터 GPU 맥스 ‘폰테베키오’ 를 장착해 오로라를 완성할 계획이었지만, 4세대 제온 스케일러블 프로세서와 데이터센터 GPU 맥스의 대량 생산이 지연되면서 2021년 11월이 되어서야 본격적인 구축이 시작됐다. 1년 7개월만에 구축이 완료된 셈이다.
오로라 슈퍼컴퓨터는 총 1만624개의 블레이드 서버로 구성되어 있다. 각 블레이드 서버에는 고대역폭 메모리(HBM)을 내장한 제온 CPU 맥스 2개와 데이터센터 GPU 맥스 6개가 장착된다. 블레이드 서버당 무게는 약 31.75kg이다.
오로라에 탑재된 CPU는 2만1248개, GPU는 6만3744개이며 2엑사플롭스 이상의 연산이 가능할 것으로 예상된다. 초당 부동소수점 연산을 200경번 수행할 수 있다는 의미다. 투입된 저장장치 용량은 220페타바이트에 달한다.
현재 전 세계에서 가장 빠른 슈퍼컴퓨터는 미국 에너지부 오크리지 국립연구소에 설치된 AMD 에픽 프로세서 '프론티어'다. 이 슈퍼컴퓨터는 최대 1.194엑사플롭스의 연산 속도를 가진다. 프론티어는 작년 초에 등장한 이후로 18개월 동안 세계 슈퍼컴퓨터 순위 경쟁인 '톱500'에서 1위를 유지해 왔다.
하지만 2엑사플롭스 연산이 가능한 오로라가 본격적으로 가동되면 프론티어를 뛰어넘어 긴 시간 동안 1위를 유지할 것으로 예상된다.
릭 스티븐 아르곤 국립연구소 부소장은 "승인 테스트를 진행하는 동안 오로라를 사용하여 과학을 위한 일부 대규모 오픈 소스 생성 AI 모델을 훈련할 것이다"라며 "6만개 이상의 초고속 I/O 시스템인 인텔 GPU 맥스와 대용량 저장 시스템은 이러한 모델을 교육하기에 완벽한 환경이다”고 설명했다.
박찬 기자 cpark@aitimes.com
