(사진=세레브라스)
(사진=세레브라스)

세레브라스가 미국와 유럽에 6개의 추론 전문 인공지능(AI) 데이터센터를 새롭게 구축하며 엔비디아에 정면 승부를 걸었다. 이는 급성장하는 AI 추론 시장에서 성능과 비용 효율성으로 승부를 보겠다는 전략이다.

세레브라스는 11일(현지시간) 웨이퍼 스케일 엔진(WSE-3)으로 구동되는 6개의 신규 AI 데이터센터를 개설한다고 발표했다. 

이를 통해 추론 용량을 기존 대비 20배 확대해, 초당 4000만개 이상의 토큰을 처리할 수 있도록 한다는 계획이다. 신규 데이터센터는 미국 댈러스와 미니애폴리스, 오클라호마시티, 뉴욕과 캐나다 몬트리올 및 프랑스에 위치하며, 전체 용량의 85%가 미국에 집중될 예정이다.

제임스 왕 세레브라스 제품 마케팅 디렉터는 “이번 확장은 '라마 4'나 '딥시크'와 같은 최신 AI 모델의 급격한 수요 증가에 대응하기 위한 필수 조치”라며 “빠른 서비스 제공이 핵심 경쟁력이 될 것”이라고 말했다.

핵심 경쟁력은 WSE-3 프로세서로, 이는 엔비디아의 GPU보다 7~10배 빠른 추론 속도를 제공한다.

세레브라스 칩에 최적화한 오픈 소스 모델 '라마 3.3 70B'가 벤치마크에서 오픈AI의 'GPT-4'와 동일한 성능을 보이면서 운영 비용은 훨씬 저렴하다는 점을 강조했다. 왕 디렉터는 “GPT-4는 평균적으로 4.40달러의 비용이 들지만, 라마 3.3은 세레브라스를 활용하면 60센트 수준으로 비용을 절감할 수 있다. 여기에 속도도 10배 빨라진다”라고 설명했다.

세레브라스와 엔비디아 추론속도 비교 (사진=세레브라스)
세레브라스와 엔비디아 추론속도 비교 (사진=세레브라스)

이와 함께 허깅페이스 및 알파센스와의 전략적 파트너십도 발표했다.

이를 통해 허깅페이스의 500만명 이상의 개발자가 세레브라스의 AI 추론 기술을 활용할 수 있게 됐다. 또, 포춘 100대 기업 중 85%에 서비스를 제공하는 금융 시장 분석 플랫폼 알파센스는 AI 검색 성능 향상을 위해 엔비디아 시스템에서 세레브라스로 전환하기로 결정했다고 밝혔다.

또 세레브라스는 퍼플렉시티 AI와 미스트랄 AI와 같은 주요 고객을 확보했다고 덧붙였다.

이런 공격적인 확장 전략이 90%에 달하는 엔비디아의 시장 지배력을 얼마나 흔들 수 있을지는 미지수다. 엔비디아 역시 최근에는 GPU가 추론에 최적화됐다고 강조하고 있다.

하지만 AI 추론의 비중이 점차 커짐에 따라, 세레브라스 등 추론 전문 칩 메이커들은 AI 인프라 경쟁의 중요한 변수로 작용할 가능성이 높다는 평이다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지