콜로서스 슈퍼컴퓨터 (사진=유튜브)
콜로서스 슈퍼컴퓨터 (사진=유튜브)

일론 머스크 CEO가 올해 인공지능(AI) 훈련을 위한 컴퓨팅 인프라 구축에 약 100억달러(약 14조원)을 쏟아 부은 것으로 알려졌다.

트윈버치의 공동 창립자이자 테슬라 투자자인 소이어 메릿은 31일(현지시간) X(트위터)를 통해 테슬라와 xAI가 올해 말까지 100억달러 규모의 훈련 컴퓨팅 용량을 가동할 예정이라고 추산했다. 

이에 따르면 7월에 xAI는 10만개의 'H100' GPU를 통합한 멤피스 슈퍼클러스터 '콜로서스'를 사용해 AI 훈련을 시작했다. 이 시스템은 엄청난 양의 전력을 필요로 하며, 10만개의 H100 GPU만으로 약 70메가와트(MW)에 달하는 전력을 소모하여 전체적으로는 최소 150MW를 소비한다.

시스템의 총 비용은 알려지지 않았지만 GPU만 따져도 약 2만달러(약 2800만원) 단가로 약 20억달러(약 2조000억원)에 이를 것으로 추정된다. 일반적으로 GPU는 데이타센터 구축 비용의 절반을 차지한다.

또 테슬라는 8월 말 텍사스에 있는 슈퍼컴퓨터 ‘코르텍스(Cortex)’를 공개했다. 이 슈퍼컴퓨터는 테슬라의 자율주행 기능 'FSD'와 휴머노이드 로봇 '옵티머스'를 훈련하는 용도다.

테슬라는 엔비디아 AI 칩 구매를 위해 올해에만 30억∼40억달러(약 4조∼5조5000억원)를 투입할 예정이라고 밝혔다. 이곳에는 10만개의 엔비디아 'H100' 및 'H200 칩'이 들어간다. 전력 공급과 시스템 냉각을 위해 올해 130메가와트(MW)의 전력이 필요하며, 앞으로 18개월 동안 500MW 이상으로 늘어날 것으로 예측했다.

테슬라는 코르텍스 말고도 뉴욕 버팔로 공장에 '도조(Dojo)'라는 슈퍼컴퓨터를 보유하고 있다. 이곳에도 총 5억달러(약 7000억원)를 추가 투자할 예정이다.

마지막으로 xAI는 콜로서스에 몇달 안에 H100 GPU 5만개와 H200 GPU 5만 개를 추가할 예정이라고 밝혔다. 여기에 들어가는 비용도 수십억 달러에 달한다.

상기한 4가지 경우를 합산하면 총 비용은 100억달러를 훌쩍 넘는다.

머스크 CEO도 지난 4월 X를 통해 "테슬라가 올해 학습과 추론을 위해 AI에 100억달러 정도를 투자한다"라고 밝혔다. 물론 여기에는 xAI의 비용도 포함된 것으로 보인다.

물론 AI 서버가 모두 설치되고 정상적으로 가동되기까지는 시간이 걸리기 때문에, 두 회사가 2024년에 설치하고 가동 중인 AI 하드웨어의 총 비용은 100억달러에 조금 못 미칠 것으로 보인다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지