GPU 10만개를 투입해 세계 최대 규모의 컴퓨팅 인프라를 구축했다는 일론 머스크 CEO의 주장이 과장이라는 분석이 나왔다. 하지만, 이 문제로 샘 알트먼 오픈AI CEO는 경쟁에서 뒤처질지 우려했다는 말도 나왔다.
디 인포메이션은 4일(현지시간) 데이터 센터 전문가 2명을 인용, 머스크 CEO의 '콜로서스' 완성 주장이 현실성이 없다고 지적했다.
머스크 CEO는 전날 X(트위터)를 통해 미국 멤피스에 있는 xAI의 데이터센터 ‘클로서스’가 완성됐다고 밝혔다. 이를 "세계에서 가장 강력한 AI 훈련 시스템"이라고 자랑했다.
하지만 이는 기존의 통념에서 벗어난 것이라는 분석이다. 그 정도 규모의 클러스터를 완성하는 데에는 1년 이상이 걸릴 수 있다는 것이다.
멤피스 데이터센터는 올봄부터 공사를 시작했다. 지난 3월 테네시주 공무원들과 공장 설립을 논의했다는 보도가 나왔다. 따라서 대부분은 내년 가을쯤 완성될 것으로 전망했다.
하지만 머스크 CEO는 지난 7월22일 데아터센터 가동을 시작했다고 밝혔다. 또 한달이 조금 지나자, 클러스터를 완성했다고 밝혔다.
현재 기술의 한계로 10만개의 GPU를 연결해 단일 컴퓨터처럼 작동하는 것은 한번도 성공한 적이 없다. 기존에는 메타가 2만4576개 GPU를 연결한 클러스터가 최대였다.
기술 문제를 해결했다고 해도 데이터센터를 뒷받침하는 전력이 문제가 된다. 멤피스의 지역 전기회사의 규모를 감안하면 5만개 정도의 GPU만 가동할 수 있는 정도다.
xAI는 모자란 전력을 보완하기 위해 정부에 신고도 하지 않고 가스 터빈 20대를 활용했다는 이유로 최근 지역 환경단체로부터 고소당한 일도 있다. 이를 모두 감안해도 10만개의 GPU를 돌리기는 부족하다는 설명이다.
하지만 완성 여부와 관계없이, 경쟁을 펼치는 기업에게는 큰 위협이 된 것으로 보인다.
샘 알트먼 오픈AI CEO는 마이크로소프트(MS) 임원들에게 xAI가 컴퓨팅 파워에 더 많이 접근, AI 개발 경쟁에서 앞설 수 있다는 우려를 표한 것으로 알려졌다.
MS는 2030년까지 1000억달러를 투입, 오픈AI에 수백만개의 GPU를 공급하는 '스타게이트' 프로그램을 진행 중으로 알려져 있다.
하지만 xAI가 현존 최대의 슈퍼컴퓨팅 인프라를 갖추며 내년 오픈AI보다 더 진보한 모델을 내놓게 되면, 오픈AI는 물론 MS도 치명타를 입게 된다. 또 xAI는 GPU를 계속 추가할 뜻을 밝혀, 자칫 격차가 벌어지는 사태까지 일어날 수 있다.
머스크 CEO는 과장하는 경향이 크지만, 과거 스페이스X나 테슬라에서도 목표를 결국 달성해 내는 모습을 보여왔다. 그래서 이번 콜로서스 완성 선언도 허풍으로 넘길 일이 아니라는 분석이다. 기본적인 작업만 마친 '일부 완성'으로 보는 것이 현실적이라는 평이다.
임대준 기자 ydj@aitimes.com
- xAI, GPU 10만개 탑재한 '콜로서스' AI 훈련 시스템 완성
- 머스크, 오픈AI 또 고소...이번에는 손해배상까지 청구
- 머스크, 테슬라의 xAI 7조 투자 계획 온라인 투표서 지지..."이사회서 승인 받을 것"
- "xAI, 테슬라에 자율주행 기술 제공하고 매출 배분 논의"...머스크는 부인
- "메타도 GPU 10만개 클러스터 구축 중...연말 '라마 4' 훈련에 투입"
- MS, 블랙록과 최대 규모 'AI 인프라' 펀드 조성...UAE와 AI 연구센터 설립
- 젠슨 황 "19일 만에 슈퍼컴 구축한 머스크는 슈퍼맨...남들은 1년 걸릴 일"
- 오픈AI, 역대 최대 규모 AI 데이터센터 구축 중..."엔비디아 최신 칩 5만개 투입"
