일론 머스크 CEO가 몇개월 만에 GPU 10만개로 구축한 데이터센터의 비밀을 파헤치기 위한 정보 탐색이 치열하다는 소식이다. 일부는 드론까지 동원해 시설을 촬영하는 것으로 알려졌다.
디 인포메이션은 13일(현지시간) 테네시주 멤피시에 취한 xAI의 데이터센터 '콜로서스'를 둘러싸고 AI 업계에서 노하우를 수집하려는 시도가 치열해지고 있다고 보도했다.
이에 따르면 지난달에는 콜로서스 주변을 비행하며 사진을 촬영하는 드론이 목격됐다. 어느 기업의 것인지는 파악되지 않았으나, 엄격한 경비를 피해 시설 운영에 대한 힌트를 얻으려는 시도라는 것이 관계자들의 말이다.
특히 부족한 전력을 공급하기 위해 설치한 가스 터번과 서버의 열을 식히는 방식에 대한 단서를 얻으려는 것으로 파악됐다.
또 콜로서스 개발에 대한 소식이 퍼지자, 아마존과 마이크로소프트, 구글 등 클라우드 사업자들은 엔비디아에 전화를 걸어 슈퍼컴퓨터를 빠르게 개발한 비결을 캐냈다. 또 메타 등 일부 기업은 소규모 경쟁 클라우드 공급업체에 전화를 걸어 더 빠르게 데이터 센터 용량을 제공할 수 있는지 문의했다.
또 머스크 CEO가 X(트위터)를 공개한 데이터센터 내부 이미지와 유튜버를 통해 공개한 내부 시설 영상을 면밀하게 분석했다.
이처럼 콜로서스는 업계에 두가지 충격과 의문을 가져다줬다. GPU 10만개에 달하는 클러스터의 크기와 이를 몇 개월에 구축했다는 속도 면이다. 이 때문에 머스크 CEO가 지난 9월 콜로서스 가동을 선언하자, 일부에서는 과장이라고 평가했다.
GPU 10만개를 하나의 슈퍼컴퓨터로 연결하는 것은 서버가 소모하는 전력량과 칩을 서로 연결하는 데 사용되는 네트워킹 장비의 병목 현상 때문에 간단하지 않은 일이다. 그래서 슈퍼컴퓨터 구동까지는 대략 1년이 걸릴 것으로 예상했는데, 머스크 CEO는 하드웨어 설치에서 모델 훈련을 시작하는 데 19일, 건설을 포함해서는 122일밖에 걸리지 않았다고 밝혔다.
이 때문에 젠슨 황 엔비디아 CEO는 그를 "슈퍼맨"이리고 부르며 "다른 사람들이 1년 걸리는 일을 19일 만에 해냈다"라고 칭찬했다. 또 "10일 동안 아무도 잠을 자지 않았다는 것은 확실하다"라고 덧붙였다.
머스크 CEO가 빠른 데이터센터 구축을 위해 몇가지 핵심 부분을 잘라내, 따로 진행한 것만은 확실한 것으로 보인다. 그는 스페이스X나 테슬라 공장 건설에서도 지체되거나 불필요한 부분을 제쳐 두고 프로젝트를 밀어붙인 경험이 있다.
오픈AI나 메타, 구글 등 슈퍼컴퓨터 구축 경쟁을 벌이는 업체들은 콜로서스의 등장에 충격을 받은 것으로 알려졌다. 특히 샘 알트먼 오픈AI CEO는 이때부터 마이크로소프트의 컴퓨티 지원 외 별도의 데이터센터 구축을 결심한 것으로 알려졌다.
그는 오라클로부터 최신 GPU를 확보하고 크루소라는 데이터센터 전문 스타트업에 건설을 맡기는 방법으로 현재 미국 텍사스에 역대 최대 규모의 데이터센터를 건설 중으로 알려졌다. 여기에는 엔비디아의 최신 칩 'GB200' 5만개에 이어 추후 5만개를 추가할 예정으로, 콜로서스를 넘는 역대 최대 규모가 될 예정이다.
크루소는 지난 6월부터 데이터센터 구축을 시작, 내년 1분기 구동을 목표로 하고 있다. 관계자들은 "이제까지 작업한 프로젝트 중 가장 빠른 빌드"라고 설명했다.
임대준 기자 ydj@aitimes.com
- 오픈AI, 역대 최대 규모 AI 데이터센터 구축 중..."엔비디아 최신 칩 5만개 투입"
- 젠슨 황 "19일 만에 슈퍼컴 구축한 머스크는 슈퍼맨...남들은 1년 걸릴 일"
- xAI, GPU 10만장 투입한 슈퍼컴퓨터 내부 공개..."10만장 더 추가할 것"
- 오픈AI 데이터센터 건설 담당 크루소에 투자사 70곳 몰려
- 인텔 CEO도 머스크의 슈퍼컴 칭찬..."인텔 CPU 사용해서 기뻐"
- 엔비디아 "머스크의 GPU 욕심에 부담 느껴"
- xAI "콜로서스 GPU 10만장에서 100만장으로 확대"...오픈AI-MS 추격 나서
- 브로드컴, 소규모 데이터 센터 연결하는 네트워킹 칩 출시
