콜로서스 내부 (사진=xAI)
콜로서스 내부 (사진=xAI)

다리오 아모데이 앤트로픽 CEO는 지난해 7월 한 팟캐스트에서 첨단 인공지능(AI) 모델 훈련 비용이 1억달러(약 1383억원)가 들었으며, 당시 개발 중이던 '클로드 4'는 10배인 10억달러(약 1조3830억원)까지 치솟았다고 전한 바 있습니다.

모델 개발 비용이 공개되는 경우는 많지 않습니다. 비용을 계산하는 기준도 제각각입니다. 예를 들어, 딥시크는 V3 개발에 들어간 비용이 557만달러(약 77억원)에 불과하다고 밝혔으나, 이는 전문가들로부터 많은 반박을 당했습니다. 모델 학습에 사용한 일부 칩 비용만 강조된 것으로, 전체 비용은 5억달러(약 6915억원)가 넘을 것이라는 분석입니다.

이 가운데 비영리 단체인 에포크 AI(Epoch AI)가 xAI의 최신 모델 '그록-4' 개발 비용을 추산, 발표했습니다.     

에포크 AI는 '주목할 만한 AI 모델(Notable AI models)' 리스트 공개로 유명한 곳입니다. 지난 2024년에는 국내에서 단 하나의 모델도 올리지 못했다는 사실로 떠들썩했고, 올해 초에는 LG AI 연구원의 '엑사원 3.5'가 등재되며 화제가 됐습니다.

그록-4는 지난 7월8일 출시됐습니다. 특히, 엔비디아 GPU 20만장을 설치한 세계 최대 규모의 데이터센터 '콜로서스'에서 훈련한 모델입니다. 가장 자본 집약적인 모델이라고 해도 과언은 아닐 것입니다.

결론부터 말하자면 에포크 AI는 그록-4의 훈련 컴퓨팅에만 약 5억달러가 소요된 것으로 추정했습니다.

그록-3에 대한 공개 정보를 바탕으로 확장분을 추산, 그록-4는 2억4600만 H100시간 동안 훈련된 것으로 계산했습니다. 

최대 전력 소모량이 700와트(W)인 'H100'의 변형을 사용한다고 가정하고, GPU 외 하드웨어와 냉각 등에 들어간 전력 비용을 합산하면 최종 전력 추정치는 310기가와트시(GWh)라고 밝혔습니다. 이는 4000명의 미국인이 거주하는 마을에 전력을 공급할 수 있는 에너지와 맞먹습니다.

비용은 전기 요금과 H100 GPU 비용으로 구성됐습니다.  ▲H100 임대료를 기준으로 계산하는 방법 ▲H100 구매 비용에서 감가상각 부분을 계산하는 두가지 방법을 모두 사용했습니다. 두 경우 모두 4억9000만달러가 나왔습니다.

그록-4 개발 비용 및 소요 전력 (사진=에포크 AI)
그록-4 개발 비용 및 소요 전력 (사진=에포크 AI)

AI 훈련 중 서버에서 발생하는 열을 식히는 문제도 중요합니다. 그록-4 훈련 기간 전력을 공급한 가스 터빈 발전기는 메가와트시(MWh)당 158갤런의 물을 소비합니다. 데이터센터 냉각에 사용한 전력량까지 감안하면, 그록-4 훈련에는 7억5000만리터(ℓ)가 들어간 것으로 추산됐습니다. 이는 올림픽 규격 수영장 300개를 채울 수 있는 양으로 소개됐습니다.

마지막으로 이 과정에서 5만4000톤의 이산화탄소가 배출된 것으로 봤습니다. 이는 보잉 항공기 한대가 3년간 배출하는 온실가스와 동일합니다.

물론, 이번 내용은 공개된 내용을 바탕으로 한 추측이며, 그록-4의 실제 학습 비용이 아닙니다. 또 인건비나 제반 비용 등은 제외됐습니다.  따라서 실제 비용은 훨씬 더 클 수 있다는 분석입니다.

이는 아모데이 CEO가 밝혔던 10억달러와 맞먹는 수준으로 볼 수 있습니다. 또 딥시크가 V3 개발에 5억달러를 소요했을 것이라는 추측과도 맞아떨어집니다. 딥시크의 비용 중 xAI보다 적은 것은 H100 대신,  성능이 떨어지는 'H800' 칩을 2048장 사용했다는 것뿐입니다. 그러나 세미애널리시스는 V3 개발에 H100 1만장과 'H20' 2만장 등 다른 칩이 5만장 이상 투입됐을 것으로 보고 있습니다.

또 에포크 AI는 그록-4 개발비가 지난해 4월 '라마 3'의 9배에 달한다고 밝혔습니다. 이는 1년에 10배씩 개발비가 늘어난다는 추세와도 일치합니다.

1년 뒤 다시 모델 훈련 비용이 10배로 증가, 50억달러(약 6조9155억원)에 달할지는 미지수입니다. 그러나 최근 인재 경쟁으로 인한 인건비 상승과 빅테크들의 AI 인프라 투자 속도, 그리고 '강화 학습 체육관(RL GYM)'과 같은 데이터 비용 등의 증가가 계속 보고되고 있습니다. 

참고로 2024년 삼성전자의 연간 매출은 300.9조원이며, 내년 우리 정부의 예산은 728조원으로 편성됐습니다. 단순 계산으로는 50억달러짜리 프론티어 모델을 각각 43대와 105대 만들 수 있는 수치입니다.

쉽게 예측되는 것은 첨단 AI 성능을 달성하는 획기적인 방법이 등장하지 않는 한, 내년부터 프론티어 모델 개발은 일부 기업의 전유물이 되리라는 것입니다. 이미 어지간한 AI 스타트업들은 소형 모델 개발로 전환한 상태입니다.

이어 17일 주요 뉴스입니다.

(사진=유튜브)
(사진=유튜브)

구글, 유튜브 쇼츠에 '비오 3' 탑재...생성 AI 기능 대거 추가

유튜브에 첨단 동영상 모델 비오 3를 기반으로 한 AI 기능이 대거 추가됐습니다. 영상은 물론 사운드와 노래까지 만들어 주고, 크리에이터들을 위한 지원도 강화했습니다. 누구나 쉽게 영상 창작자가 될 수 있도록 한 것입니다. 

오픈AI "챗GPT에 성인 인증 도입할 것"

예고한 대로 챗GTP에 성인 인증 과정이 추가될 예정입니다. 최근 청소년 보호에 대한 경고가 높아지는 것에 따른 것입니다. AI도 이제는 소셜 미디어와 같은 잣대가 적용되고 있습니다.  

구글, AI 에이전트 '결제 지원' 프로토콜 오픈 소스 공개

에이전트가 사람 대신 결제까지 할 수 있도록 지원하는 구글의 통신 프로토콜이 등장했습니다. 기술보다 60여곳의 글로벌 금융 및 결제 업체가 여기에 참가했다는 것이 더 중요합니다. 

AI타임스 news@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지