오픈AI가 자체 데이터 저장용 데이터센터 구축을 검토하고 있는 것으로 알려졌다. 이는 마이크로소프트(MS)에 대한 의존도를 낮추고, AI 개발에 필수적인 데이터를 직접 관리하려는 전략으로 풀이된다.
디 인포메이션은 26일(현지시간) 정통한 소식통을 인용, 오픈AI가 최근 수십억달러 규모의 데이터 스토리지 하드웨어 및 소프트웨어 구입을 검토했다고 보도했다. 또 오픈AI는 이 하드웨어를 수용하기 위해 처음으로 스토리지용 데이터센터 건설도 검토 중이다.
이번 스토리지 구축은 '스타게이트' 프로젝트와 맞물려 있다. 오픈AI는 올해 데이터센터 용량을 현재의 3배 이상으로 확장할 계획이며, 이에 따라 약 2기가와트(GW)에 달하는 전력을 소비할 것으로 예상된다.
특히 오픈AI는 직원들에게 올해 말까지 연구원들이 2024년 말보다 약 8배 더 많은 컴퓨팅 파워로 새로운 AI를 훈련할 수 있을 것이라고 말한 것으로 알려졌다. 이는 현재 챗GPT 서비스에 사용하는 서버와는 별개로, 새롭게 추가되는 컴퓨팅의 양이다.
만약 이번 프로젝트가 실행된다면 오픈AI는 단숨에 세계 최대 스토리지 보유 기업 중 하나가 될 전망이다. 이를 위해 최대 5엑사바이트(Exabytes) 규모의 저장 공간을 확보하려는 계획이기 때문이다.
참고로, 애플은 2021년 기준 아이클라우드(iCloud) 서비스를 통해 저장된 미디어 및 문서를 처리하기 위해 8엑사바이트 이상의 용량을 확보했다.
AI에서도 스토리지는 유용하다. 개발자들은 몇주에서 몇달에 걸친 작업을 진행하며, 알고리즘의 체크포인트와 가중치를 저장할 필요가 있기 때문이다. 이를 통해 개발 중 문제가 생기면 특정 지점에서 학습을 재개할 수 있기 때문이다.
대규모 스토리지 확보는 비용 절감책도 될 수 있다. 앞으로 MS뿐만 아니라 오라클과 코어위브의 서버로 활용 폭이 늘어남에 따라, 데이터를 한 업체에서 다른 업체로 전송하는 비용이 자체 데이터센터를 운영하는 것보다 더 많이 들 수 있기 때문이다.
스토리지 업계에서는 최근 몇주 동안 오픈AI가 뜨거운 이슈인 것으로 알려졌다. 계약을 두고 경쟁할 가능성이 있는 기업으로는 퓨어 스토리지, 바스트 데이터, DDN, MinIO, 웨카 등이 거론되고 있다.
물론, 오픈AI는 계약을 확정하지 않은 상태다. 일부 전문가들은 스토리지 논의를 클라우드 제공업체와의 협상 카드로 활용할 가능성도 있다고 분석하고 있다.
박찬 기자 cpark@aitimes.com
