투게더가 3월 공개한 언어모델용 데이터셋 '레드파자마'의 상징 (사진=투게더)
투게더가 3월 공개한 언어모델용 데이터셋 '레드파자마'의 상징 (사진=투게더)

오픈소스 인공지능(AI) 모델을 서비스하는 스타트업 투게더가 5000만달러(약 700억원) 규모의 투자 협상을 진행하고 있는 것으로 알려졌다. 이 회사는 유휴 GPU를 재판매하는 식의 분산 컴퓨팅 네트워크를 기반으로 하고 있다.

디 인포메이션은 13일(현지시간) 투게더가 3억달러(약 4000억원)의 기업가치로 5000만달러 규모의 펀딩 라운드를 진행하고 있다고 정통한 소식통을 인용해 보도했다.

이에 따르면 이번 투자 라운드는 실리콘밸리 유력 벤처 투자 회사 중 하나인 클라이너 퍼킨스가 주도하고 있다. 엔비디아도 투자에 참여하는 것을 검토하고 있다.

투게더는 빅테크 기업의 폐쇄적인 AI 모델 개발에 맞서 오픈 소스 모델 개발이나 데이터셋 구축을 목표로 지난해 6월 설립된 기업이다. '라마2' '스테이블 디퓨전'을 포함해 십여개의 오픈 소스 기반 대형언어모델(LLM)과 데이터셋을 쉽게 쓸 수 있게 해주는 소프트웨어를 서비스하고 있다. 지난 3월에는 스탠포드대 기초모델연구센터 등 5개 연구기관과 함께 1조2000억 토큰 규모의 언어모델용 데이터셋 '레드파자마'를 만들어 오픈 소스로 공개했다.

또 오픈 소스 생성 AI 모델과 서비스를 직접 구축할 계획이며, 이를 위해 AI 모델의 학습과 미세조정, 운영을 위한 AI 전용 클라우드 플랫폼도 구축 중이다.

특히 투게더는 물리적으로 떨어진 공간에 위치한 컴퓨팅 리소스를 연결한 '분산 컴퓨터 네트워크' 위에 클러스터를 구축, 기업에 클라우드 서비스를 제공한다. 민간 기업이나 암호화폐 채굴 업체 등이 운영하는 데이터센터에 방치된 유휴 GPU와 같은 컴퓨팅 인프라를 재판매하는 식이다.

제이미 드 게르 투게더 제품 담당 수석 부사장은 “AI를 위해 많은 수의 강력한 GPU가 필요할 뿐만 아니라, 이런 GPU는 단일한 위치에서 믿을 수 없을 만큼 빠른 네트워킹으로 연결돼야 한다"라며 "하지만 불행하게도 이런 데이터 센터는 소수의 조직에서만 사용할 수 있다”라고 지적했다.

또 “우리는 연구를 통해 AI 모델 훈련이나 미세조정 중에 네트워크 트래픽을 200배 이상 줄이는 데 성공했다"라며 "이는 여러개의 서로 다른 네트워크에서 GPU를 활용해 대형 모델의 훈련이나 미세조정을 품질 저하없이 실시할 수 있다는 것을 의미한다”라고 설명했다.

한편 투게더는 연 매출이 2000만달러(약 270억원) 수준인 것으로 알려졌다.

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지