최근 오픈 소스 LLM으로 부각...'오픈 AI 대안'으로 지목

(사진=데이터브릭스)
(사진=데이터브릭스)

데이터와 인공지능(AI) 전문 데이터브릭스가 대규모 투자 유치를 준비 중인 것으로 알려졌다. 거론 중인 기업가치가 무려 57조원에 달하는 데다, 최근 오픈AI의 대항마로 꼽힌 '오프 소스 AI' 대표 주자라는 점에서 큰 관심이다.

블룸버그는 26일(현지시간) 데이터브릭스가 430억달러(약 57조원)의 기업가치로 투자사인 T. 로우 프라이스와 새로운 자금 조달 라운드에 대해 논의 중이라고 정통한 소식통을 인용해 보도했다. 물론 비공개로, 투자 유치가 실패할 수도 있다고 전했다.

이에 따르면 이번 라운드에서 투자에 성공하면 데이터브릭스의 기업 가치는 2년 전 펀딩에서 달성한 380억달러보다 높아지게 된다. 오픈AI가 지난 1월 MS로부터 100억달러(약 13조원)를 투자받으면서 기업가치를 300억달러(약 39조원)로 평가받은 것과 비교하면, 데이터브릭스의 기업가치는 놀라운 수준이다. 

이에 대해 데이터브릭스는 논평을 거부했으며, T. 로우 프라이스는 의견을 내놓지 않았다. 다만 알리 고드시 데이터브릭스 CEO는 최근 “회사 자본이 풍부해 자금을 조달할 필요는 없지만, 전략적 이유로는 검토할 수 있다”고 밝힌 바 있다.

데이터브릭스는 미국 실리콘밸리에서 주목받는 데이터 및 AI 전문 기업이다. UC버클리 객원교수이던 알리 고드시와 6명이 2013년 공동 창업했다.

누적 투자 유치액은 36억달러(약 4조6000억원)이다. 투자자들도 아마존, 마이크로소프트(MS), 구글의 모회사인 알파벳 등으로 화려하다.

기업 데이터 분석용 플랫폼 '레이크하우스'를 통해 골드만삭스, 월마트, 그랩 등 기업 9000곳의 데이터 분석을 담당한다는 점이 가장 큰 강점이다. 지난해 매출은 10억달러(약 1조3000억원)다.

알리 고드시 데이터브릭스 CEO가 지난달 열린 데이터+AI 서밋에서 기조연설을 펼치고 있다. (사진=유튜브 Databricks 채널 'Data + AI Summit Keynote Wednesday' 캡처)

특히 올 들어서는 오픈 소스 생성 AI로 확장을 거듭하고 있다. 지난 3월에는 100달러와 서버 1대, 3시간 훈련만으로 구축 가능한 소형언어모델(sLLM) ‘돌리(Dolly)’를 출시했다. 60억 매개변수의 오픈 소스 모델과 5만개의 훈련 데이터로 구축한 돌리는 '챗GPT'급 성능을 갖춘 것으로 알려지며 큰 화제를 모았다.

이어 4월에는 돌리를 기반으로 상업적 목적이 가능한 오픈 소스 모델 '돌리2'를 공개했고, 6월에는 스타트업 모자이크ML을 13억달러(약 1조7000억원)에 인수, 생성 AI 역량을 대폭 강화했다. 모자이크ML은 매개변수 300억개인 언어모델 'MPT-30B'를 오픈 소스로 공개하며 인기를 끌던 중이었다.

특히 최근에는 MS와 손잡고 오픈 소스 생성 AI 모델들을 애저 클라우드를 통해 공급한다고 발표했다. 이 때문에 폐쇄적 구조인 오픈AI의 '대안'으로 지목될 정도였다.

이와 함께 지난주에는 허깅페이스가 엔비디아와 구글 등으로부터 투자 유치에 성공하는 등 오픈 소스 DNA를 가진 기업이 잇달아 약진하는 모양새다.

이번 데이터브릭스의 자금 조달은 기업공개(IPO)를 앞두고 기업가치를 끌어올리려는 시도로 분석된다. 월스트리트에서는 데이터브릭스를 "잭팟을 터트릴 수 있는 IPO 종목"으로 보고 있다.

박찬 기자 cpark@aitimes.com

키워드 관련기사
  • MS, 오픈AI 대안으로 '오픈소스' 선택...데이터브릭스 서비스 추가
  • 데이터브릭스, 생성 AI 스타트업 모자이크ML 1조7000억원에 인수
  • 데이터브릭스, 오픈소스 소형 언어모델 ‘돌리 2.0’ 출시