(사진=셔터스톡)
(사진=셔터스톡)

마이크로소프트(MS)가 생성 인공지능(AI) 시장 장악을 위해 오픈소스 진영의 데이터브릭스와 손을 잡는다. 그간 오픈AI에 집중했던 AI 서비스 확대를 위해 강력한 오픈소스 모델을 활용하겠다는 의미다.

디인포메이션은 17일(현지시간) MS가 기업 비즈니스용 AI 애플리케이션 개발을 지원하는 데이터브릭스의 생성 AI 도구를 애저 클라우드에서 서비스할 예정이라고 정통한 소식통을 인용해 보도했다.

MS는 이로써 지난 7월 메타의 오픈소스 대형언어모델(LLM) ‘라마 2’를 애저 클라우드에서 제공하기로 제휴한 데 이어 데이터브릭스와도 손을 잡았다. 이 같은 행보는 MS가 오픈AI를 넘어 AI 플랫폼을 확장하겠다는 의지를 보인 것으로 평가된다.

보도에 따르면 MS의 데이터브릭스 서비스는 기업이 AI 모델을 개발하거나 오픈소스 모델을 용도에 맞게 수정할 수 있도록 지원한다. 데이터브릭스는 이를 통해 기업 시장에서 오픈AI 'GPT-4'의 대안이 되는 것을 목표로 한다.

클라우드 서비스를 기업에 제공하는 MS로서는 기업이 필요에 따라 AI 모델을 선택할 수 있도록 다양한 옵션을 줄 수 있어 유리하다. 애저와 연동한 AI 모델이 많을수록, 더 다양한 기업을 모을 수 있기 때문이다.

특히 폐쇄적이라고 비평받는 오픈AI와 달리 데이터브릭스는 대표적인 오픈소스 모델을 갖춰, 다양한 크기의 모델을 용도에 맞춰 제공할 수 있다. 

클라우드 컴퓨팅 사업을 하지 않는 데이터브릭스 입장에서도 클라우드 사업자 중 한곳과 협력하는 것이 유리하다. 이번 협업으로 데이터브릭스는 MS 애저를 기반으로 제품 저변을 넓힐 기회를 확보했다.  

데이터브릭스는 지난 3월 100달러와 서버 1대,  3시간 훈련만으로 구축 가능한 sLLM ‘돌리(Dolly)’를 출시해 화제를 모았다. 60억 매개변수의 오픈소스 모델과 5만개의 훈련 데이터로 구축한 돌리는 '챗GPT'급 성능을 갖춘 것으로 알려졌다. 

이어 4월에는 돌리를 기반으로 상업적 목적이 가능한 오픈소스 모델 '돌리2'를 공개, 많은 개발자들로부터 활용됐다.

또 지난 6월에는 매개변수 300억개인 언어모델 'MPT-30B'를 오픈소스로 공개해 역시 큰 인기를 모았던 스타트업 모자이크ML을 13억달러(약 1조7000억원)에 인수, 생성 AI 역량을 대폭 강화했다.

인포메이션은 이에 대해 "MS가 AI 경주에서 탈 두번째 말을 찾았다"며 "오픈소스인 데이터브릭스는 폐쇄적 구조의 오픈AI에 맞설 '안티-오픈AI' 카드가 될 수 있다"고 분석했다.

박찬 기자 cpark@aitimes.com

키워드 관련기사
  • 메타, 상업용 오픈소스 LLM ‘라마2’ 공개
  • 데이터브릭스, 생성 AI 스타트업 모자이크ML 1조7000억원에 인수
  • 데이터브릭스, 오픈소스 소형 언어모델 ‘돌리 2.0’ 출시