오픈AI와 마이크로소프트(MS)가 나란히 소형언어모델(sLM)에 미세조정 기능을 도입했다. 최근 기업에서 맞춤형 sLM 도입이 주를 이루자, 여기에 대응한 것이다.
오픈AI는 24일(현지시간) 새로운 'GPT-4o 미니' 모델에 대한 미세조정을 무료로 제공한다고 발표했다.
오픈AI의 요금제 중 가장 높은 가격대인 티어 4 및 티어 5 사용자부터 무료 미세조정 기능에 대한 액세스를 허용했다. 무료 미세조정은 오는 9월23일까지 제공되며, 점진적으로 모든 티어로 확대할 계획이다.
미세조정 대시보드에서 GPT-4o 미니를 선택하면 된다. 24시간당 200만개의 훈련 토큰이 제공되며, 200만개 토큰을 초과하면 100만 토큰당 3달러가 부과된다. 이를 통해 기업의 자신들이 보유한 데이터로 모델을 재학습, 특정 성능을 높일 수 있게 됐다.
이는 GPT-4o 미니가 기존 미세조정으로 인기를 얻었던 'GPT-3.5 터보'를 대체하는 모델이기 때문이다. 이는 저렴한 가격과 미세조정 기능으로 기업 사용자들에게 인기를 얻었던 모델이다.
특히 이번에는 비용을 더 낮췄다. GPT-4o 미니는 더 긴 컨텍스트와 더 낮은 지연 시간으로 더 비용 효율적이고 더 많은 기능을 제공한다.
이어 MS는 ‘파이-3(Phi-3)’ 모델에 대한 미세조정 서비스를 25일 애저 서비스를 통해 출시했다. 사용자가 추가 데이터로 모델을 학습, 특정 사용 사례에서 더 높은 성능을 구현할 수 있도록 지원하겠다는 방침이다.
MS는 지난 4월 매개변수 38억개인 ‘파이-3-미니’와 70억개의 ‘파이-3-스몰’, 140억개인 ‘파이-3-미디엄’ 3가지 버전의 sLM을 공개했다.
파이-3는 지난해 12월 출시된 파이-2보다 성능이 개선됐을 뿐만 아니라, 10배 큰 모델 수준의 성능을 제공할 수 있다. 비슷한 성능을 지닌 다른 모델들에 비해 비용이 10분의 1에 불과하다.
MS는 파이-3가 특정 기업 사용 사례에 맞게 미세조정하는 데 적합하다고 강조했다. 그러나 출시 당시에는 모델을 미세조정할 수 있는 서버리스 옵션이 없었다. 미세조정을 원한다면, MS 애저 서버를 직접 설정하거나 모델을 다운로드해 자체 로컬 머신에서 실행해야 했다.
서버리스는 개발자가 서버 또는 백엔드 인프라를 프로비저닝하거나 관리하지 않고도 애플리케이션을 설계하고 실행할 수 있는 클라우드 컴퓨팅 애플리케이션 개발 및 실행 모델이다. 특히 실행을 시작하면 비용이 발생하고, 실행을 멈추면 비용 계산이 종료되는 시스템이다.
MS가 공개한 서버리스 미세조정은 애저 AI 개발 플랫폼에서 파이-3-미니와 파이-3-미디엄에 적용된다.
한편 MS는 이날 서비스형 모델(Models-as-a-Service)인 서버리스 엔드포인트 기능도 출시했다. 이를 통해 개발자는 파이-3 스몰 모델을 기반으로 앱을 구축할 수 있다. 이미지 입력을 처리할 수 있는 멀티모달 모델 파이-3 비전도 곧 서버리스 엔드포인트를 통해 제공할 예정이다.
박찬 기자 cpark@aitimes.com
- 엔비디아, 기업용 미세조정 서비스 'AI 파운드리' 공개...메타와 본격 협력 체제 구축
- ML옵스 스타트업, 설립 2년 만에 대규모 투자 유치...미국도 맞춤형 모델 유행
- MS, sLM '파이-3' 출시..."38억 매개변수로 GPT-3.5 성능"
- 오픈AI, 'GPT-4o' 출력 16배 늘린 '롱 아웃풋' 모델 출시
- 라이터, 의료 및 금융 산업용 LLM 오픈 소스 출시..."전문 분야서 GPT-4보다 우수"
- 오픈AI, 기업용 맞춤형 모델 시장 본격 진출...'GPT-4o' 미세조정 기능 출시
- 사용량 대신 '성과'로 과금하는 AI 요금제 등장...저가 경쟁 대세 될까
