마이크로소프트(MS)가 지난달 출시한 소형언어모델(sLM) '파이-4(Phi-4)'를 완전한 오픈 소스로 공개했다. 이 모델은 수학을 비롯한 추론 능력을 대폭 강화했으며, 기존의 대형언어모델(LLM)과 견줄 만한 성능을 자랑한다.
시타르 샤 MS 선임 연구원은 8일(현지시간) X(트위터)를 통해 파이-4를 다운로드 가능한 가중치를 포함한 완전한 오픈 소스로 공개한다고 발표했다.
일반적으로 가중치가 공개되지 않으면 모델을 완전한 오픈 소스로 간주하지 않는데, 이는 연구자들이 모델을 수정하거나 자신만의 용도로 최적화하는 데 제약이 있기 때문이다.
파이-4는 지난해 12월 출시됐으며, 그동안은 '애저 AI 파운드리'를 통해 연구 라이선스 계약 하에서만 접근할 수 있었다. 그러나 이제 허깅페이스에서 가중치가 포함된 모델을 다운로드할 수 있게 됐으며, 상업적 용도로도 자유롭게 활용할 수 있다. 사용자는 MS의 허가 없이도 이 모델을 프로젝트에 통합하거나 특정 애플리케이션에 맞게 미세조정할 수 있다.
샤 연구원은 "파이-4가 공개된 이후 많은 관심과 함께 가중치 공개를 요청하는 목소리가 컸다"라며 "일부 사용자는 불법적으로 가중치를 허깅페이스에 업로드하기도 했다"라고 밝혔다.
140억개의 매개변수를 보유한 파이-4는 언어 처리뿐만 아니라 수학 등 복잡한 추론 작업에서도 뛰어난 성능을 발휘하는 것으로 알려져 환영받고 있다. 미국 수학경시대회(AMC) 테스트에서 '라마', '큐원' 등 기존 오픈 소스 모델뿐만 아니라, 'GPT-4o', '클로드 3.5 소네트', '제미나이 1.5' 등 첨단 언어 모델보다 우수한 결과를 기록했다.
적은 계산 자원으로도 높은 효율을 보여주는 것도 장점이다.
박찬 기자 cpark@aitimes.com
