세일즈포스가 인공지능(AI) 에이전트의 핵심 구성 요소인 'API 함수 호출' 작업에 특화된 경량 AI 모델을 공개했다. 고작 10억개의 매개변수에도 불구, 함수 호출 작업에서는 오픈AI, 앤트로픽 등의 대형 모델의 성능을 능가하는 것으로 나타났다.
벤처비트는 3일(현지시간) 세일즈포스가 사용자 쿼리를 일련의 API 함수 호출로 변환하여 작업을 완료하는 10억 매개변수의 ‘x램-1B(xLAM-1B)’ 모델을 공개했다고 보도했다.
x램-1B는 자연어로 된 사용자 쿼리를 이해하고 '챗GPT'처럼 응답하는 것이 아닌, 사용자 명령을 수행하기 위해 적절한 도구와 API셋을 호출하는 AI 에이전트용 모델이다.
세일즈포스는 이 모델에 ‘작은 거인(Tiny Giant)’이라는 별명을 붙였다. 매개변수가 10억개에 불과하지만 버클리 함수 호출 벤치마크에서는 'GPT-3.5 터보'와 '클로드-3 하이쿠' 등 훨씬 큰 모델을 능가하는 뛰어난 성능을 달성했다.
이런 성능의 핵심은 훈련 데이터의 품질과 다양성에 따른 것이다. 세일즈포스는 함수 호출 애플리케이션에서 AI 모델을 훈련하기 위해 고품질의 다양하고 검증 가능한 데이터셋을 생성하는 자동화된 파이프라인 'API젠(APIGen)'을 개발했다.
API젠을 활용, 21개의 다른 범주에 걸쳐 3673개의 실행 가능한 API를 수집해 확장 가능하고 구조화된 방식으로 다양한 함수 호출 데이터셋을 생성할 수 있다. 또 6만개의 고품질 함수 호출 예제를 포함하는 데이터셋을 공개했다.
세일즈포스는 x램-1B를 통해 경향 모델이 사용자 쿼리를 처리하는 함수 호출을 효과적으로 구동할 수 있다는 것을 보여줬다. 모델 크기보다 데이터 품질에 초점을 맞춤으로써 훨씬 적은 매개변수로 특정 작업에 최적화된 모델을 구축한 것이다.
게다가 x램-1B과 같은 경량 모델을 활용하면 온디바이스 AI 애플리케이션 개발을 가속화할 수 있다.
현재 많은 고급 AI 기능은 모델의 크기와 복잡성 때문에 클라우드 컴퓨팅에 의존하고 있다. 만약 x램-1B와 같은 경량 모델이 유사한 기능을 제공할 수 있다면, 이는 사용자의 기기에서 직접 실행되는 강력한 AI 에이전트를 가능하게 한다.
이는 모델의 빠른 응답이 가능할 뿐만 아니라, 클라우드 AI의 개인정보 보호 문제를 해결할 수 있다.
박찬 기자 cpark@aitimes.com
