(사진=아르시 AI)
(사진=아르시 AI)

인공지능(AI) 스타트업 아르시 AI(Arcee AI)가 도메인별로 독립 훈련한 더 작고 특화된 전문가 모델들을 조합, 쿼리에 따라 최적의 결과를 도출해 주는 새로운 전문가 혼합 모델(MoE) 네트워크를 구축했다.

마크테크포스트는 15일(현지시간) 아르시 AI가 도메인별 전문 데이터셋에서 독립적으로 훈련된 전문가 모델들을 조합, 프롬프트와 요청에 따라 최적의 모델로 라우팅하는 전문가 모델 네트워크 ‘아르시 스웜(Arcee Swarm)’을 출시했다고 보도했다.

이에 따르면 아르시 스웜은 오픈AI의 'GPT-4'와 같은 단일 모델이 아니라, 80억에서 720억개의 매개변수에 이르는 다양한 독립적인 전문가 모델의 조합이다. 이전에 등장한 MoE 방식과 똑같으나, 이 회사는 각 모델을 도메인 별로 미세조정해 전문가급으로 성능을 높였다고 밝혔다.

이 모델은 스웜 내 일반 모델과 결합하면 전문 작업뿐만 아니라, 일반적인 작업과 추론에서도 뛰어난 성능을 발휘하는 등 포괄적인 솔루션을 제공한다는 설명이다. 예를 들어, 스웜 내에는 창의적 글쓰기, 코딩, 수학, 의학 등에 초점을 맞춘 모델들이 있다.

차별화된 요소는 사용자별 쿼리를 받아들이고 처리한 후 해당 쿼리에 가장 적합한 전문가 모델을 스웜 내에서 선택하는 역할을 하는 '라우터'다. 라우터 모델은 1억개의 매개변수를 가진 새로운 독점 아키텍처를 활용해 구축했으며, 쿼리 처리 전문답게 사용자 쿼리 데이터셋으로 훈련했다.

이를 통해 라우터 모델은 사용자 쿼리의 미묘한 차이를 이해하고, 작업에 적합한 하나 이상의 모델을 정확하게 선택할 수 있다는 설명이다.

이런 접근 방식은 일반적인 LLM 수준의 정확도를 유지하면서 지연 시간을 낮춘다. 즉, 쿼리를 수천개의 전문 모델에 라우팅하는 복잡성에도 불구하고, 질문에 대한 응답 속도는 단일 LLM과 동일하다. 이는 정밀성과 속도가 중요한 의료 진단이나 실시간 코딩 지원과 같은 분야에서 매우 중요하다고 강조했다.

또 '울트라 모드(Ultra Mode)’를 지원, 정확성이 극도로 중요하고 오류 가능성이 최소화되어야 하는 작업에 활용한다. 

이 모드가 활성화되면, 에이전트 워크플로우가 백그라운드에서 작동해 두개 이상의 모델을 협력시켜 질문에 대한 최상의 답변을 찾게 된다. 전문가 모델은 제안을 생성하고, 서로의 응답을 비판하며, 합의에 도달할 때까지 여러번 반복을 통해 응답을 다듬게 된다. 

이처럼 울트라 모드는 깊이 있는 분석과 전문성이 요구되는 시나리오에서 유용하다. 여러 모델이 서로 경쟁해 단일 AI 모델의 범위를 넘는 복잡한 쿼리를 처리할 수 있도록 한다. 

이처럼 여러개의 전문가 모델들이 협력하는 에이전트를 선택, 작업을 수행하는 ‘에이전트 혼합(MoA, Mixture of Agents)’ 방식을 구축했다고 전했다.

아르시 스웜은 AWS, 구글 클라우드, 마이크로소프트(MS) 애저 클라우드에서 제공될 예정이며, 몇 주 내에 아르세 AI의 웹사이트에서도 사용할 수 있게 될 예정이다.

한편 이 회사는 이달초 LLM의 지식을 소형언어모델(sLM)로 이전해 주는 오픈 소스 증류 도구 '디스틸킷(DistillKit)'을 출시해 눈길을 모았다.

이어 아르시 스웜까지 출시, 최근 가장 두각을 보이는 AI 스타트업으로 떠올랐다.

박찬 기자 cpark@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지