미스트랄 AI가 11개 언어로 유해 콘텐츠를 감지하는 API 서비스를 출시했다. 다국어 기능과 온디바이스 AI 지원을 통해 경쟁사의 API 도구와 차별화했다.
미스트랄 AI는 7일(현지시간) 유해한 콘텐츠를 감지하는 '모더레이션 API(Moderation API)'를 자체 플랫폼 르 샤(Le Chat)를 통해 출시했다.
모더레이션 API 서비스는 '미스트랄 8B' 모델을 미세조정, 텍스트와 대화형 콘텐츠에서 성적 콘텐츠와 증오 발언, 폭력, 위험한 활동, 개인 식별 정보 등 9가지 카테고리에 걸쳐 잠재적으로 유해한 콘텐츠를 감지하도록 설계됐다.
특히 한국어를 비롯해 아랍어, 중국어, 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 포르투갈어, 러시아어, 스페인어 등 11개 언어를 지원한다.
단순히 개별 텍스트를 분석하는 것에 그치지 않고 대화 맥락을 이해하도록 모델을 훈련, 기본 필터가 놓칠 수 있는 미묘한 유해 콘텐츠도 감지할 수 있는 시스템을 구축했다는 설명이다.
특히 오픈AI와 앤트로픽 등이 클라우드 기반 솔루션에 집중하는 반면, 미스트랄은 클라우드는 물론 엣지 컴퓨팅에서도 유용하다는 것이 강점이다. 미스트랄의 3B 모델과 8B 모델은 퀄컴의 스냅 드래곤 8 엘리트에 최적화됐다.
이는 엄격한 데이터 보호 규정을 준수해야 하는 유럽 기업들에게 매력적일 수 있다는 분석이다.
미스트랄은 "우리는 확장 가능하고 가볍고 사용자 정의가 가능한 조정 도구를 구축하고 공유하고 있다"라며 "연구 커뮤니티와 계속 협력해 광범위한 분야의 안전 발전을 기여할 것"이라고 밝혔다.
한편, 미스트랄은 이날 '배치 API(Batch API)'도 발표했다. 이는 대규모의 태스크를 비동기 방식으로 처리, 모델 사용료를 25% 절감할 수 있는 서비스다.
박찬 기자 cpark@aitimes.com
