알리바바는 6일(현지시간) 최신 인공지능(AI) 임베딩 모델인 ‘큐원3(Qwen3) 임베딩 시리즈’를 오픈 소스로 공개했다.
임베딩 모델은 텍스트를 숫자 형태로 변환해 컴퓨터가 의미를 이해할 수 있도록 도와주는 핵심 기술로, 보다 정밀하고 의미 중심적인 검색 결과를 가능하게 한다.
이번에 출시된 모델은 다국어·프로그래밍 언어 등 100여개 언어를 지원하며, 강력한 다국어 처리, 교차 언어 검색, 코드 검색 능력이 특징이라고 소개했다.
특히, 텍스트 임베딩 성능을 평가하는 '매시브 텍스트 임베딩 벤치마크(Massive Text Embedding Benchmark)'에서 1위를 기록했다.
이번 큐원3 임베딩 시리즈를 통해 기존 큐원 모델의 학습 최적화와 임베딩·재정렬 시스템의 효율성을 더 끌어올릴 수 있을 것으로 기대하고 있다. 검색 결과를 사용자 질의에 더 정밀하게 맞추는 '재정렬(reranking)' 기능도 강화된다.
기존 알리바바 모델에 적용한 3단계 학습 구조를 그대로 따랐다. 첫번째 단계는 방대한 원시 데이터를 바탕으로 관련성에 따라 데이터를 구분하는 대비 학습(contrastive learning) 과정을 거치며, 두번째 단계에서는 정제된 고품질 데이터를 사용해 시스템의 판단 능력을 검증한다. 마지막으로 이 두 과정을 통합해 모델 전반의 성능을 극대화하는 식이다.
알리바바는 이번 큐원3 임베딩 시리즈를 “새로운 출발점”으로 규정하며 “더 많은 개발자가 다양한 활용 사례에 이 모델을 적용하길 기대한다”라고 밝혔다.
박찬 기자 cpark@aitimes.com
