NC AI '바르코 비전 2.0 1.7B' 벤치마크 비교 표 (사진=NC AI)
NC AI '바르코 비전 2.0 1.7B' 벤치마크 비교 표 (사진=NC AI)

NC AI가 초경량 멀티모달 비전언어모델(VLM)을 공개했다.

NC AI(대표 이연수)는 온디바이스 환경에서 구동 가능한 초경량 멀티모달 인공지능(AI) 모델 ‘바르코 비전 2.0 1.7B(VARCO VISION 2.0 1.7B)’을 오픈 소스로 30일 공개했다.

바르코 비전 2.0은 이미지와 텍스트를 동시 이해해 질문에 답할 수 있는 차세대 AI 모델이다.

여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있다. 특히, 1.7B(17억) 매개변수의 작은 크기에도 불구하고, 기존 경량 모델을 뛰어넘는 수준의 성능을 보인다고 강조햤다.

기존 멀티모달 AI는 대부분 클라우드 환경에서만 활용 가능했지만, 1.7B 규모의 경량 모델은 휴대폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다.

텍스트 처리, 한국어 성능 등에서 글로벌 오픈 소스 모델인 인턴VLS(InternVL3) 2B, 오비수2(Ovis2) 2B 등을 압도하며 동급 최고 성능을 입증했다고 전했다.

영문 텍스트 처리 ‘MT-벤치’와 한국어 ‘K-시드(SEED)’, ‘K-LLaVA벤치’는 물론 광학문자 판독 ‘CORD’, ‘ICDAR’ 등 벤치마크에서 글로벌 모델의 성능을 뛰어넘었다는 설명이다.

NC AI '바르코 비전 2.0 1.7B 벤치마크 비교 표 (사진=NC AI)
NC AI '바르코 비전 2.0 1.7B 벤치마크 비교 표 (사진=NC AI)

대학 수준의 지식을 검증하는 ‘MMMU’ 벤치마크와 과학 차트 이미지 해석 능력을 평가하는 ‘AI2D 벤치마크’에서는 카카오의 '카나나 3B', 네이버의 '하이퍼클로바' 3B 등 3B급 멀티모달 모델들과 동등하거나 더 뛰어난 성능을 보였다고 설명했다.

시각적 맥락에서의 수학적 추론 능력을 평가하는 ‘매스비스타(MathVista)’ 벤치마크와 멀티모달 AI의 종합적인 시각언어 기능을 평가하는 ‘MM-Vet’에서도 2위를 기록했다.

한편, 바르코 비전 2.0 1.7B 모델은 16일 공개된 중형 모델 '바르코 비전 2.0 14B'에 이은 후속 모델이다. 14B 모델은 공개 후 열흘 만에 1만회 가까운 다운로드를 기록하며 국내외 개발자들의 높은 관심을 끌었다.

NC AI ‘바르코 비전 2.0 1.7B’ 벤치마크 비교 표 (사진=NC AI)
NC AI ‘바르코 비전 2.0 1.7B’ 벤치마크 비교 표 (사진=NC AI)

이연수 NC AI 대표는 "경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것"이라며 "앞으로도 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다"라고 말했다.

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지