제논이 한국어 기반의 AI모델 ‘훈민’ 시리즈를 공개했다.(사진=제논)
제논이 한국어 기반의 AI모델 ‘훈민’ 시리즈를 공개했다.(사진=제논)

생성 인공지능(AI) 전문 제논(대표 고석태)이 매개변수 32B(320억개) 사이즈의 대형언어모델(LLM)과 이미지-텍스트 멀티모달 모델(VLM) 2종을 공개했다.

제논은 언어모델 ‘훈민-32B v0.1’은 10일, 멀티모달 모델 ‘훈민VL-32B v0.1’는 24일 허깅페이스에 개발자 프리뷰(알파) 형태로 출시했다고 밝혔다.

두 모델은 '큐원2.5'를 기반으로 한 한국어 전용 모델이다. 별도 학습 없이 중국어, 일본어, 러시아어에 토큰을 마스킹해 언어혼동(Language Confusion)을 억제하고 한국어 생성 능력을 보존하는 것을 목표로 개발됐다. 

제논은 모델뿐 아니라 학습 데이터, 정제·라벨링·합성 파이프라인, 코드 및 학습 레시피 전반을 공개했다.

관계자는 "허깅페이스에 공개한 후 개발자들의 피드백을 활용해 모델을 업데이트할 예정"이라며 "이번 모델은 향후 출시될 컴퓨터 유즈(Computer Use) 기반의 실행가능한 AI를 개발하기 위한 단계"라고 밝혔다.

컴퓨터 유즈는 사람이 실제 소프트웨어를 조작하듯, AI가 화면을 보고 버튼을 클릭하고 문서를 읽고 판단을 내리는 방식의 자동화 기술이다. 로봇프로세스 자동화(RPA)와 달리, 컴퓨터 화면의 시각적 정보를 분석하고 자연어 명령을 수행할 수 있다. 이는 비정형 데이터, 사용자들의 인터페이스 차이에도 유연하게 작업을 수행할 수 있다는 장점이 있다.

명대우 제논파트너(CTO)는 “이번 훈민 시리즈 공개는 컴퓨터 유즈 기술을 기반으로 한 실행가능한 AI를 실제 산업 환경에서 작동 가능한 형태로 발전시키기 위한 중요한 전환점”이라며 “추후 개인 식별 정보(PII) 마스킹, 안전제어용 가드레일 모델과 정책 룰셋 등 AI 활용의 신뢰성과 안전성을 확보하기 위한 기술 요소들도 함께 공개하며, 실제 현장 적용에 필요한 기술적 기반을 체계적으로 확장할 계획”이라고 말했다.

박수빈 기자 sbin08@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지