(사진=코난테크놀로지)
(사진=코난테크놀로지)

국내 인공지능(AI) 전문 기업 코난테크놀로지가 다음달 자체 대형언어모델(LLM) 출시를 예고했다.

코난테크놀로지(대표 김영섬)는 19일 미디어 초청장을 발송하며 다음달 공개할 '코난 LLM'은 타사의 오픈소스 모델을 미세조정한 것이 아닌 자체 개발 모델이며, 매개변수가 131억개(13.1B)라고 밝혔다. 

17일 기준 전체 학습 토큰 4920억개, 한국어 토큰 2840억개로 학습을 마쳤다고 전했다. 이 모델은 미세조정을 거친 뒤 다음달 출시한다.

또 8월1일부터 데이터 학습을 시작해 10월 중 마무리할 '코난 LLM 파운데이션 모델'도 준비 중이라고 전했다. 이 모델의 경우 매개변수는 400억개(40B)로, 전체 토큰 6000억개, 한국어 토큰은 4000억개다. 

코난 LLM은 온프레미스(자체구축형)로 생성 AI의 문제점인 보안 문제를 해결한 것이 특징이라고 밝혔다. 또 기업이나 기관에 최적화한 지도학습 및 강화학습으로 문서 초안 생성과 요약, 질의, 응대 등에 뛰어난 성능을 보인다고 설명했다.

또 매개변수보다 실제 학습을 좌우하는 토큰 갯수에 집중, 모델의 사이즈를 지나치게 키우지 않으면서도 성능을 유지했다고 강조했다. 기업 수요에 맞춰 13.1B와 40B 모델 중 최적 사양을 선택할 수 있다고 덧붙였다.

특히 엔비디아의 최신 GPU H100 장비 12대를 확보, 국내에서 가장 먼저 지난달부터 순차적으로 입고 중이라고 밝혔다. 따라서 빠른 AI 모델 학습 속도로 기업의 AI 도입을 지원하게 됐다고 전했다.

(사진=코난태크놀로지)
(사진=코난태크놀로지)

코난테크놀로지는 생성 AI 시장에 대응하기 위해 지속적으로 개발 인력을 증원했고, 2007년부터 운영 중인 실시간 AI 분석 서비스 '펄스케이'를 통해 205억건 이상의 고품질의 한국어 데이터를 축적했다고 설명했다.

김영섬 코난테크놀로지 대표는 "자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화한 모델로 시장 요구에 부응하고, 온프레미스 형태로 보안을 강화시켜 생성 AI 생태계 구축을 이끌겠다”고 말했다. 

한편 이대로라면 국내의 초거대 AI 기업은 네이버(하이파클로바)와 카카오(코GPT), SKT(에이닷), KT(믿음), LG(엑사원) 등에 이어 6개로 늘어난다. 

코난 LLM의 구체적인 출시 일정은 추후 공개될 예정이다.

이주영 기자 juyoung09@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지