출연연·공공기관·중소기업에 지원

(사진=KISTI)
(사진=KISTI)

한국과학기술정보연구원(KISTI, 원장 김재수)은 대형언어모델(LLM) '고니(KONI, KISTI Open Natural Intelligence) 13b'를 개발했다고 20일 밝혔다.

과학기술데이터에 특화되고, 출연연이나 공공기관에서 활용이 쉬운 모델이라는 설명이다.

특히 민감 정보나 보안 등의 문제를 중요시하는 출연연 및 공공기관이나 비용 문제로 도입을 망설이던 중소기업에 적합하다는 설명이다. KISTI는 보안이나 정보 유출에 안전하면서 기존 LLM의 환각 현상을 최소화하고 다양한 과학기술·산업 분야에 특화된 모델 개발이 쉬운 고니를 개발했다고 설명했다.

고니는 환각 현상을 최소화하기 위해 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 검색 증강 생성(RAG) 기술의 적용이 쉽도록 고안됐다. KISTI는 고니 모델의 보급을 통해 보안 및 정보 유출이 염려되거나, 비용이나 전산 자원 부족의 문제로 LLM 도입 및 활용을 주저했던 수요에 대응할 수 있다고 설명했다. 

특히 전산 비용이나 보안, 정보 유출 등을 이유로 LLM 도입이 어려웠던 출연연, 공공기관, 중소기업에 대한 LLM 지원을 할 예정이다. 또 모델 성능도 현재 130억개 매개변수 수준에서 크기를 늘리고, 학습 데이터도 추가 확보해 향상할 계획이다.

김재수 KISTI 원장은 “이번 고니 13b 개발을 통해 KISTI는 출연연, 공공기관, 중소기업을 포함해 다양한 과학기술·산업 분야의 LLM 수요에 대응하고, 외부 기관들과의 협력 체계 구축을 통해 지속적인 학습 데이터 확보 및 모델의 보급을 꾀하겠다"라며 "사용자 피드백을 반영해 고니 모델의 성능을 지속적으로 개선할 예정”이라고 말했다.

임대준 기자 ydj@aitimes.com

키워드 관련기사
  • 미디어젠, KISTI와 AI 기반 ‘신약 후보물질 정보 생성장치’ 공동 특허 등록