(사진=NC)
(사진=NC)

엔씨소프트(NC, 대표 김택진, 박병무)가 지난 4월26일 깃허브와 아마존웹서비스(AWS) 마켓플레이스 등에 '바르코(VARCO) LLM' 버전 2.0을 공개한 것으로 알려졌다.

NC 관계자는 "따로 출시 소식을 알리지는 않았다"라며 "별도의 의도가 있는 것은 아니다"라고 28일 밝혔다. 

NC는 지난해 8월 바르코 LLM 버전 1.0을 첫 공개한 바 있다. 당시 매개변수 13B와 6.4B, 1.4B 등 총 8가지 모델을 선보였다. 

(사진=NC)
(사진=NC)

이번에 공개한 2.0 버전은 네가지다. ▲바르코 LLM 2.0 스몰(small) ▲바르코 LLM 2.0 베이스(base) ▲바르코 LLM 스몰-인스트럭트(instruct) ▲바르코 LLM 베이스-인스트럭트 등으로 구성됐다. 공통적으로 영어, 중국어, 일본어를 구사할 수 있다. 

특히 버전 1.0보다 4.5배 많은 대규모의 학습 데이터를 이용, 실제 사용성 향상에 초점을 맞췄다는 설명이다.

컨텍스트 길이도 2k에서 4k로 두배 확장했다. 사전학습, 미세조정, 휴먼피드백 기반의 정렬조정(RLHF) 등에 자체 기술을 투입했다.

(사진=NC)
(사진=NC)

모델별 특성도 뚜렷하다. 파운데이션 모델인 바르코 LLM 2.0은 높은 성능을 요구하는 고품질 AI 서비스 개발에 적합하다. 속도와 성능이 적절히 조화를 이루는 모델로, 대부분 AI 서비스에 주력으로 사용할 수 있다는 설명이다. 특히 Q&A, 챗봇, 요악, 정보 추출 등 다양한 AI 서비스 개발에 활용할 수 있다고 강조했다.  

바르코 LLM 2.0 인스트럭트(IST)는 '사용자가 입력하는 프롬프트'를 잘 수행하는 데 초점을 맞췄다. NC가 자체 구축한 오르카(Orca) 스타일의 고품질 IST 데이터셋으로 학습을 진행했다. 인스트럭트 버전은 두명 이상이 대화에 참가하는 '멀티턴(multi-turn)'도 가능하다. 

규모별 차이도 있다. 스몰 버전보다 베이스 버전에서 더욱 복잡한 태스크 처리가 가능하다. 

(사진=NC)
(사진=NC)

MT-벤치와 로직Kor(LogicKor) 벤치마크 결과를 공개하기도 했다. 벤치마크에는 모두 인스트럭트 모델을 사용했다.

먼저 MT-벤치에서는 비슷한 크기의 글로벌 언어모델은 물론, 'GPT-3.5 터보'와도 큰 차이를 보이지 않는다고 강조했다.

로직Kor 벤치마크에서도 마찬가지다. 추론, 이해뿐만 아니라 이메일, 광고기획, 스토리 생성에서도 강점을 보였다는 설명이다.

(사진=NC)
(사진=NC)

NC는 이후 6월 '바르코 LLM 2.0-다이얼로그(dialog)', 7월에는 '바르코 LLM 2.0-스토리(Story)' 공개를 앞두고 있다.

다이얼로그는 바르코 LLM 2.0 인스트럭트를 기반으로 학습한 서비스용 언어모델이다. 특히 휴먼 피드백 반영 기술에 중점을 뒀다. 사용자 요구 사항에 따라 페르소나, 감정, 의도 등을 주입해 대화 흐름을 제어할 수 있다.

스토리 버전 역시 인스트럭트 모델을 기반으로 휴먼피드백을 적용, 문서 생성에 특화한 모델이다. 사용자가 입력한 지시에 따라 상황이나 세계관을 반영해 다양한 스토리를 작성하거나 캐릭터를 생성하는 등 게임 퀘스트 기획과 브레인스토밍에 활용할 수 있다. 

한편 이번에 공개한 바르코 모델은 AWS 플랫폼 내에서 세이지메이커를 이용해 맞춤형 제작이 가능하다. 각 회사가 보유한 고유 데이터를 미세조정에 이용할 수 있다.

NC 관계자는 "앞으로도 지속적인 모델 업데이트를 지원, 특정 직업에 맞게 조정한 LLM도 출시할 계획"이라고 밝혔다.

또 "국내외 협력사와 함께 바르코를 고도화, 앞으로 선보일 게임 제작에도 적극적으로 도입할 방침"라고 말했다. 

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지