'진짜' 오픈 소스 LLM '올모' 업데이트..."데이터셋·학습 강화로 성능 올려"

박찬 기자
입력 2024.04.19 18:00
댓글 0

이 기사를 공유합니다

앨런AI연구소(AI2)가 데이터 수집부터 학습, 배포까지 전 과정을 투명하게 공개한 오픈 소스 대형언어모델(LLM) ‘올모(OLMo)’를 업데이트했다.

벤처비트는 17일(현지시간) 비영리 민간 AI 연구기관인 AI2가 지난 2월 출시한 70억 매개변수의 오픈 소스 LLM ‘올모 1.7-7B’에 대한 업데이트를 공개했다고 보도했다.

이에 따르면 올모는 모델 코드와 가중치뿐만 아니라 훈련 코드, 훈련 데이터, 관련 툴킷 및 평가 툴킷까지 무료로 제공한다. 이 때문에 ‘진정한 오픈 소스’ 모델로 통한다.

업데이트된 올모 1.7-7B는 훈련 절차와 아키텍처 개선으로 최대 2048~4096개 토큰의 더 긴 컨텍스트 길이와 더 나은 성능을 지원한다.

여기에 2조3000억개의 토큰 규모의 새로운 데이터셋 ‘돌마 1.7(Dolma 1.7)를 구축해 학습을 강화했다. 돌마 1.7 데이터셋에는 돌마 CC, 리파인드 웹, 스타코더, C4, 스택 익스체인지, 오픈웹매쓰, 프로젝트 쿠텐버그, 위키피디아 등 광범위한 소스의 데이터를 포함한다.