엔비디아는 LG AI연구원의 대형언어모델(LLM) '엑사원 3.0(EXAONE 3.0)' 개발에 'H100' GPU와 '네모(NeMo)' 프레임워크를 활용했다고 24일 밝혔다.
엑사원 3.0은 네모 프레임워크 위에서 LG AI연구원의 기술로 개발, 학습한 결과물이다. '텐서RT-LLM(TensorRT-LLM)' SDK를 기반으로 효율적인 비용으로 모델을 배포할 수 있도록 지원한다.
네모는 생성 AI 모델을 구축, 맞춤화, 배포할 수 있는 엔드 투 엔드 프레임워크다.
텐서RT-LLM은 최신 LLM의 추론 성능을 가속화하고 최적화하는 오픈 소스 라이브러리다.
엑사원 3.0은 지난 8월에 발표된 LG AI연구원의 최신 AI 파운데이션 모델로, 한국어와 영어, 코딩 등 13개 벤치마크 점수 순위에서 1위를 차지하며 화제가 됐다. 특히, 메타의 '라마' 등 글로벌 동급 규모 오픈 소스 AI 모델에 비해 한국어와 영어 등에서 우수한 벤치마크 성능을 기록했다.
연구 목적으로 누구나 자유롭게 활용할 수 있다.
이어 엑사원 3.0을 바탕으로 개발된 엔터프라이즈 AI 에이전트인 '챗엑사원(ChatEXAONE)'도 공개했다. 또 LG유플러스는 엑사원 기반의 통신 및 플랫폼 데이터 특화 생성 AI '익시젠(ixi-GEN)'을 출시한 바 있다.
장세민 기자 semim99@aitimes.com
관련기사
