[10월1주] 개편 이전 강자들 상위권 재진출...479개 모델 평가 완료

이 기사를 공유합니다

업스테이지(대표 김성훈)는 '오픈 Ko-LLM 리더보드'에서 479개 모델에 대한 평가를 완료했다고 30일 밝혔다.

이는 약 한달 전보다 357개 증가한 수치다. 특히 ▲Ko-GSM8K(초등수학) ▲Ko-EQ-Bench(감성) 영역에서 높은 점수 편차를 보이고 있다. 최근 수학과 코딩능력이 대형언어모델(LLM) 벤치마크의 트렌드로 자리 잡은 것을 고려하면 흥미로운 결과다.

현재 리더보드에는 이스트소프트의 'ai-human-lab/EEVE-Korean_Instruct-10.8B-expo' 모델이 1위에 올라 있다. 이 외에도 상위권에 모아데이타, 티쓰리큐, 인스웨이브 등이 진입해 있다.

이들은 개편 이전에도 10위권 내에 진출한 바 있는데, 국내 리더보드 시즌2에서도 업그레이드한 버전의 모델로 상위권에 올랐다.

업스테이지와 한국지능정보사회진흥원(NIA)이 공동 주최하는 리더보드의 상세 내용은 NIA 홈페이지나 허깅페이스 홈페이지에서 확인할 수 있다.

장세민 기자 semim99@aitimes.com