'인공지능(AI) 디지털 휴먼'으로 잘 알려진 이스트소프트가 한국어 대형언어모델(LLM) 연구에서 성과를 내고 있다.
이스트소프트(대표 정상원)는 대화형 AI 기반 서비스의 실용성을 극대화하기 위해 한국어 특화 LLM R&D에 집중하고 있다고 27일 밝혔다.
이스트소프트는 미세조정 역량을 기반으로 AI 효율을 극대화하는 서비스를 개발하고 서비스해 왔다. 특히 AI 디지털 휴먼 기반의 대화형 키오스크와 영상 편집 및 제작 도구 ‘AI 스튜디오 페르소’ 등으로 주목받았다.
더불어 한국어 LLM 연구에도 집중해 왔다. 그 결과 대표적인 한국어 언어모델 벤치마크 ‘오픈 Ko-LLM 리더보드’ 상위권을 차지했다.
현재 리더보드는 대규모 개편 중이라 며칠마다 경쟁 모델이 수십, 수백개 업로드되는 상황이지만, 3주 넘게 상위권을 지키고 있다. 28일 기준 'ai-human-lab/EEVE-Korean_Instruct-10.8B-expo' 모델은 전체 3위다.
이스트소프트 AI 휴먼 랩 연구원은 “대화형 서비스를 운영하다 보니 한국어 언어모델 고도화의 필요성을 느끼게 됐다”라며 “이제까지 실행한 한국어 데이터셋 및 미세조정 노하우를 바탕으로 모델 훈련 역량을 고도화하고 있다”라고 말했다.
특히 이스트소프트의 서비스를 사용 중인 기업에 한국어 기술을 적용하면 상당한 효과가 나타날 것으로 기대하고 있다. 이 회사의 AI 디지털 휴먼 서비스는 은행이나 공항 등 공공시설에서 수요가 많이 발생하고 있다. 이런 경우 API 형태로 모델을 사용하기 어렵기 때문에 폐쇄망 환경에 적용 가능한 한국어 모델이 필수적이라는 설명이다.
이스트소프트만의 한국어 특화 LLM을 완성, 실시간 대화형 AI 휴먼 서비스 ‘페르소닷에이아이(perso.ai)’의 AI 라이브 챗에 탑재하는 것을 목표다. 라이브 챗은 디지털 휴먼과의 실시간 대화를 지원한다.
페르소닷에이아이 외에도 대화형 서비스 ‘앨런(Alan)’ 등 주요 비즈니스에도 기술을 적용하고 있다. 앨런의 경우 ‘실시간 검색’ ‘GPT-4o’ ‘유튜브 요약’ 등 3종 특화 기능을 제공하고 있다.
AI 휴먼 랩 연구원은 “고품질의 AI 휴먼 영상 콘텐츠를 생성하기 위해서는 최대한 가볍고 확장성이 큰 모델이 적절하다”라며“AI 휴먼 서비스는 STV(음성 비디오 전환), TTS(텍스트 음성 변환), LLM 등 AI 기술이 복합적으로 작동하는 종합 예술과 같기 때문에 모든 기능을 딜레이 없이 동시에 실현하기 위해서는 필수적인 과정”이라고 말했다.
한편, 이스트소프트는 AI 생성 콘텐츠의 윤리적 활용에도 앞장서고 있다고 강조했다. 최근에는 ‘어도비 콘텐츠 진위 이니셔티브’에 합류, AI로 생성한 콘텐츠의 윤리적 활용을 위해 노력하고 있다. 국내에서는 정보통신정책연구원(KISDI)과 AI 휴먼 서비스의 올바른 활용을 위한 자율점검표 구축을 진행 중이다.
장세민 기자 semim99@aitimes.com
