인공지능(AI) 전문 셀렉트스타(대표 김세엽)는 소속 연구진이 참여한 논문 3편이 자연어처리(NLP) 분야 글로벌 학회인 ‘EMNLP 2025’에 공식 등재됐다고 4일 밝혔다.
EMNLP는 국제언어학회(ACL) 산하의 세계 3대 NLP 학회 중 하나로, 매년 글로벌 빅테크 및 주요 연구 기관의 최신 AI 연구 성과를 심사한다. 올해는 8000여편 이상의 논문이 접수, 39.5%만이 최종 채택되는 등 높은 경쟁률을 기록했다고 전했다.
그중에서 셀렉트스타 소속 연구진 5인이 참여한 논문 3편이 통과했으며, 그 중 1편은 상위 22% 내의 메인 논문으로 채택됐다. 이로써 셀렉트스타는 2023년 ‘EMNLP’ 논문 2건 등재에 이어 총 5건의 논문 채택을 기록했다.
AI 시대의 핵심 과제인 데이터 편향 최소화, 추론 성능 고도화, 데이터 효율성 향상에 중점을 뒀다는 설명이다.
먼저, 메인 논문으로 선정된 ‘CoBA'는 대형언어모델(LLM)을 활용, 자동 텍스트 증강 기술을 제시했다. 학습 데이터 편향을 완화하고 소수 집단의 표현을 보완, 모델의 공정성과 성능을 동시에 개선했다고 소개했다.
‘GRADE’ 논문은 질문에 답하기 위해 여러 문서를 연속적으로 참조해야 하는 멀티홉 질의응답(Multi-Hop QA)과 난이도별 평가 프레임워크에 대한 내용이다. 검색 증강 생성(RAG) 시스템의 추론력, 검색 능력을 진단할 평가 기준을 마련한 것이 핵심이다.
‘CAC-CoT’ 논문은 기존 연쇄 추론(CoT) 방식의 비효율성을 해결하는 합성 데이터 생성 기법을 제안한 것이다. 적은 데이터와 자원으로도 고성능 고효율 추론데이터로 합성할 수 있는 방안이라고 설명했다.
한편, 이번 논문의 핵심 기술들은 ‘독자 AI 파운데이션 모델 구축’ 프로젝트의 고품질 데이터 생성 기반 기술로 활용할 계획이다. 연구진들은 이날부터 중국 쑤저우에서 열리는 EMNLP 2025에 참석, 논문별 포스터 세션을 열고 전 세계 연구자들과 교류할 예정이다.
김세엽 셀렉트스타 대표는 "EMNLP 등재는 셀렉트스타가 자체 개발한 AI 신뢰성 검증 기술력이 글로벌 학계로부터 인정 받았다는 점에서 의미가 크다”라며 "이번 연구 성과를 바탕으로 AI 신뢰성 검증 분야에서의 독보적인 기술 리더십을 강화하겠다”라고 말했다.
장세민 기자 semim99@aitimes.com
