세계적 권위의 NLP 학회에 연이어 논문 올려
NAACL·EMNLP서 새로운 AI 학습 방법 제시
더 효율적이고 다양한 곳에 접목 가능한 방법
"지속적인 R&D로 교육산업 지형 바꿔 갈 것"

뤼이드가 세계적 권위의 NLP 학회에 연이어 논문을 올렸다고 밝혔다. 이번 연구 성과는 뤼이드가 '산타' 외 다른 교육 사업을 전개하는 발판이 될 것으로 전망된다. (사진=셔터스톡, 편집=김동원 기자) 

인공지능(AI) 기반 토익 교육 플랫폼 '산타(구 산타토익)' 공급사인 뤼이드가 토익의 틀을 벗어나 전체 교육 시장을 향해 닻을 올렸다. 뤼이드는 16일 세계적 권위의 자연어처리(NLP) 학회에 연이어 논문을 올렸다고 밝혔다. 현재 서비스 중인 산타 외에 다양한 교육 분야에 AI 기술을 적용할 수 있는 연구 성과다. 장영준 뤼이드 대표는 연구 성과를 발표하며 "교육산업의 지형을 바꾸겠다"는 포부를 밝혔다.

뤼이드가 NLP 관련 연구 성과를 발표한 학회는 '전산언어학 학회(ACL) 2022'와 '북미전산언어학 학회(NAACL) 2022'다. 자연어처리방법론 학회(EMNLP)와 함께 세계 3대 NLP 학회로 꼽히는 곳이다. 회사는 이번 학회에서 AI 교육에 사용될 수 있는 새로운 학습 방법을 공개할 예정이다. ACL은 5월 22일부터 27일(아일랜드 더블린), NAACL은 7월 10일부터 15일(미국 시애틀 및 워싱턴)에 각각 온라인과 오프라인을 병행해 열린다.

뤼이드가 ACL에 발표할 논문은 초거대 언어모델을 이용해 챗봇 등의 대화형 시스템을 학습시키는 새로운 방법론(논문명: Dialogue Summaries as Dialogue States (DS2), Template-Guided Summarization for Few-shot Dialogue State Tracking)이다. 기존보다 훨씬 적은 데이터만으로 AI를 훈련 시킬 수 있는 모델이다.

뤼이드는 ACL 학회에 초거대 언어모델을 이용해 챗봇 등의 대화형 시스템을 학습시키는 새로운 방법론(논문명: Dialogue Summaries as Dialogue States (DS2), Template-Guided Summarization for Few-shot Dialogue State Tracking)에 관한 논문을 올렸다. (사진=뤼이드)
뤼이드는 ACL 학회에 초거대 언어모델을 이용해 챗봇 등의 대화형 시스템을 학습시키는 새로운 방법론(논문명: Dialogue Summaries as Dialogue States (DS2), Template-Guided Summarization for Few-shot Dialogue State Tracking)에 관한 논문을 올렸다. (사진=뤼이드)

일반적으로 개별 도메인에서 챗봇을 도입하려면 막대한 양의 데이터와 비용이 소요됐다. 뤼이드가 개발한 방법은 이 한계를 극복했다. 기존의 1%에 해당하는 적은 데이터만으로 기존 방식을 능가하는 대화 상태 추적 성능을 기록했다. 데이터양이 적으므로 그만큼 적은 시간과 비용으로 AI 모델을 개발할 수 있다. 뤼이드 측은 "이번 연구를 통해 추후 학습자와 쌍방향으로 대화할 수 있는 AI 튜터 개발의 기술적 기반을 마련했다"고 밝혔다.

NACCL에서 발표될 또 다른 논문에서는 콘텐츠 기반 지식 추적 모델(Knowledge Tracing)을 효율적으로 훈련시킬 수 있는 새로운 알고리즘(논문명: GRAM: Fast Fine-tuning of Pre-trained Language Models for Content-based Collaborative Filtering)을 제안했다. 

뤼이드는 NACCL에서 콘텐츠 기반 지식 추적 모델(Knowledge Tracing)을 효율적으로 훈련시킬 수 있는 새로운 알고리즘을 제안했다. (사진=뤼이드)
뤼이드는 NACCL에서 콘텐츠 기반 지식 추적 모델(Knowledge Tracing)을 효율적으로 훈련시킬 수 있는 새로운 알고리즘을 제안했다. (사진=뤼이드)

이 알고리즘은 교육 플랫폼을 사용하는 이용자의 정답과 오답을 예측하는 AI 모델을 만드는데 사용할 수 있다. 지금까지 사용자의 정답과 오답을 예측하는 KT 모델에 콘텐츠를 활용하려는 시도는 있었지만 지나치게 많은 연산량과 막대한 시간 소요로 실제 솔루션에 적용하는 데 한계가 있었다. 

뤼이드가 개발한 이번 모델은 특정 도메인에서 기존보다 150분의 1까지 훈련 시간을 단축할 수 있는 것으로 나타났다. 또 사용자의 풀이 기록이 전혀 없는 신규 문제들에도 적용할 수 있는 성능을 냈다. 기존 모델보다 정·오답 예측 정확도(AUC)를 약 40% 향상했다.

뤼이드는 논문에서 제안한 콘텐츠 기반 KT 모델을 바탕으로 5월 중 산타 플랫폼에서 A/B 테스팅을 통해 유저 데이터를 다각도로 검증한 후 산타 제품에 바로 적용할 예정이다. 뤼이드 측은 "매월 산타 플랫폼에 새로운 문제가 추가되고 있는 만큼 사용자에게 보다 정교하고 개인화된 추천을 통해 더욱 강력한 학습 경험을 제공할 수 있을 것으로 기대된다"고 밝혔다.

또 이번 연구 성과는 토익 외에도 대학입학시험(SAT), 토플(TOFEL), 지텔프(G-TELP) 등의 시험에도 적용할 수 있는 것으로 나타났다. 이번 콘텐츠 기반 KT 모델 연구를 주도한 뤼이드 양윤석 연구원은 "(이번 연구 성과는) 뤼이드가 기존에 제공하고 있는 산타 등의 AI 튜터 서비스를 고도화하는 것을 넘어 다른 도메인에서도 적용할 수 있다는 점에서 큰 의의가 있다"며 "실제로 다른 도메인에서도 높은 정확도로 정·오답을 예측했다"고 말했다.

뤼이드는 해당 연구 성과를 발표하며 토익 외 사업 진출 가속화에 대한 의지도 내비쳤다. 실제로 뤼이드는 매출 다각화를 위해 토익과 같은 B2C(기업과 소비자간 거래) 교육 플랫폼 외에 B2B(기업과 기업간 거래) 플랫폼 등 다양한 교육 서비스를 준비하고 있는 것으로 알려졌다.

박준영 뤼이드 AI 리서치 리드는 "이번에 발표한 뤼이드의 연구 성과는 단순히 학문적 연구의 결과로만 그치는 것이 아니라 기존 서비스를 제한했던 AI의 한계를 돌파하고 활용 가능성을 확장했다는 점에서 의미가 있다"며 "한층 진화된 AI 솔루션을 통해 학습자에게 보다 가치 있는 학습 경험을 제공할 수 있을 것으로 기대한다"고 밝혔다.

장영준 뤼이드 대표는 "교육의 현실적인 문제를 풀기 위해 기술이 무엇을 도울 수 있을지를 고민하고 새롭게 문제를 정의하며 최적의 해결책을 찾는 것이 뤼이드 연구의 궁극적인 목표"라며 "적극적인 연구개발(R&D) 투자와 지원을 통해 연구 분야를 지속적으로 확대하며 실제 교육 효과 향상에 가장 도움을 줄 수 있는 방향으로 교육산업의 지형을 바꿔 나가겠다"고 강조했다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사]뤼이드, 일본 파트너사 인수해 현지 법인 설립...일본 진출 본격화

[관련기사]뤼이드, 세계 최고 에듀테크 컨퍼런스 ‘ASU+GSV 서밋’ 참여

키워드 관련기사
  • [설날 AI로 이렇게 바뀐다] ④"어느 학원 다녀요?" 질문 "어느 AI 써요?"로 바뀌었다
  • "전문가 수준의 영어 문제, AI가 5초 만에 제작"...이형종 렉스퍼 대표 인터뷰
  • 인공지능(AI)으로 영어교육이 확 달라지고 있다