인공지능(AI) 교육 전문 엘리스그룹(대표 김재원)은 멀티모달 모델 ‘AI헬피 프로’를 공개했다고 18일 밝혔다.
기존 엘리스의 생성 AI 챗봇 ‘AI헬피’에 텍스트와 이미지 분석 모델 ‘헬피-V’를 탑재했다. 이를 통해 이미지 관련 질문을 받을 경우 답변을 설명하는 시각적 질의응답(VQA)이 가능하다.
원하는 이미지 생성 기능도 제공된다. 환각현상은 실시간 정보 검색 기능으로 크게 완화했다는 설명이다.
한국어와 문화를 읽고 분석하는데 탁월한 성능을 보인다고 전했다. 유명 한국인 사진을 보고 설명할 수 있는 것은 물론, 국악과 같은 전통 문화, 전통 음식 이미지를 이해하고 정확하게 설명할 수 있다.
한국어 VQA 작업 영역에 대해 진행한 CVQA 벤치마크에서도 빅테크를 포함한 오픈소스 AI 모델 중 최고의 성능을 기록했다.
엘리스그룹은 교육 사업을 진행하며 시각 정보 습득에 어려움을 겪는 학습자를 위해 VQA 기능이 필요하다고 느껴 개발에 나섰다고 전했다. 보편적 학습 설계(UDL)를 추구하는 AI헬피 프로는 4000곳 이상 기관 AI 교육에 활용 중인 엘리스LXP에 순차 적용될 예정이다.
국내 초∙중등 학습 교재 이미지에 대해 정확한 한국어 설명을 제공할 수 있으며, 과학 수업 중 실험 기구 상태를 화면으로 파악하고 질의응답을 진행할 수 있다. 산업 현장에서 영상이나 이미지로 위험을 감지하는 등 다양한 교육, 산업 영역에서 활용 범위를 넓혀갈 계획이다.
연구를 주도한 김수인 최고연구책임자와 권도현 AI 엔지니어는 “지난해 생성 AI 챗봇 ‘AI헬피’ 공개 두달 만에 15만건 이상 질의응답이 진행되며 학습자들에게 도움이 됐다는 사실이 매우 유의미했고, 교육에 가치를 더하는 AI 모델을 개발했다는 생각에 확신을 갖게 됐다”라며 “앞으로도 더 많은 이들이 활용할 수 있는 신뢰도 높은 교육 특화 AI 모델을 개발할 계획”이라고 말했다.
박수빈 기자 sbin08@aitimes.com
