판교 R&D 센터 사옥 전경 (사진=NC)
판교 R&D 센터 사옥 전경 (사진=NC)

엔씨소프트(대표 김택진, 박병무)는 인공지능(AI) 분야 국제 학술대회 ‘ICASSP 2024’에 멀티모달 관련 논문을 게재했다고 18일 밝혔다.

ICASSP는 매년 전 세계 각국에서 개최하는 국제학술대회다. 올해는 49회를 맞이해 14~19일까지 서울 코엑스에서 진행 중이다. 행사에는 전 세계 과학자 4000여명이 참석, 신호처리 기술을 비롯한 각종 멀티모달 생성 AI 기술을 발표한다.

엔씨는 이번 ICASSP 2024에 ▲멀티모달 언어모델의 시각적 환각 현상 완화 ▲열악한 환경 속 얼굴 인식 정확성 개선 ▲사용자 음성을 깨끗하게 걸러내는 호출어 인식 모델 ▲얼굴 이미지에 맞는 가상 음성 생성 시스템 등 총 4편의 논문을 게재했다.

이 논문들은 실질적 활용을 위한 AI 응용 기술은 물론 텍스트, 이미지, 비디오, 음성 등 다양한 데이터를 이해하고 학습하는 멀티모달 언어모델 기술의 활용 가능성을 다루고 있다는 점에서 의미가 있다고 소개했다.  

관계자는 "이번 연구 결과를 기반으로 텍스트, 이미지, 오디오 등 다양한 분야에서 멀티모달 데이터를 이해하는 AI 기술을 발전시켜 게임 개발에 활용할 계획"이라고 말했다.

한편 게재 논문 4편에 대한 자세한 내용은 엔씨 공식 블로그를 통해 확인할 수 있다. 

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지