광주과학기술원(GIST, 총장 임기철)은 GIST연구팀이 10월23일부터 25일까지 일본 도쿄에서 진행된 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2024)’ 워크숍에서 심사위원상을 수상했다고 7일 밝혔다.
DCASE 챌린지 2024는 국제 음향 장면 및 이벤트 탐지 분류 경진대회로, 국제전기전자공학자협회(IEEE)의 신호처리 소사이어티(AASP)가 주관한 행사다.
전기전자컴퓨터공학부 오디오지능연구실(AiTeR, 김홍국 교수) 학생들로 구성된 ‘GIST오니온에이아이’팀은 김홍국 교수가 창업한 오니온에이아이(AunionAI)의 지원을 받아 ‘언어질의 기반 오디오 소스 분리 과제’ 부문에서 지난 7월 1위를 차지한 데 이어 심사위원 상을 받으며 성과를 인정받은 것이다.
심사위원상은 DCASE 2024 챌린지에 제출된 기술 리포트를 기반으로 평가하여 챌린지 순위와는 별개로 연구의 독창성과 우수성을 중심으로 검토해 과제별 한팀에만 수여된다.
‘언어질의 기반 오디오 소스 분리(LASS) 기술’은 사용자가 입력한 텍스트에 따라 이에 맞는 오디오 신호를 분리하는 기술이다. 언어와 오디오를 연결하는 생성 AI 모델 개발의 기초를 제공하며, 자동 오디오 편집·멀티미디어 콘텐츠 검색·증강 청취 등 다양한 응용 분야에서 활용될 수 있다.
연구팀은 ▲대형언어모델(LLM)기반 프롬프트 기술 및 데이터 증강 기술▲사전학습 훈련모델과 기존 모델의 추론 결과 융합 기술 ▲AI 능력 향상을 위한 앙상블 기술을 통해, 고성능 언어질의 기반 오디오 소스 분리 기술을 발표했다.
김홍국 교수는 "GIST 연구실과 오니온에이아이가 협업하여 개발한 AI 모델이 연구실에 머물지 않고 사업화 가능성을 제시했다는 점에서 의의가 크다”며 “특히, LLM 기반 오디오 생성 및 인식 AI 모델을 지속적으로 개선하는 노력과 함께 이를 다양한 분야에 적용해 보다 편리하고 안전한 삶을 위한 기술 발전에 기여하겠다”고 말했다.
한편, 해당연구는 MIT 국제 공동 연구 사업과 GIST 과학기술혁신사업단의 ‘실용화 연구개발사업’, 연구개발특구진흥재단의 ‘지역의 미래를 여는 과학기술 프로젝트’ 사업의 지원으로 수행되었다.
박수빈 기자 sbin08@aitimes.com
