생성 인공지능(AI) 전문 딥브레인AI(대표 장세영)가 딥러닝 기반 딥보이스 탐지 기술에 대한 특허를 출원했다고 5일 밝혔다.
특허는 ‘인공지능 기반 음성탐지 서버 및 방법’에 대한 기술이다. 딥러닝 기반 음성 추출 방식을 사용해 AI 딥보이스에 대한 탐지 성능을 극대화했다는 설명이다. 딥브레인AI는 해당 특허를 적용한 딥페이크 탐지 솔루션을 앞세워 보이스피싱 등 AI 악용 범죄 예방에 나설 예정이다.
기존에는 딥보이스 탐지에 '멜 주파수 켑스트럼(MFCC)' 기법을 주로 사용했다. MFCC는 음성 인식, 음향 분석 등 다양한 오디오를 분석하는 분야에서 널리 사용하고 있다. 다만 고주파 영역대 음성 정보를 상대적으로 적게 추출, 특정 영역대에 포진해 있는 위변조 흔적을 탐지하는 데 한계가 있었다.
이에 딥브레인AI는 특허 기술과 정보 추출 모델, 위변조 유무 판별 모델을 통합해 딥러닝 모델 탐지 성능을 개선했다고 전했다. 또 데이터 분석을 위한 전처리 과정부터 변조 유무 판별, 결과 값의 후처리까지 전담하는 하나의 서버 파이프라인으로 구성해 단순 탐지를 넘어 솔루션으로 활용 가능하도록 했다.
특히 다양한 데이터 셋을 활용해 모델의 객관적 탐지 성능을 정확도, ROC(receiver operating characteristic), EER(동일 오류율, Equal Error Rate) 등 구체적 지표로 제시해 측정한다. 딥보이스 서비스 코드에 입력되는 음성 파일의 변조 수치를 0과 100 사이의 확률 값으로 제시해 탐지 결과 신뢰도를 직관적으로 제공한다.
서버 코드는 최적화를 진행해 지연 없이 안정적으로 판별 값을 전달하도록 구성했다.
이번 특허 출원 기술은 서비스형 소프트웨어(SaaS) 딥페이크 탐지 솔루션에 적용해 활용 중이다. 음성의 주파수와 시간을 고려해 음성 합성 여부를 판별, AI를 이용해 자연스러운 목소리를 만드는 보코더 사용 여부를 판단한다. 향후에는 통화 중의 음성 진위 여부를 실시간으로 판별할 수 있도록 솔루션을 고도화할 계획이다.
장세영 딥브레인AI 대표는 “최근 공개한 SaaS형 딥페이크 탐지 솔루션이 높은 판별 정확도를 보일 수 있는 배경에는 딥러닝 기반 딥보이스 탐지 특허 기술이 존재한다”라며 “앞으로도 음성, 영상 AI 기술 고도화를 지속해 생성 AI를 악용한 무분별한 범죄를 저지하기 위해 앞장설 것”이라고 말했다.
장세민 기자 semim99@aitimes.com
