MP3보다 압축 효율을 10배 높인 새로운 오디오 압축 기술이 나왔다.
아스테크니카는 3일(현지시간) 메타가 음질 손실 없이 MP3보다 압축 효율을 10배 높여 64kbps 용량으로 오디오를 압축할 수 있는 ‘인코덱(EnCodec)’이라는 인공지능(AI) 기반의 새로운 오디오 압축 기술을 공개했다고 보도했다.
이 기술은 서비스가 불안정한 지역의 전화 통화와 같은 저대역폭 연결에서 음성 품질이나 인터넷에서 배포되는 음악 파일의 품질을 향상시킬 수 있다.
메타의 인코덱은 세부분으로 구성된다. 먼저 인코더(Encoder)는 압축되지 않은 데이터를 더 낮은 프레임 속도의 벡터 표현으로 변환한다.
그런 다음 양자화기(Vector Quantization)는 나중에 원래 신호를 복구하는 데 사용할 가장 중요한 정보를 추적하면서 벡터 표현을 특정 크기로 압축한다.
이후 디코더(Decoder)는 단일 CPU의 신경망을 사용해 압축된 데이터를 실시간으로 다시 오디오로 복구한다.
일반적으로 낮은 비트 전송률의 압축에서는 완벽한 복구가 불가능하다. 메타는 판별기(Discriminator)를 사용해 복구된 오디오에서 인간이 인식할 수 없는 변경 사항을 식별함으로써 복구된 오디오의 품질을 개선했다. 압축 모델은 판별기가 복구된 오디오와 원본 오디오를 구별할 수 없을 때까지 압축을 시도한다.
오디오 압축 및 압축 해제를 위해 신경망을 사용하는 것이 새로운 것은 아니다. 다만 메타는 이 기술을 48kHz 샘플링 속도의 스테레오 오디오에 최초로 적용했다고 주장한다.
메타는 이 AI 기반 오디오 초압축 방식이 나쁜 네트워크 조건에서 더 빠르고 더 나은 품질의 통화를 지원할 수 있다고 말한다. 현재는 연구 단계에 있지만 이 기술을 사용해 더 적은 대역폭을 사용할 수 있는 고품질의 아주 작은 음악 오디오 파일을 만들 수 있기 때문에 스트리밍 미디어에서 모바일 광대역 네트워크 공급자에게 좋은 소식이 될 것이다.
박찬 위원 cpark@aitimes.com
