메타의 새로운 오디오 코덱은 MP3보다 10배 작게 오디오를 압축할 수 있다.(사진=메타)
메타의 새로운 오디오 코덱은 MP3보다 10배 작게 오디오를 압축할 수 있다.(사진=메타)

MP3보다 압축 효율을 10배 높인 새로운 오디오 압축 기술이 나왔다.

아스테크니카는 3일(현지시간) 메타가 음질 손실 없이 MP3보다 압축 효율을 10배 높여 64kbps 용량으로 오디오를 압축할 수 있는 ‘인코덱(EnCodec)’이라는 인공지능(AI) 기반의 새로운 오디오 압축 기술을 공개했다고 보도했다. 

이 기술은 서비스가 불안정한 지역의 전화 통화와 같은 저대역폭 연결에서 음성 품질이나 인터넷에서 배포되는 음악 파일의 품질을 향상시킬 수 있다.

MP3 압축(상)과 메타 인코덱 압축(하) 비교 (사진=메타)
MP3 압축(상)과 메타 인코덱 압축(하) 비교 (사진=메타)

메타의 인코덱은 세부분으로 구성된다. 먼저 인코더(Encoder)는 압축되지 않은 데이터를 더 낮은 프레임 속도의 벡터 표현으로 변환한다.

그런 다음 양자화기(Vector Quantization)는 나중에 원래 신호를 복구하는 데 사용할 가장 중요한 정보를 추적하면서 벡터 표현을 특정 크기로 압축한다.

이후 디코더(Decoder)는 단일 CPU의 신경망을 사용해 압축된 데이터를 실시간으로 다시 오디오로 복구한다.

메타의 인코덱 압축 모델 (사진=메타)
메타의 인코덱 압축 모델 (사진=메타)

일반적으로 낮은 비트 전송률의 압축에서는 완벽한 복구가 불가능하다. 메타는 판별기(Discriminator)를 사용해 복구된 오디오에서 인간이 인식할 수 없는 변경 사항을 식별함으로써 복구된 오디오의 품질을 개선했다. 압축 모델은 판별기가 복구된 오디오와  원본 오디오를 구별할 수 없을 때까지 압축을 시도한다.   

오디오 압축 및 압축 해제를 위해 신경망을 사용하는 것이 새로운 것은 아니다. 다만 메타는 이 기술을 48kHz 샘플링 속도의 스테레오 오디오에 최초로 적용했다고  주장한다. 

메타는 이 AI 기반 오디오 초압축 방식이 나쁜 네트워크 조건에서 더 빠르고 더 나은 품질의 통화를 지원할 수 있다고 말한다. 현재는 연구 단계에 있지만 이 기술을 사용해 더 적은 대역폭을 사용할 수 있는 고품질의 아주 작은 음악 오디오 파일을 만들 수 있기 때문에 스트리밍 미디어에서 모바일 광대역 네트워크 공급자에게 좋은 소식이 될 것이다.

박찬 위원 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지