체스, 바둑 등의 게임을 위한 AI 알고리즘을 비디오 압축 개선에 사용
강화학습 알고리즘을 적용해 비디오 프레임당 비트 전송률을 제어
코덱에서 처리하는 기본 속도 제어 메커니즘을 AI 알고리즘으로 대체
스트리밍에 필요한 데이터 양이 동영상 품질 저하없이 최대 4.7% 감소

알파고(AlphaGo)의 후속 제품인 뮤제로(MuZero)는 보다 효율적인 비디오 압축 방법을 만드는 데 사용되고 있다. (사진=딥마인드)
알파고(AlphaGo)의 후속 제품인 뮤제로(MuZero)는 보다 효율적인 비디오 압축 방법을 만드는 데 사용되고 있다. (사진=딥마인드)

유튜브(YouTube)가 인공지능(AI) 알고리즘을 이용해 비디오 압축 성능을 크게 개선했다. 체스와 바둑과 같은 보드 게임을 정복하기 위해 개발된 AI 알고리즘을 유튜브 동영상에 적용했다. 유튜브는 동영상의 품질 저하없이 스트리밍에 필요한 데이터 양이 감소했다고 밝혔다.

15일(현지시간) 포춘(Fortune)에 따르면 유튜브가 알파벳(Alphabet) 내의 자매회사인 딥마인드(DeepMind)가 개발한 AI 알고리즘 ‘뮤제로(MuZero)’를 비디오 압축 개선을 위해 사용하기 시작했다. 이 시스템을 유튜브 동영상에 적용하고 나서 동영상 공유 서비스가 사용자에게 스트리밍하는 데 필요한 데이터 양이 동영상 품질의 저하없이 최대 4.7% 감소했다. 뮤제로는 2016년 바둑 게임에서 인간을 이긴 최초의 AI인 알파고(Alphago)의 후속 제품이다.

유튜브 규모를 고려할 때 4.7%의 수치는 전문가들 사이에서도 컴퓨팅 전력과 대역폭을 크게 줄인 것이라는 평가를 받고 있다. 광대역 통신 환경이 열악한 국가에서 비디오 콘텐츠를 시청하는 데 도움이 될 전망이다. 이미 비디오 스트리밍은 전 세계 인터넷 용량의 상당 부분을 차지하고 있다. 이 수치는 앞으로 더 증가할 것으로 예상된다.

대부분의 온라인 비디오는 코덱이라는 프로그램에 의존해 소스에서 비디오를 압축하거나 인코딩하고 인터넷을 통해 시청자에게 전송한 다음 재생을 위해 압축을 풀거나 디코딩한다. 뮤제로는 유튜브에서 이용하고 있는 VP9 코덱의 비디오 압축 방법을 개선하는데 초점을 맞췄다.

뮤제로는 시행착오를 통해 완전히 학습하는 강화 학습(RL, Reinforcement Learning) 알고리즘을 기반으로 한다. 강화 학습에서 소프트웨어는 달성하고자 하는 목표가 주어지고 소프트웨어의 결정이 목표 달성에 더 가까워지고 있는지 여부에 대한 피드백을 받는다. 

다른 코덱과 마찬가지로 VP9를 사용하는 서비스 제공업체는 비디오의 각 프레임을 전송하는 데 필요한 1과 0의 수인 비트 전송률을 고려해야 한다. 비트 전송률은 비디오를 제공하고 저장하는 데 필요한 컴퓨팅 및 대역폭의 양을 결정하는 주요 결정 요인으로, 비디오를 로드하는 데 걸리는 시간부터 해상도, 버퍼링 및 데이터 사용량에 이르기까지 모든 것에 영향을 미친다.

비디오를 인코딩하는 동안 코덱은 이전 프레임의 정보를 사용하여 향후 프레임에 필요한 비트 수를 줄인다.(사진=딥마인드)
비디오를 인코딩하는 동안 코덱은 이전 프레임의 정보를 사용하여 향후 프레임에 필요한 비트 수를 줄인다.(사진=딥마인드)

VP9에서 비트 전송률은 전송률 제어 모듈의 양자화 매개변수(QP, Quantisation Parameters)를 통해 가장 직접적으로 최적화된다. 각 프레임에 대해 이 매개변수는 적용할 압축 수준을 결정한다. 목표 비트 전송률이 주어지면 비디오 프레임의 QP는 전체 비디오 품질을 최대화하기 위해 순차적으로 결정된다.

직관적으로 복잡한 장면에는 더 높은 비트 전송률(낮은 QP)을 할당하고 정적 장면에는 더 낮은 비트 전송률(높은 QP)을 할당해야 한다. QP 선택 알고리즘은 비디오 프레임의 QP 값이 나머지 비디오 프레임의 비트 전송률 할당과 전체 비디오 품질에 어떻게 영향을 미치는지 추론한다. RL은 이러한 순차적 의사 결정 문제를 해결하는 데 특히 유용하다.

VP9에서 처리하는 비디오의 각 프레임에 대해 MuZero-RC(Rate Controller)는 VP9의 기본 속도 제어 메커니즘을 대체하여 적용할 압축 수준을 결정하여 더 낮은 비트 전송률에서 유사한 품질을 달성한다.(사진=딥마인드)
VP9에서 처리하는 비디오의 각 프레임에 대해 MuZero-RC(Rate Controller)는 VP9의 기본 속도 제어 메커니즘을 대체하여 적용할 압축 수준을 결정하여 더 낮은 비트 전송률에서 유사한 품질을 달성한다.(사진=딥마인드)

뮤제로는 검색 능력과 환경 모델을 학습하고 그에 따라 계획하는 능력을 결합하여 다양한 작업에서 인간을 능가하는 성능을 달성한다. 이것은 비디오 압축을 위한 비트 전송률 제어 에 대한 이상적인 솔루션이 된다.

그러나 뮤제로가 실제 응용 프로그램에서 작동하도록 하려면 완전히 새로운 일련의 문제를 해결해야 한다. 예를 들어 유튜브와 같은 플랫폼에 업로드되는 비디오는 콘텐츠와 품질이 다양하기 때문에 모든 에이전트는 새로운 비디오가 배포되면 비디오 전반에 걸쳐 일반화해야 할 필요성이 있다. 그에 비해 보드 게임들은 알려진 단일 환경인 경향이 있다. 

이를 게임과 같은 환경으로 바꾸기 위해 일련의 복잡한 비디오 품질 및 비트 전송률 메트릭을 단일 결합 점수로 변환한 다음 뮤제로가 동일한 비디오를 압축하려는 이전 시도와 본질적으로 경쟁하게 했다. 뮤제로가 이전 최고 합산 점수를 이기면 1점을 얻고 이전 최고의 노력을 이기지 못하면 0점을 얻는다.

비디오 인코딩의 역학을 학습하고 최상의 비트 할당 방법을 결정함으로써 뮤제로는 품질 저하 없이 비트 전송률을 줄일 수 있다. 회사 측은 "QP 선택은 인코딩 프로세스에서 수많은 인코딩 결정 중 하나이자 첫 번째 단계일 뿐"이라고 설명했다. 

AI타임스 박찬 위원 cpark@aitimes.com

[관련기사]딥마인드, 사람처럼 코딩하는 AI 개발...한국 연구자 제1저자로 참여

[관련기사]딥마인드, 로봇 시뮬레이터 무조코 인수..."오픈소스 SW로 제공할 것"

키워드 관련기사
  • 딥마인드, 정교한 로봇 팔 기술 내놨다...제조업 자동화에 활기불어넣을 듯
  • 딥마인드, 강화학습 유연성 살리는 통합 가상훈련 ‘XLand’ 개발
  • 딥마인드 “강화학습이 범용AI 달성하는 시대 곧 온다”