(사진=셔터스톡)
(사진=셔터스톡)

마이크로소프트(MS)가 화상회의 솔루션인 '팀스(Teams)'에서 인공지능(AI)을 활용해 소리의 울림을 줄이고 음질도 개선하는 기능을 적용하고 있다고 미 IT매체 더버지가 14일 보도했다.

MS는 지난 2년 동안 팀스에 새 기능을 추가한 가운데 현재 AI를 통해 기본 기능이 작동하는 방식을 재정비하고 있다. 화상회의를 하다보면 음향이 좋지 않아 잘 들리지 않거나 두 사람이 동시에 대화하려고 하면서 ‘아니, 네가 먼저 해’라고 하는 어색한 순간이 발생하기도 한다. MS의 새 AI 기반 음질 개선 작업은 이러한 일상적인 불편함을 개선하거나 없애줄 전망이다.

MS는 현재 실내 음향을 개선하기 위해 머신 러닝 모델을 사용한 결과 소리가 동굴 속에 있는 것처럼 들리지 않게 됐다. MS의 지능형 대화 및 커뮤니케이션 클라우드 담당 수석 프로그램 관리자 로버트 아이슈너는 “팀스에 처음으로 머신 러닝을 사용해 다양한 장치에서 울림을 실제로 줄일 수 있는 반향 제거 기능을 구축했다”고  밝혔다.

다른 IT 매체 엔가젯도 팀스의 개선으로 통화 참여자들이 상대방의 말을 더 또렷하게 들을 수 있게 됐다면서 대화에 갑자기 끼어드는 것을 막지는 못하지만 다른 사람의 생각을 방해하지 않고 중요한 요점을 제기하는 데 도움이 될 수 있다고 평가했다.

MS는 몇 달 동안 이 테스트를 통해 팀스 사용자가 반향 감소 및 통화 품질 개선을 인식하고 있는지 확인하기 위해 실제 환경에서 모델을 테스트해 왔다. 이 소프트웨어 제조업체는 모델 학습을 위해 3만 시간 분량의 음성을 사용했고, 크라우드 소싱(crowd sourcing)을 통해 수천 대의 장치에 기록된 음성들을 반영했다. 팀스 사용자들은 자신의 장치에서 목소리를 기록하고 오디오를 재생한 데 대해 비용을 지불 받기도 했다.

(사진=셔터스톡)
(사진=셔터스톡)

아이슈너는 “실내 음향은 울림 제거에서 중요하다”며 “기술 적용을 위해 약 10만개의 다른 방을 시뮬레이션했다”고 설명했다. 그 결과 통화 음질이 크게 개선되고, 울림을 제거해 여러 사람이 동시에 말할 수 있게 됐다.

팀스에서 소리가 튀거나 울림이 발생해 음질 저하를 감지하면, 이 모델은 기록된 오디오를 변환 처리하면서 울려서 잘 들리지 않는 것을 막고 팀스 참여자들이 가까운 거리의 마이크에 말하는 것처럼 소리를 낼 수 있게 됐다고 매체는 밝혔다.

가장 인상적인 점은 울림으로 인해 다른 사람의 목소리를 들을 수 없는 현상 없이 통화 시 서로 끼어들 수 있다는 점이다. MS는 이전의 AI 기반 소음 억제 기능 개선과 함께 현재 이러한 모든 기능을 팀스에서 제공하고 있다. 모든 처리는 클라우드가 아닌 클라이언트 장치에서 로컬로 이뤄진다.

아이슈너는 “클라우드에서 모든 통화를 처리하려는 경우 클라우드가 여전히 비용이 많이 들고 당연히 이 비용을 고객에게 전가해야 하기 때문에 클라이언트 단에서 이뤄지는 것이 장점이라고 할 수 있다”고 설명했다.

이는 이러한 중요한 팀스의 개선 사항을 유료 고객에게만 제공할 수 있다는 것을 의미하고, 장치 내에서 이뤄지는 경우에는 팀스을 사용하는 장치의 90%에서 소음 억제와 같은 기능을 사용할 수 있다는 것을 뜻한다고 매체는 해석했다. 엔가젯은 장치 내에서 통화를 처리하면서 비용을 줄일 수 있고 울림 감소 기능이 신속하게 적용되며 다양한 사용자 범위에서 이뤄질 수 있다고 분석했다.

이러한 모든 새로운 MS 팀스의 개선 사항은 비디오 자막에 대한 실시간 화면 최적화, 비디오 또는 화면 공유 통화 중 대역폭 제한에 대한 AI 기반 개선 등과 함께 실시간으로 제공되고 있다.

엔가젯은 이 자체만으로는 줌이나 구글 밋과과 같은 경쟁 제품보다 팀스를 선택하도록 하지 못할 수도 있지만, 직장에서 가상 모임이 일상적인 경우 국면을 바꿀 수 있는 결정적인 역할을 할 수 있을 것으로 평가했다.

AI타임스 이한선 객원 기자 griffin12@gmail.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지