아마존 AI 스피커 '에코' 가동 단어 수십개 발견
"알렉사" 부르지 않아도 작동...스마트홈 프라이버시 침해 우려

아마존의 대표적 인공지능(AI) 음성비서 스마트 스피커가 작동시키는 단어(웨이크워드)인 “알렉사”라고 말하지 않았는데도 작동하는 경우가 많은 것으로 드러났다. 사진=아마존
아마존의 대표적 인공지능(AI) 음성비서 스마트 스피커가 작동시키는 단어(웨이크워드)인 “알렉사”라고 말하지 않았는데도 작동하는 경우가 많은 것으로 드러났다. (사진=아마존)

아마존의 대표적 인공지능(AI) 음성비서인 스마트 스피커 '에코'를 작동시키려면 "알렉사"하고 불러야 한다. 그런데 알렉사 외에도 에코를 작동시킬 수 있는 단어가 수십개나 발견됐다. 

일종의 오류다. 하지만 이로 인해 언제 내 스마트 스피커 오디오 녹음이 클라우드로 보내지는지, 누가 여기에 접속하는지 추적하기가 어려워졌다. 스마트홈 프라이버시 지키기가 힘들어졌다는 얘기다.

아스테크니카와 벤처비트 등은 6일(현지시간) 일단의 연구원들이 아마존 에코를 작동시킬 생각이 없는 사용자들의 말을 작동명령어로 이해하고 작동시키는 수십 개의 단어를 찾아냈다며 이를 소개했다.

스마트스피커를 통해 가장 널리 사용되는 음성비서 사용자는 날로 증가하고 있다. 시장 조사회사 스타티스타에 따르면 지난해 기준 전 세계에는 약 42억5000만 음성비서가 사용되고 있는 것으로 추정되고 있다. 그러나 개인 정보 보호에 대한 우려는 줄어들지 않고 있다.

이런 가운데 미국 노스캐롤라이나 주립대·독일 다름슈타트트 대·프랑스 파리 새클레이 대 공동 연구진은 스마트기기의 정상적 작동을 거스르는 단어의 사례를 적발하기 위해 사용자도 모르게 새는 명령어를 감시하는 이른바 ‘리키픽(Leaky Pick)’을 개발해 실험에 이용했다.

이 기기는 주기적으로 마이크가 장착된 스피커를 조사하고 오디오가 (클라우드 서버로)전송되는지 보여주는 패턴을 알아내기 위해 후속 네트워크 트래픽을 감시한다.

연구진은 리키픽이 아마존 에코 스피커를 우연히 작동하게 만든 시킨 단어 수십 개를 확인했다고 말했다.

보고서에 따르면 우발적 음성비서 작동은 사적인 대화 속의 업무관련 내용을 노출시키는 것으로 드러났다. 일례로 미스촌 드 레야를 비롯한 미국의 로펌들은 직원들이 집에서 고객 문제에 대해 이야기할 때 스마트 스피커 음을 소거하라고 권고하는 상황이다.

이 연구진이 개발한 리크픽 플랫폼은 스마트스피커에 숨겨진 녹음 내용과 이의 전송은 물론 잠재적으로 그럴 가능성있는 손상된 단말기를 식별해 낼 수 있도록 설계됐다.

미국·영국·프랑스대학 공동연구진이 리키픽을 스마트기기에 적용해 오작동에 의한 데이터 유출 등을 조사했다. 그림=노스캐롤라이나 주립대 등
미국·영국·프랑스대학 공동연구진이 리키픽을 스마트기기에 적용해 오작동에 의한 데이터 유출 등을 조사했다. (그림=노스캐롤라이나 주립대 등)

 

이 기기는 40달러(약 4만8000원)도 안되는 라즈베리 파이 컴퓨터(보드)로 만들어진 시제품으로서, 아마존 에코 스마트스피커 사용자가 집에 없을 때 주기적으로 청각적 소음을 발생시키고 다양한 음성 지원 장치에 적용할 수 있는 통계적 접근법을 사용해 트래픽을 모니터링하는 방식으로 작동했다.

연구원들에 따르면 음성 트래픽을 94%의 정확도로 감지한다는 리키픽은 음성비서를 일깨우는 말인 웨이크 워드(에코의 경우 “알렉사!”)를 사용하는 스마트스피커, 그리고 보안 카메라와 연기 경보기처럼 웨이크워드를 사용하지 않는 장치 모두에 사용할 수 있다.

리크픽은 스마트스피커에서는 알려진 웨이크 워드(“알렉사”, “헤이구글”)와 잡음 접두사를 조사하도록 사전 설정됐으며, 네트워크 레벨에서는 일반적으로 데이터를 많이 보내지 않는 마이크 작동 장치가 네트워크 트래픽을 증가시키는 이른바 ‘버스팅(bursting)’을 찾는다. 통계 조사 단계는 비(非)오디오 전송으로 인해 버스트가 발생하는 사례를 걸러내는 역할을 한다.

리키픽은 실수로 음성 녹음을 촉발하는 단어를 식별하기 위해 음소사전에 나온 실제 웨이크 워드들과 음소수가 같거나 유사한 모든 단어들을 사용했다. (음소는 영어 단어에서 p, b, d, t와 같이 한 단어를 다른 단어와 구별하도록 해주는, 지각적으로 구별되는 언어의 가장 작은 소리 단위다. p, b, d, t는 ‘pad’ ‘pat’ ‘bad’ ‘bat’처럼 단어의 뜻 차이를 가져다 준다.) 리키픽은 또한 간단한 영어 단어 리스트에서 무작위로 선정된 단어들을 말로 표현한다.

공동연구진이 아마존 에코를 사용해 “알렉사”라는 웨이크워드를 꺼내지 않아도 에코를 작동시키는 단어들을 실험을 통해 밝혀냈다. 자료=노스캐롤라이나 주립대 등
공동연구진이 아마존 에코를 사용해 “알렉사”라는 웨이크워드를 꺼내지 않아도 에코를 작동시키는 단어들을 실험을 통해 밝혀냈다. (자료=노스캐롤라이나 주립대 등)

 

연구원들은 리키픽을 아마존 에코닷, 구글 홈, 애플 홈팟 같은 스마트스피커, 그리고 프랑스 네타트모의 웰컴과 프레즌스 같은 보안카메라, 미국 네스트의 스마트 연기감지기인 프로텍트, 영국 하이브의 스마트홈 허브인 하이브 허브 360로 테스트했고 하이브 뷰(Hive View)를 사용해 성능을 평가했다.
 
이들은 이어 기준이 되는 버스트와 통계적 탐색을 위한 데이터 세트를 만들었고, 그런 다음 8개 장치의 실시간 트래픽을 모니터링하고, 음성작동 장치를 작동시키는 웨이크 워드 목록과 결합된 영어에서 가장 많이 사용되는 1000개의 단어 중 50개의 단어 세트를 무작위로 선택해 했다. 그리고 나서 그들은 3 가구의 사용자들이 52일 동안 세 개의 스마트 스피커(에코 닷,  홈팟, 구글 홈)를 사용해 상호작용하도록 했다.

연구팀은 에코닷 주변의 LED 링과 같은 표시기를 활용해 기기가 명령을 듣기 시작한 시점의 타임 스탬프를 기록함으로써 리키픽의 정확도를 측정했다.

라이트 센서는 장치가 작동할 때마다 리키픽이 표시할 수 있도록 했고, 앰프를 통해 라즈베리파이와 연결된 3와트(W) 스피커는 사운드를 냈고, 와이파이 USB 동글은 네트워크 트래픽을 잡아냈다.

연구원들은 한 실험에서 알려지지 않은 웨이크워드를 식별하는 리키픽의 능력을 테스트하기 위해 에코닷에 표준 “알렉사”웨이크 워드를 사용하도록 설정하고, 리키픽에는 다른 오디오 입력을 재생토록 하고는 에코닷이 음성 입력을 확실히 듣도록 2초 동안 기다리게 했다.

연구원들에 따르면, 에코 닷은 여러 번의 시험에서 89개의 단어에 ‘신뢰하는’ 반응을 보였는데, 그 중 일부는 표준 웨이크워드인 “알렉사(Alexa)”와는 음운적으로 매우 다른 “알라차(alachah)”, “레치너(lechner)”, “일렉트로텔레그래픽(electrotelegraphic)” 같은 단어였다.

89개의 잘못된 웨이크워드 모두가 뒤따르는 오디오녹음을 아마존으로 스트리밍했다. 이는 또다른 연구에서 알렉사, 시리 및 구글 어시스턴트를 잘못 작동시킨 1000개의 구문을 찾아낸 것과 비추어 볼 때 놀라운 일이 아니다.

아직 발표되지 않은 이 논문의 공동저자는 “어떤 경우에는 이 장치들이 오디오를 원격 서버로 보내는데, 서버의 더 활발한 체크 메커니즘조차도 이 단어들을 웨이크워드로 착각한다”고 말했다.

리키픽 크리에이터들은 “스마트 홈 IoT 기기들이 점점 더 마이크를 채택하기 시작하면서 실질적 사생활 보호에 대한 필요성이 커지고 있다”고 썼다. 또 “리키픽은 스마트 홈 프라이버시에 대한 실질적 위협을 완화하기 위한 유망한 접근방식을 보여준다”고 덧붙였다.

 

[관련기사] 음성인식에 인종차별 존재...스탠포드 연구 결과

[관련기사] 구글, 대화형 AI챗봇 '미나' 공개...농담까지 '술술'

키워드 관련기사
  • AI(인공지능)와 사랑할 수 있을까
  • AI(인공지능) 음성인식 기술
  • GS건설, 국내 최초 빅데이터 기반 AI 스마트홈 시스템 '자이 AI 플랫폼' 개발