인공지능(AI) 비서로 시리 앱이 처음 등장한 것은 2010년이었고, 코타나와 알렉사도 2014년에는 등장했다. 그런데 AI 기술이 그 어느 기업보다 앞서 있다고 알려진 구글이 AI 비서 어시스턴트(Assistant)를 2016년이 돼서야 공개했다는 것에 의아한 생각이 들 수도 있다.
아마 과도한 마케팅보다 기술에 더 몰두하는, 구글의 엔지니어링 분위기에 기인한 것일 도 있다. 사실, 검색엔진의 제왕이었던 구글은 2002년부터 음성인식 기술 연구를 시작했는데, 주로 검색 강화에 시험해 보고 활용해 며 점진적으로 확장해 오다가 2016년에서야 AI 비서 서비스를 시작했다.
구글의 음성인식 기술 연구는 초기에는 주로 내부적인 실험과 프로토타입 개발에 집중됐다. 처음 공개된 서비스는 2007년의 ‘GOOG-411’로, 사용자가 전화 음성으로 지역 비즈니스 정보를 검색할 수 있게 하는 것이었다. 그러다가 2008년에 블랙베리 일부 모델의 구글 맵스와 아이폰용 구글 모바일 앱에서 말로 검색이 가능한 음성 검색 기능을 추가했다.
2009년부터 안드로이드 운영체제에 통합되기 시작한 음성 검색 기능은 2010년에는 보이스 액션(Voice Actions)이라는 이름으로 음성 명령을 내리고 응답을 받을 수 있는 서비스로 발전했다. 2012년에는 음성 검색을 포함해서 좀 더 광범위한 개인화된 서비스를 제공하는 구글 나우(Now)도 출시했다.
구글 나우는 맞춤형, 상황별 정보를 제공하는 등 개인 비서 성격도 띄고 있었으나, 공식적으로 구글은 검색 앱으로 규정했다. 이듬해 구글은 화면을 터치하지 않고도 음성 검색을 시작할 수 있는 호출어 ‘OK 구글’을 도입했고, 이후 자연어 처리, 머신러닝, AI 기술을 지속적 개발하며 음성인식의 정확도, 다국어 지원, 문맥 이해, 개인화된 결과 제공 등의 기능을 꾸준히 향상했다.
이처럼 조심스럽게 AI 비서 서비스에 대해 접근하던 구글은 2016년 양방향 대화가 가능한 본격 AI 비서 구글 어시스턴트를 공개했다. 당시 구글 어시스턴트는 구글 홈(Home)이라는 스마트 스피커와 알로(Allo)라는 메시징 앱의 일부로 공개됐다.
이후 안드로이드와 iOS를 지원하고, 안드로이드 TV, 자동차용 안드로이드 오토(Auto)와 같은 다양한 기기에서 활용됐을 뿐만 아니라, 외부 개발자를 위한 개발자 키트를 공개하며 냉장고, 세탁기 등 가정용 기기에 탑재되기도 했다.
2018년에는 어시스턴트의 확장 프로그램인 듀플렉스(Duplex)가 공개, 다시 이목을 끌었다. 시연에서 듀플렉스는 자연스러운 사람의 목소리와 자연스러운 대화로 미용실과 식당에 전화를 걸어 예약 과정을 수행했고, 전화선 너머 상대방은 AI라는 것을 눈치채지 못했다.
듀플렉스에는 자연어이해, 딥러닝, 문자음성변환(TTS) 등 AI 비서를 위한 최신 기술들이 모두 망라됐고, 단순한 전화 업무는 사람이 직접 하지 않아도 될 수 있는 미래를 보여줬다. 이렇게 구글은 20년 이상 요란하지는 않으나, 순간 임팩트있는 모습으로 자연어 처리와 AI 비서의 발전을 진행했다.
페이스북은 2015년에 수천명으로 구성된 베타 테스트 그룹에 문자 메시지로 소통하는 가상 비서 ‘M’을 실험했다. M은 항공권을 예약하고, 음식 주문을 하는 등 다양한 AI 비서의 역할을 충실히 했는데, 사실은 M트레이너로 불린 사람이 AI와 하이브리드로 테스트 그룹이 요청한 명령을 수행한 것이었다.
사람이 함께 작업한 이 서비스는 속임수가 아니었으며, 사용자와 인간 비서의 상호 응답을 통해 가상 비서의 언어와 행동을 훈련하기 위한 데이터 수집용 실험이었다. 그와 별도로 2016년 마크 저크버그는 자연어 처리, 음성인식, 얼굴 인식, 강화 학습 등을 포함한 여러 AI 기술을 사용해 영화 아이언맨의 '자비스'와 같은 AI 비서를 만드는 개인 프로젝트를 공개했다.
2014년 코타나와 알렉사가 등장하고, AI 비서와 대화형 기술이 컴퓨팅의 미래로 관심을 끌던 이 시기에 이 분야 선두 주자였던 애플의 시리는 고통스러운 시간을 보내고 있었다. 애플이 아이폰4s에 시리를 탑재한 이듬해인 2012년부터 사람들은 시리의 단점에 주목하기 시작했고, 악의적인 평가가 쏟아지기 시작했다.
애플이 시리를 지지하는 광고를 계속 내보내기는 했지만, 능란한 마케팅은 오히려 사람들에 비현실적인 기대를 하게 했다. 결국 부분적으로 성숙하지 않았던 일부 기술로 인해 시리는 더 큰 비판에 직면하기도 했다.
사실 당시 시리에는 경쟁 제품이 없었다. 이 때문에 많은 사람들은 SF 소설이나 드라마에 등장하는 AI 수준을 기대했고, 이는 역으로 비난으로 바뀌었을 수 있다. 또 AI 특성상 빠른 발전을 위해서는 더 많은 데이터를 수집하기 위해 더 많은 앱과 연동돼야 하는데, 애플의 정책상 시리는 애플이 관리 가능한 소수의 앱에만 연동이 가능했다. 장기적으로 시리의 확장을 약속했던 스티브 잡스의 약속도 애플의 시리 공개 다음날 그가 사망하면서 잘 이뤄지지 못했다.
특히 잡스가 투병 생활에 들어가며 시리를 대하는 애플 관리자들의 방식이 달라졌고, 시리 팀은 이에 대한 불만이 컸다. 급기야 출시 3주 만에 시리의 CEO였던 대그 키틀러스가 애플을 떠났고, 반년 뒤에는 시리의 아버지 애덤 체이어도 애플을 떠났다. 잡스의 영향력이 사라진 애플에서 관리자가 계속 바뀌며 시리는 개선은 커녕 혼란만 가중됐다.
결국 원래 시리를 잘 아는 사람들이 대부분 애플을 떠났고, 시리는 AI 고아가 됐다. 이 상황에서 경쟁 서비스는 잘 준비해 등장할 시간을 벌었다. 그렇게 구글 나우와 마이크로소프트의 코타나, 아마존의 알렉사가 등장할 때까지는 물론, 2015년 이후 시리가 더욱 강력한 머신러닝 기반의 시스템으로 전환되고 2016년 타사 개발자의 액세스를 개방할 때까지도 시리는 내분과 혼란에 휩싸여 있었다.
2016년의 API를 통한 타사 개발자 엑세스는 애덤 체이어가 요구했던 개방성에는 한참 미치지 못했지만, 그래도 시리로 우버를 예약하고, 스카이프로 통화하고, 결재를 하고, 운동 앱을 이용할 수 있게 되는 등 시리의 활용성을 한층 높여줬다.
그렇지만 그 시기 사람들이 시리보다 더 많이 관심 가진 앱은 신생 기업 비브랩(Viv Lab)이 공개한 비브(Viv)였다. 비브랩은 대그 키틀러스와 애덤 체이어가 애플을 떠나고 나서 설립한 회사였고, 비브는 애플이 타사 개발자의 액세스를 개방할 당시 한층 더 개방적이면서도 더욱 복잡한 쿼리 처리가 가능한 AI 개인비서 앱이었다.
2013년부터 뉘앙스 커뮤니케이션의 기술을 기반으로 한 S 보이스(S-Voice)라는 지능형 음성지원 서비스를 제공하고 있던 삼성전자는 그해 가을 비브랩을 인수했다. 그리고 2017년 3월에 삼성은 S 보이스를 대체하기 위해 자체 개발한 AI 가상 비서 빅스비(Bixby)를 출시했다.
한동안 인터넷에서는 빅스비가 S 보이스를 기반으로 개발된 것인가, 아니면 비브를 기반으로 개발된 것인가에 대한 엔지니어들의 논쟁이 뜨거웠다. 월스트리트 저널에 빅스비의 기반은 S 보이스라는 기사가 실리기도 했는데, 다른 한편 빅스비 2.0 공개 당시 비브를 통합했다는 언급이 있기도 했기 때문이었다.
그러나 제품 개발의 특성상, 어느 기술 하나만이 기반이 됐다기보다 모든 기술이 복합적으로 적용됐을 가능성이 높다. 빅스비는 2017년 3월 공개되고 개선됐는데, 비브의 기술을 갖고 있던 애덤 체이어의 경우 2016년 후반부터 2020년까지 삼성 미국 법인 내 비브랩에서 개발 작업을 계속해 왔다.
뉘앙스 출신으로 마이크로소프트의 코타나 개발에 결정적 역할을 했던 래리 헥도 빅스비가 공개된 2017년부터 2021년까지 삼성의 비브랩 CEO로 일하고 있었다. 시리나 S 보이스 모두 뉘앙스의 기술을 기반으로 했고, 시리를 개발한 비브 팀과 코타나 개발의 주역이 모두 같은 기간 동안 빅스비 개발에 참여한 상황을 볼 때, 빅스비 구현에 어느 기술이 더 지분이 많은가 하는 논쟁은 흥밋거리이기는 하지만 정확한 답을 얻을 수 있는 문제는 아니다.
문병성 싸이텍 이사 moonux@gmail.com
- [AI의 역사] 67 헤일로와 스타트렉이 AI 비서가 되다 – 코타나와 알렉사
- [AI의 역사] 66 시리야! 넌 어떻게 태어났니? – CALO 프로젝트와 시리
- [AI의 역사] 65 직관을 갖고 뻥카도 구사하는 AI – 게임에서 강화학습과 딥러닝
- [AI의 역사] 69 도태되고 지연되고 전환하거나 업그레이드하기 – AI 가상 비서의 발전과 현황
- [AI의 역사] 70 음성인식과 자연어이해 그리고 트랜스포머 – AI 비서의 세부 기술의 발전 (상)
- [AI의 역사] 71 자연어생성과 또 트랜스포머, 그리고 음성합성과 성격 – AI 비서의 세부 기술의 발전 (하)
