제1회 구글 '음성 AI 스타트업 엑셀러레이팅' 업체 선정 완료
북미지역 대상, 음성 기반 AI 기술 스타트업 12개 선정
비즈니스·교육·의료 등 분야에 음성 기반 AI 기술 활용

(사진=셔터스톡)
(사진=셔터스톡)

구글이 처음 실시하는 ‘음성 인공지능(AI)’ 스타트업 엑셀러레이팅 프로그램 대상 업체 선정을 완료했다.

22일(현지시간) 구글은 구글개발자(Google Developers) 블로그를 통해'스타트업 엑설레이터를 위한 구글: 음성 AI(Google for Startups Accelerator: Voice AI)' 프로그램 12개 스타트업을 선정했다고 밝히며 해당 기업에 대한 간략한 소개를 전했다.

지난해 12월 구글은 북미 지역에 음성기반 AI 기술을 개발하는 유망 스타트업을 선정해 10주에 걸쳐 멘토링·기술 지원 엑설레이팅 프로그램을 진행한다고 예고한 바 있다.

선정된 기업은 모두 시리즈 A펀딩 이하 신생 스타트업으로, 음성 기반 사용자 인터페이스를 활용해 교육·의료 등 서비스를 개발한다.

이번 엑셀러레이팅 프로그램에는 4개 캐나다 스타트업과 8개 미국 스타트업이 선정됐다.

◆바블리(Babbly)

(사진=바블리 홈페이지)
(사진=바블리 홈페이지)

캐나다 토론토에 기반을 둔 바블리는 영유아 언어 발달 과정을 분석하는 AI 서비스를 제공한다. 자녀가 옹알이하거나 말하는 영상을 스마트폰 앱에 업로드하면 사용 어휘 수, 언어발달 추이 등 데이터를 확인할 수 있다.

소아과의사, 아동 언어 병리학자 등 전문가가 데이터를 기반으로 자녀 언어 발달에 필요한 조언도 해준다.

◆비스포큰(Bespoken)

미국 스타트업 비스포큰은 ‘음성 인식 기술’ 성능을 검증하는 ‘테스트’ 로봇을 제작한다.

자동차, 홈IoT 등 음성 인식 기술을 탑재한 서비스가 늘어나며, 해당 성능 검증에 대한 수요가 늘어남에 따라 비스포큰이 주목받을 것으로 전망된다.

비스포큰은 스피커와 마이크를 탑재했다. 아날로그 오디오를 직접 출력한 뒤 검증 대상인 음성 서비스 장치가 제대로 대답하는지 확인하는 식으로 작동한다. 사람이 마이크를 사용하기 전 ‘하나, 둘’ 하고 음성 테스트를 하듯 음성 인식 기술이 잘 작동하는지 확인하는 것과 같다.

◆컨버세이셔널 헬스(Conversational HEALTH)

(사진=컨버세이셔널헬스 홈페이지)
(사진=컨버세이셔널헬스 홈페이지)

캐나다 스타트업 컨버세이셔널 헬스는 임상 시험, 의료 분야에서 환자와 의료 전문가를 이어주는 대화형 AI 챗봇을 제작한다.

환자가 약을 언제, 얼마큼 복용해야하는지 질문하면 AI 알고리즘이 답변해주는 식이다. 환자와 의료진 사이 접근성을 높여준다.

◆네들(Nēdl)

미국 캘리포니아주 스타트업 네들은 라이브 오디오 플랫폼 서비스를 제공한다. 최근 화제가 된 오디오 챗 애플리케이션 클럽하우스와 비슷하다.

‘드롭 인(Drop-In)’ 기능을 통해 대화에 여러 사람을 초대할 수 있다. 대화에 관심 있는 이들이 청취자로 참여도 가능하다. 나만의 ‘라디오 방송국’을 꾸려 사람들과 소통하는 셈이다.

◆오티오.AI(OTO.AI)

미국 뉴욕에 있는 스타트업 오티오.AI는 음성 속 ‘감정’을 분석해낸다. 오티오.AI가 개발한 AI 프로그램 딥톤(DeepTone)으로 목소리에서 웃음, 짜증, 피곤함 등 감정을 포착한다.

딥톤을 이용해 전화 상담원은 고객 감정을 파악할 수 있다. 상담원이 전화 응대 시 더 적절한 반응을 취할 수 있게 된다.

녹취 파일을 그동안 단순 문장으로만 기록하던 것을 넘어 억양과 뉘앙스 등 감정적 요소도 함께 기록할 수 있게 된다. 보건의료, 로봇 공학, 콜센터 등 분야에 폭넓게 이용될 것으로 전망된다.

◆피플(Piffle)

(사진=피플 홈페이지)
(사진=피플 홈페이지)

미국 캘리포니아 스타트업 피플은 대화형 게임을 통해 건강한 환경 업무문화와 직장을 만드는 것을 추구한다.

음성 언어 조력자와 함께 현장인터뷰, 소셜댄스(출시예정), 창업가(출시예정) 다양한 옵션을 골라 게임할 수 있는 음성 게임 플랫폼이다.

◆포와우 AI(Powow AI)

포와우 AI는 자동 회의록 생성 사스 서비스(SaaS·Service As A Software)를 제공한다. 사스는 서비스형 소프트웨어로, 소프트웨어를 이용하기 위해 따로 다운로드 받을 필요없이 클라우드를 통해 제공하는 형태를 뜻한다.

줌, 행아웃, 팀즈 등 온라인 미팅 시 포와우 AI를 ‘초대’해 이용 가능하다. 온라인 미팅 플랫폼 회의 일정에 아이디 ‘agent@powow.ai'를 초대한다.

회의에 참여한 AI 소프트웨어가 대화 내용을 바탕으로 회의록을 작성해 제공한다.

◆심비(SiMBi)

(사진=심비 홈페이지)
(사진=심비 홈페이지)

심비는 캐나다 벤쿠버에 있는 스타트업으로 이용자의 목소리로 ‘내레이션북’을 만들어준다. 유아동 대상 독서 학습 서비스로 활용된다.

심비는 수천 권에 달하는 도서 데이터를 보유한다. 스마트폰 앱을 통해 이용 가능하며 이용자 나이, 독해 능력, 관심도에 따라 적절한 도서를 추천한다.

심비 앱이 소리내어 읽어주는 책 내용을 이용자가 따라 읽으면 목소리를 녹음한다. 이에 적절한 그림과 녹음된 목소리를 합쳐 내레이션북을 제작해준다. 66개국에 13만명 이용자를 보유하고 있다.

◆토카투(Talkatoo)

(사진=토카투 홈페이지)
(사진=토카투 홈페이지)

캐나다 스타트업 토카투는 수의학 분야에 쓰이는 TTS(Text To Speech) 서비스를 제공한다. TTS는 음성합성 시스템으로 AI가 사람의 음성을 분석해 텍스트 형식으로 변환해준다.

난해한 전문 용어가 활용되는 수의학 분야에 특성화됐다는 장점을 지닌다. ‘미국 건강보험이동성과 결과보고책무활동에 관한 법(HIPAA·Health Insurance Portability and Accountability Act)’ 수준의 TTS 서비스가 가능하다.

의학 사전이 내장돼 수의학 전문 어휘를 분당 200개 이상 단어를 기록할 수 있다. 인간에 비해 말을 듣고 받아적는 속도가 5배나 빠르다. 국적마다 다른 억양을 고려하고, AI가 자체 분석으로 적절히 구두점을 추가하는 기능도 가능해 까다로운 전문 분야에 섬세한 TTS 서비스를 제공한다.

◆타이니셰프(Tinychef)

타이니셰프는 미국 뉴욕에 있는 스타트업으로 ‘AI 주방 비서’ 서비스를 제작한다.

음식을 요리할 때 조리법, 식재료 등을 AI가 음성으로 설명해준다. 이용자 요리 숙련도에 따라 제공하는 조리법 난이도를 다르게 설정할 수 있다.

레시피를 기반으로 조리 단계별 음성 안내를 지원하며 조리 시간, 단계별 세부 정보, 가이드 라인을 함께 제공한다.

음성 명령을 통해 요리에 필요한 재료, 조리 기구 등을 실시간으로 쇼핑 리스트에 추가하는 기능도 이용 가능하다.

◆보이시파이(Voicify)

미국 보스턴 소재 보이시파이는 AI 챗봇·음성 앱을 OS간 연결해주는 솔루션을 제공한다.

아마존 알렉사, 구글 어시스턴트, 삼성 빅스비 등 AI 음성 인식 기술 OS가 달라 이용할 수 있는 애플리케이션에도 한계가 있다. 이때 보이시파이는 하나의 앱을 여러 OS에서 사용할 수 있도록 ‘연결 솔루션’을 제공한다.

◆바울(Vowel)

(사진=바울 홈페이지)
(사진=바울 홈페이지)

미국 뉴욕 스타트업 바울은 음성 인식 기술 기반 '실시간 주석' 기능을 가진 화상회의 플랫폼이다.

바울을 통해 진행되는 화상회의는 실시간 녹음·녹화된다. 필요한 내용에 해시태그를 달아 북마크 할 수 있다.

이용자는 회의에서 나온 내용을 다시 확인하기 위해 검색어를 입력해 복기할 수 있다. 예를 들어 ‘로고’를 검색하면 회의 중 해당 내용 녹음 파일을 찾아 들려준다.

AI타임스 장희수 기자 heehee2157@aitimes.com / 이하나 기자 22hnxa@aitimes.com

[관련기사][R] AI 스타트업들도 '인공지능 중심도시' 광주로

[관련기사]동국대 LINC+사업단, 일산에 의료 클러스터 만들어 스타트업 마중물 붓는다

키워드 관련기사
  • 민·관·학 연결하는 동국대 테스트베드, 지역 주민 건강 케어한다
  • "AI와 '인간스럽게' 소통하다" [특별기획 AI 2030] ⑪ 복합대화 기술
  • 2021년 주목해야 할 'AI기업'...포브스 선정