(사진=큐타이)
(사진=큐타이)

프랑스의 인공지능(AI) 연구소 큐타이(Kyutai)가 인간 감정을 이해하고 표현하도록 설계한 음성 비서 '모시(Moshi)’를 공개했다.

블룸버그는 3일(현지시간) 프랑스 AI 연구소 큐타이가 파리에서 열린 행사에서 오픈AI의 'GPT-4o'와 비슷한 음성 비서 모시를 공개했다고 보도했다.

큐타이는 자비에르 니엘과 에릭 슈미트 구글 전 CEO,  로돌프 사데 등 억만장자 3명이 3억유로(약 45000억원)를 투자해 지난해 설립된 연구소다. 구글 딥마인드와 메타 AI 출신 연구원들이 합류했으며 대형언어모델(LLM) 개발을 위해 엔비디아의 'H100' GPU도 확보했다. 오픈 소스 프로젝트를 진행하는 비영리 단체로, 오픈AI의 초기 형태와 비슷하다.

이날 공개된 모시는 70가지 감정과 스타일로 대화할 수 있는 것이 특징으로, 프랑스어를 다양한 톤과 악센트로 말할 수 있다.

텍스트와 음성을 처리하는 70억 매개변수 대형멀티모달모델(LMM) '헬리움-7B(Helium 7B)'로 구동되며, 두개의 오디오 스트림을 동시에 처리해 동시에 듣고 말할 수 있다. 감정과 스타일 주석이 달린 자세한 대본 10만개로 미세조정했다.

큐타이는 이날 맥북이나 소비자용 GPU에서 실행할 수 있는 경량 버전 모시도 공개했다.

패트릭 페레즈 큐타이 CEO는 "모시는 최초로 출시된 실시간 음성 AI 비서"라며 "말하는 것에 맞춰 생각하며, 우리가 기계와 소통하는 방식을 바꿀 수 있는 엄청난 잠재력을 가지고 있다고 믿는다"라고 말했다.

오픈AI의 음성 비서 GPT-4o'와 비슷하다고도 주장했다. 특히 오픈 소스로, 모시에 대한 연구 결과를 공개한 뒤 몇주 안에 자유롭게 이용할 수 있도록 할 계획이라고 밝혔다.

또 오픈AI의 스칼렛 요한슨 논란을 의식, 앨리스라는 성우와 함께 작업했다고 소개했다. 자세한 인적 사항은 공개하진 않았다.

니엘 창립자는 “모시는 유럽이 AI 개발 분야에서 글로벌 플레이어가 될 수 있음을 보여주는 사례"라며 "이번에 선보인 제품은 전 세계 최고 수준"이라고 자평했다. 

박찬 기자 cpark@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지