야렉 쿠틸로브스키 딥엘 창업자 겸 CEO가 기자간담회에서 한국 시장 전략을 발표하고 있다.
야렉 쿠틸로브스키 딥엘 창업자 겸 CEO가 기자간담회에서 한국 시장 전략을 발표하고 있다.

글로벌 언어 인공지능(AI) 전문 딥엘이 음성 번역 솔루션 출시를 알리며 차세대 대형언어모델(LLM)에 한국어를 추가한다고 밝혔다.

딥엘은 28일 그랜드 하얏트 서울에서 기자간담회를 열고, 기존 텍스트 번역에 이어 처음으로 음성 번역 솔루션 ‘딥엘 보이스(DeepL Voice)’를 선보였다.

'보이스 포 미팅(Voice for Meetings)과 ‘보이스 포 컨버세이션(Voice for Conversations)’이라는 2개 모델로 출시한다. 대면 대화는 물론 비대면 화상회의에서도 다국어 실시간 번역 서비스를 제공한다.

먼저 딥엘 보이스 포 미팅은 마이크로소프트 팀즈에 통합한 형태로 출시한다. 화상회의 참여자들이 각자 선호하는 언어로 발화하면 다른 참석자들은 실시간 번역 자막으로 내용을 확인할 수 있다. 빠르게 많은 대화가 오고 가는 화상회의 특성 상 소통 혼선을 방지하기 위해 음성 번역까지는 지원하지 않는다는 설명이다. 기술적으로는 가능하다고 덧붙였다.

마이크로소프트 팀즈 통합 이유에 대해서 야렉 쿠틸로브스키 딥엘 CEO는 “딥엘의 경우 대기업 파트너가 많은데, 대중과 달리 기업에서는 화상회의 툴로 MS 팀즈를 사용하는 경우가 가장 많다”라며 “물론 내년에 줌(zoom) 등 다른 화상회의 툴에 딥엘 보이스를 탑재할 생각이 있다”라고 말했다.

현장에서 선보인 데모 영상에 의하면 각자 언어가 다른 4명의 화상회의 참가자들이 원활하게 의사소통이 가능한 것으로 나타났다. 

딥엘 보이스 포 컨버세이션은 1대 1 대면 대화를 위한 모바일 솔루션이다. 모바일 기기 하나를 이용해 두사람이 동시에 번역 내용을 확인할 수 있다. 각자 다른 모국어를 사용하는 두명의 발화자가 대화를 진행하면, 실시간으로 언어를 감지해 음성 번역 및 번역 자막을 제공한다.

‘보기 모드’를 두가지로 지원한다. 첫번째는 발화자들이 ‘같은 방향’에서 화면을 바라볼 때 유용하다. 두가지 언어의 발화 내용을 나란히 보여주는 형태다. 두번째는 각자 ‘다른 방향’에서 화면을 바라볼 때 편리하다. 모바일기기 화면을 위, 아래 방향으로 구분해 각각 다른 언어로 자막을 보여준다. 

음성 인식 및 음성 번역 기술을 탑재했지만, 번역 기술은 ‘텍스트’를 기반으로 한다. 이는 언어와 번역의 특성 때문이다.

야렉 쿠틸로브스키 대표는 “실시간 번역, 특히 음성 발화 기반 번역은 문장을 어떻게 인식하느냐에 따라 결과가 많이 달라질 수 있다”라며 “발화자의 문장이 다 끝나지 않았는데 번역을 진행하거나, 문장의 주어 목적어 등 정보가 충분하지 않은 경우 결과에 오류가 발생할 수 있다”라고 말했다.

이는 딥엘만이 가진 장점이라고 강조했다. 단순히 문장, 줄 단위 등 기계적인 구분으로 번역을 진행하는 것이 아니라 언어별 상황별 ‘문맥’을 파악할 수 있다고 설명했다.

실제 학습 데이터에도 방언이나 억양, 뉘앙스를 모두 반영했다. 번역은 ‘언어의 이해’가 중요한 분야인 만큼 범용 LLM이 아니라 ‘언어 특화 LLM’을 구축했다고 전했다. 지난 7월 출시한 차세대 LLM이 그 예다.

차세대 LLM은 번역을 위해 특별 설계한 LLM으로, 번역을 위해 수집한 독점 데이터와 언어 전문가의 모델 튜터링이 특징이다. 영어, 일본어에 이어 이날부터 한국어를 추가 지원한다고 밝혔다.

차세대 LLM은 딥엘 프로 사용자에게 제공된다. 사용자는 웹, 데스크탑 앱 및 API 환경에서 차세대 LLM 또는 클래식 모델을 선택해 사용할 수 있다. 

한국어 모델 출시가 늦어진 이유에 대해서는 “딥엘이 만족하는 수준 만큼의 성능에 도달하기 위해서는 시간이 필요했다”라고 전했다. 실제 출시 당시보다 문맥 파악 능력도 향상한 상태라고 덧붙였다.

그만큼 딥엘에게 한국은 중요 시장이라고 강조했다. 딥엘 보이스 초기 지원 언어에 한국어를 포함한 이유도 지난 5~6월 방한 당시 국내 기업 측에서 열렬한 반응을 보여줬기 때문이라고 전했다. 특히 엔터프라이즈 수요가 많다고 전했다. 

한편, 딥엘 보이스는 한국어 외에도 많은 언어를 지원한다. 음성 번역은 현재 한국어, 영어, 독일어, 일본어, 스웨덴어, 네덜란드어, 프랑스어, 튀르키예어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 이탈리아어 등 13개국 언어를 지원하고 있다. 추후 지원 언어를 지속 확대할 예정이다. 실시간 자막 번역은 딥엘 번역기에서 현재 탑재 중인 33개 언어를 모두 지원한다.

현재 일본의 기업과도 딥엘 보이스 계약을 마치는 등 세계적으로 많은 수요가 발생 중이라고 전했다.

야렉 쿠틸로브스키 딥엘 창업자 겸 CEO는 “한국은 가장 빠르게 성장하고 있는 시장 중 하나”라며 “한국 기업들의 글로벌 비즈니스 확장에 기여할 수 있다는 점에 큰 기대감을 가지고 있다”라고 말했다.

이어 “모델 성능은 컴퓨팅파워 확대만으로 향상하기에 한계가 있다”라며 “빅테크 등 여러 곳에서 번역 관련 도구를 내놓고 있지만, 우리는 언어의 본질에 집중해 온 만큼 경쟁력에 자신이 있다”라고 말했다.

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지