대규모 언어 모델 ‘통이치엔원’을 AI 미팅 어시스턴트 ‘팅우’에 통합

(사진=셔터스톡)
(사진=셔터스톡)

알리바바가 자체 개발 대규모언어모델(LLM)인 ‘통이치엔원(Tongyi Qianwen)’을 인공지능(AI) 미팅 어시스턴트 ‘팅우(Tingwu)’에 통합했다고 CNBC가 1일(현지시간) 보도했다.

알리바바는 통이치엔원을 통합한 팅우를 '통이 팅우(Tongyi Tingwu)'라는 이름으로 새로 배포하며, 멀티미디어 콘텐츠들을 보다 높은 정확성과 효율성으로 이해하고 분석하는 것이 가능해졌다고 전했다.

비디오 또는 오디오 파일에서 내용이 요약된 텍스트를 생성하거나 각 화자의 주요 요점을 정리해 준다. 또한, 멀티미디어 파일들의 타임라인을 생성하거나 섹션별 요약본을 작성한다.

통이 팅우는 현재 공개 테스트 버전으로 사용할 수 있으며, 알리바바의 기업용 메시징 앱 ‘딩톡(DingTalk)’에 먼저 적용돼 업무 간 필요한 AI 서비스를 제공할 예정이다.

통이 팅우는 업무 효율성을 개선하는 것 외 다양한 멀티미디어 플랫폼에서 온라인 교육, 트레이닝, 인터뷰, 라이브 스트리밍, 팟캐스트, 숏폼 비디오 등에 활용되며 더욱 빠르고 쉬운 지식의 공유를 돕는다.

특히 팅우와의 통합은 매일 증가하는 비디오 및 오디오 컨텐츠 증가에 대한 대응책이라는 설명이다.

팅우는 알리바바에서 자체 개발한 음성인식 모델 ‘파라포머(Paraformer)’와 화자 구분 모델 ‘캠++(CAM++)’ 등 자사의 오디오 및 비디오 모델들과 새로 공개한 통이치엔원을 활용해 오디오와 비디오를  더 정확하게 텍스트로 변환하며 다양한 AI 기반을 제공한다. 

통이 팅우의 AI 기반 신규 기능들은 올해 말 제공 예정이다. 추가될 기능으로 오디오 및 비디오 파일 내 사용자 질문에 대한 답변을 텍스트로 자동 생성하고 영상 내 파워포인트 슬라이드들을 바탕으로 요약본을 생성하는 것이 있다. 또한 팅우를 활용해 멀티미디어 콘텐츠에 대한 영어와 중국어 간 실시간 번역 서비스도 제공한다.

알징런 저우 리바바 클라우드 인텔리전스 CTO는 “우리는 매일 점점 더 많은 양의 비디오와 오디오 콘텐츠를 다양한 방식으로 소비하는 시대에 살고 있다. 이에 발맞춰 대규모 언어 모델을 적용한 통이 팅우는 멀티미디어 콘텐츠의 보다 빠르고 심도 있는 이해와 쉬운 공유를 가능하게 돕는다”고 말했다.

한편 지난 4월 알리바바는 통이치엔원을 발표하며 사용자 경험을 향상시키고, 경쟁력을 강화하기 위해 점차적으로 다양한 비즈니스에 통합할 것이라 밝힌 바 있다.

더불어 현재는 석유화학, 전기, 운송, 호텔, 엔터프라이즈, 통신, 금융 등 다양한 분야의 파트너들과 함께 산업별로 맞춤화된 LLM을 공동 개발하는 것을 목표로 하는 '통이치엔원 파트너십 프로그램'을 진행하고 있다.

박찬 기자 cpark@aitimes.com

키워드 관련기사
  • 알리바바 “亞 기업, 클라우드 선택 시 비용보다 보안 중시”
  • 소프트뱅크, AI 집중 투자 위해 알리바바 투자금 회수
  • 알리바바, AI 챗봇 ‘퉁이 첸원’ 공개