크래프톤(대표 김창한) 산하 크리에이티브 스튜디오 렐루게임즈(대표 김민정)는 인공지능(AI) 추리 게임 ‘언커버 더 스모킹 건’의 업데이트를 진행했다고 13일 밝혔다.
이번 업데이트에서는 크래프톤과의 협업을 바탕으로 최첨단 TTS(텍스트음성변환) 모델 ‘디토(DiTTo)’를 게임에 적용했다. 디토는 크래프톤의 딥러닝 본부에서 올해 자체 개발한 TTS 모델로, 게임에 실제로 적용한 것은 이번이 처음이다.
확산 트랜스포머(Diffusion Transformer)를 음성 합성에 적용한 사례로, 기존 TTS 기술보다 자연스럽고 유연한 음성 구현이 가능하다는 설명이다. 확산 트랜스포머는 확산 모델의 단계적 데이터 생성 과정과 트랜스포머의 상관관계 학습 능력을 결합한 최신 AI 모델링 기법이다.
특히 AI의 모델 훈련 과정을 단순화해 새로운 목소리를 보다 빠르고 정확하게 구현할 수 있다고 강조했다. 실제 사람의 음성과 매우 흡사한 수준의 AI 음성을 제공한다는 설명이다.
게임 속 로봇 용의자들이 '텍스트 답변'에서 나아가 'AI 음성'으로도 답변을 하게 된 것이다. 현재는 영어 음성만 제공하며 추후 한국어를 포함한 외국어도 AI 음성을 지원할 계획이다.
한규선 렐루게임즈 PD는 “TTS와 대형 언어모델(LLM)의 통합 연계로 더욱 자연스러운 의사소통을 게임 내에 구현, 강렬한 몰입감을 제공하고자 한다”라며 “디토는 AI와 게임의 융합이라는 목표를 향한 출발점이자 중요한 이정표가 될 것”이라고 말했다.
장세민 기자 semim99@aitimes.com
