NCSoft发布角色语音自动生成AI模型

by Lee Jungyun

Published 08 Oct.2024 14:23(KST)

NCSoft于8日表示，已公开一款可在游戏语音制作全流程中加以运用的人工智能（AI）模型“Zero-shot Multi-verse TTS（Multiverse TTS）”。

TTS（Text to Speech，文本转语音）是一种通过输入自然语言来生成角色声音等语音内容的语音合成技术。NC公开的“Multiverse TTS”仅凭3秒长度的提示语音，便可实现▲多样的说话风格转换 ▲说话人音色匹配度高的跨语言生成 ▲多语种语音制作。

NC计划将Multiverse TTS技术应用于游戏语音制作的全流程。利用该模型，可以在有限语音资源的基础上制作出高品质且丰富的AI角色语音，与传统语音制作方式相比，可节省时间和成本。

同时，能够以单一模型运行也是一大特点。Multiverse TTS将具备多种语言和功能的TTS整合为一个模型，用于制作多语种语音内容。由于采用了高度优化的单一模型，与竞品TTS模型相比，能够以相对更低的运营成本提供高品质语音生成服务。

NC还将关于Multiverse TTS单一模型生成多种风格语言和语音的研究论文，发表在具有权威性的AI相关技术学会“EMNLP（Empirical Methods in Natural Language Processing，基于经验方法的自然语言处理）”上，从而成功证明了其全球技术实力。

目前，NC正为全球游戏发行推进多语种语音AI的研发工作。以此次Multiverse TTS为起点，公司目标是在年内制作100种游戏角色语音，并持续开发可根据非玩家角色（NPC）的性格和情境定制语音的调控功能。

本报道由人工智能(AI)翻译技术生成。