开发“Acting TTS”的HudsonAI代表 Shin Hyeonjin:比传统配音降本90%,制作时间也大幅缩减

配音是内容走向全球市场的必备要素,因为它是用多种语言与观众沟通的手段。但随之而来的成本和人力消耗十分巨大。为了给一部系列作品配音,需要动员包括声优、音响工程师在内的50~60人,还要耗费数周的制作周期,就连全球在线视频服务(Over The Top,OTT)企业都感到负担沉重。


Shin Hyunjin HudsonAI首席执行官

Shin Hyunjin HudsonAI首席执行官

View original image

这种高成本结构正在迎来变化。近期,一些企业开始利用人工智能(AI)为配音开辟新路径,其中核心企业之一便是推出“表演型TTS(Text to Speech,文本转语音)”技术的HudsonAI。


HudsonAI首席执行官Shin Hyeonjin在接受《亚洲经济》采访时表示:“表演型技术即使在登场人物众多的情况下,也能用多种语言精细再现演员原本的声线特征、语气和高低起伏”,“与传统声优配音相比,成本可以降低90%以上,制作时间也能大幅缩短。”


当然,AI目前还远未达到完美水准,尤其是在自然表达包含复杂情感的台词方面仍有困难。为了解决这一问题,Shin代表引入了“指导录音”方式。他解释称:“由声优用外语带入情感进行表演,AI再学习并加以模仿”,“不仅是声音,还提供基于自动提取的台本,让画面中演员的口型与配音相匹配的功能。”


AI配音在节省时间方面同样表现突出。Shin代表表示:“声优要为一部90分钟的电影录音,至少需要4周时间,而AI只需3天即可完成”,“即便算上前期准备和质检,两周时间也足够。”


HudsonAI还拥有“语音转换(Voice Conversion)系统”。这是一项将一个人录制的声音转换成他人声线的技术,原理与最近在YouTube上走红的AI翻唱歌曲相同。


AI 配音制作场景

AI 配音制作场景

View original image

这项精细技术已经进入商业化阶段。电影《诚实选举候选人2》《Pole 600米》以及儿童动画片《Hello Carbot》等作品的英文配音版本,已通过SK宽带(SK Broadband)对外提供服务。SK宽带相关负责人表示:“观众几乎感觉不出普通配音和AI配音的差别”,“完成度很高,今后有望进一步缩短制作时间并减少人力投入。”


Shin代表称:“我们正通过扩大情感表达范围、优化工作流程,逐步实现接近人工调校水准的配音质量”,“随着AI技术进一步发展,将来也有可能实现像电影《她(2013)》那样进行情感对话的交互式服务。”


政府同样期待通过AI配音,促进K内容的全球化传播。政府将其视作推动世界化的关键,近期还推进了“AI配音特化K-FAST扩散支持”项目。


媒体行业反应也较为积极。一位业内人士预测:“可以持续深耕长期以来比起字幕更偏好配音的欧洲及中南美市场。”另一位业内人士则表示:“如果媒体企业通过这一项目在海外创造收益,AI配音系统也会自然而然地实现稳定落地。”



Shin代表强调:“内容全球化的核心在于本地化”,“如果难以像Netflix那样进行大规模投资,就应当通过AI配音等合理技术来实现这一目标。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点