NeoSapience代表 Kim Taesu 创立的NeoSapience
将文本转换为带有人类情感的语音…实现虚拟人
与“AI Juhyunyoung”等名人合作…应用于游戏、企业、机关等
“与ChatGPT等生成式AI结合产生协同效应”

NeoSapience代表 Kim Taesoo。

NeoSapience代表 Kim Taesoo。

View original image

在YouTube上有一个名为“1分钟料理 速成大哥”的频道。一位说庆尚道方言的叔叔一边和小学生侄子对话,一边介绍烹饪方法。从2021年到去年,这个频道连续两年在韩国YouTube短视频观看量中位居第一,人气极高。订阅人数多达226万。不过,知道频道中出场的两个人物声音并非真人,而是由人工智能(AI)生成的观众却并不多。就连那些自信认为自己能轻易分辨AI声音的人,也往往是在订阅频道很久之后才发现是虚拟声音,因此感到颇为意外。

为声音注入人类情感的Neosapience

负责实现该YouTube频道主角声音的公司是Neosapience。Neosapience通过AI语音生成技术提供名为“Typecast”的服务,可以将文本转换为音频。与其他公司不同的是,Neosapience并非进行简单的机械式转换,而是为声音加入人的情感。比如,在“您好”这一文本上,可以选择“高兴地”“低声耳语般地”“带着嘲讽地”等情感,从而获得所需的声音。此外,还可以利用AI虚拟演员制作视频内容。


Neosapience与3家人工智能初创公司合作打造的“AI朱贤英”。(图片来源 Typecast YouTube截图)

Neosapience与3家人工智能初创公司合作打造的“AI朱贤英”。(图片来源 Typecast YouTube截图)

View original image

Neosapience去年与3家AI初创公司合作推出“AI Joo Hyunyoung”,引发巨大话题。Joo Hyunyoung是通过Coupang Play节目《SNL Korea》中“Joo记者”“MZ办公室”等多个单元而走红的,被称为MZ世代(千禧一代+Z世代)当红演员。“AI Joo Hyunyoung”是一个在外貌和说话方式上都与真人Joo Hyunyoung高度相似的聊天机器人,可以进行实时沟通。企业或政府机构只要输入新闻稿,AI Joo Hyunyoung就会以她特有的幽默、活泼语气朗读出来。


截至本月,Typecast注册用户为140万名,在76个国家有付费用户使用该服务。登记在Typecast上的虚拟演员角色超过370种。不仅企业和政府机构在使用,在网络上想要打造所谓“副人格”(副角色),过上“第二人生”的人群当中,它也颇受欢迎。

对ChatGPT带来的变化充满期待
Neosapience自上个月16日起在自家YouTube频道上线的虚拟形象“卡米拉”。卡米拉是将Neosapience的虚拟人技术与ChatGPT相结合的虚拟形象,与用户进行实时互动,全天24小时进行直播。Typecast YouTube截图提供

Neosapience自上个月16日起在自家YouTube频道上线的虚拟形象“卡米拉”。卡米拉是将Neosapience的虚拟人技术与ChatGPT相结合的虚拟形象,与用户进行实时互动,全天24小时进行直播。Typecast YouTube截图提供

View original image

Neosapience是对ChatGPT等生成式AI热潮所带来的变化最为欢迎的企业之一。因为一旦生成式AI与Neosapience的服务相结合,其应用可能性将变得几乎无限。


Neosapience从上月16日起,将ChatGPT服务接入YouTube频道,推出了能够实时互动的虚拟形象“Camila”。Camila是一种虚拟YouTuber,可以播放用户想听的音乐,并实时回答各种问题,进行24小时咨询直播。这是ChatGPT与Neosapience语音技术相结合的首个服务。Neosapience代表 Kim Taesu表示:“语音生成技术自约4年前开始使用深度学习后,取得了飞跃式发展”,“生成式AI不仅会在语音和视频领域带来变革,还将在通过虚拟形象合成技术生成人物表情和动作的虚拟人等领域引发创新。”

“虚拟人的大众化已为期不远”
NeoSapience代表 Kim Taesu。

NeoSapience代表 Kim Taesu。

View original image

Neosapience是代表 Kim在2017年11月创立的公司。Kim代表从KAIST研究生时期起,就以利用机器学习进行语音与多媒体信号处理为专业。他在LG电子和Qualcomm等企业研究所工作10多年,开发了应用语音识别、音质提升、声音识别等技术的产品。


公司创立之初员工只有2人,如今已成长为有60余名员工的企业。去年完成了B轮融资。截至目前累计投资额为318亿韩元。包括美国硅谷投资公司BlueRun Ventures的亚洲成长型投资平台BRV在内,Woori Technology Investment、Company K Partners、Albatross等机构参与了投资。



Neosapience计划今年积极进军海外市场。Typecast目前拥有300种韩语声音和100种英语声音,同时也提供日语和西班牙语服务。今年计划上线中文、德语、意大利语、葡萄牙语等语言,以扩大用户群。Kim代表表示:“Neosapience是一家预见到具备像人一样看和听的能力、还能说话并行动的人工智能虚拟人将实现大众化,而创立的公司。”“我们将打造一个未来,使人们不仅在各类媒体上,而且在生活中的任何场景,都能接触到像人一样自然表达情感并进行交流的人工智能。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点