语音识别人工智能公司 Baikal AI 代表理事 Yoon Gihyun。照片=记者 Heo Younghan 提供

语音识别人工智能公司 Baikal AI 代表理事 Yoon Gihyun。照片=记者 Heo Younghan 提供

View original image

[亚洲经济 记者 Lee Eunju] “个人的语音中,蕴含着可以识别阿尔茨海默病等精神健康风险因素的重要信息。Baikal AI一直在开发一项技术,通过分析人类特有、连人工智能技术都不易识别的语音,来诊断认知障碍等问题。”


亚洲经济记者于本月17日,在首尔钟路区的Baikal AI办公室,采访了Baikal AI代表Yoon Gihyun(56岁)。Baikal AI是2019年成立的人工智能技术初创企业,以分析韩语语音,为个人的阿尔茨海默病或抑郁症等精神健康状况提供信息的服务为重点。


创办公司的Yoon代表,是一位在软件开发领域深耕30年的“开发者”出身。2018年,他在网络人工智能企业MindsLab开发了Hana银行的人工智能聊天机器人“Hi Chatbot”。当时他开发的聊天机器人,首次在韩国实现了金融交易功能。用户输入语音后,聊天机器人识别语音并引导完成金融交易。他对此颇感自豪,但这也让他直面了人工智能技术的局限。


聊天机器人在准确识别和分析口语方面存在局限。他表示:“平时能很好听懂我声音的聊天机器人,在我喝酒后(发音发生变化)却无法识别我的声音”,“我由此直面了这样一个现实:在识别因多种因素而不得不微妙变化的人类语音方面,技术发展依然缓慢。”同时他也意识到,通过一种连语音细微变化都不放过、加以分析的技术,可以提供的服务远不止一点。若要让人工智能技术以更便利的方式为用户服务,就必须拥有一种能够彻底掌握人类语音细微变化的技术。


尤其是“语音”可以成为判断人们健康状况的重要“信号”。只要分析得当,就可以及早诊断老年人的阿尔茨海默病,也可以在早期识别抑郁症。他解释称:“大脑中的神经细胞彼此相连”,“当人突然承受巨大压力等,出现阿尔茨海默病时,就会出现好像中间细胞被切断一样的信号流动。”他接着表示:“(通俗地说)当细胞信号流动像被切断一样表现出来时,其前兆就会体现在‘说话’上。”意思是,记忆无法被迅速提取,导致说话速度受阻,从而表现为精神健康的危险信号。


在这一理念与技术实力的加持下,公司于2019年创业后雄心勃勃推出的服务,就是“清朗我朋友”。他说:“去年9月我们开放了这款应用程序,但又做了多方面准备,从本周开始正式展开宣传。”同时,他以逐步拓展服务版图为目标。也就是说,一方面通过“清朗我朋友”这类企业对个人(B2C)服务不断提升技术水平,另一方面以支撑服务的语音分析人工智能技术为基础,向需要该技术的多家企业或地方自治团体等机构提供支持,实现协同效应。


- Baikal AI是一家怎样的企业?

▲Baikal AI是2019年成立的人工智能软件初创公司。目前的重点,是通过自然语言处理(利用计算机分析人类语言的技术)来分析韩语语音,从而告知人们的健康状况。说话是人类最核心的沟通手段,通过说话可以捕捉大脑中发生的变化。目前我们提供的是对用户健康状况程度的分析服务,今后将扩大技术开发领域,通过人们的语音数据,进一步实现对认知障碍的诊断。


- 是否有专门通过语音分析来诊断健康状况的服务?

▲有的。我们通过应用程序提供名为“清朗我朋友”的服务。用户在应用中输入语音后,系统会诊断多方面的健康状况,并分析其语言流利度。所谓语言流利度,就是分析个人如何说话的语言习惯。例如,是否充分使用多样的词汇,是否使用无意义的重复短语或单词等,都会进行综合分析。在健康状况方面,阿尔茨海默病诊断是代表性服务之一。系统会通过个人在应用中输入的声音,告知其阿尔茨海默病风险水平。


- 为什么要分析个人语音和语言流利度?用户能获得什么特别的效用?

▲当然,对年轻人而言,可能并非刚需。我们的服务相对更适用于年龄较大的人。一个人如何说话,实际上包含了比想象中更多的信息,例如,抑郁症的前兆也可以通过语音分析来诊断。大多数人并不能像播音员那样完美表达。但如果说话习惯中频繁结巴或错误较多,就有可能是认知能力出现一定异常,或者处于严重抑郁状态,而这些都可以被快速捕捉。


- 那么,可以把它理解为聊天机器人的语音版吗?

▲与聊天机器人不同。如果把聊天机器人定义为一种语音搜索服务,那么我们拥有的人工智能技术,可以理解为一种认真倾听人们的讲话、再进行反问,从而帮助提升认知能力的服务。


- 所谓提升认知能力,具体是什么意思?

▲“清朗我朋友”并不止步于语音分析,还同时提供一类旨在提升用户认知能力的训练服务。我们提供多样的阅读材料,引导用户准确朗读,并分析用户的说话内容,提出适当问题,帮助其持续进行交流。我们的服务还会根据用户的兴趣或情绪状态,与其展开对话。通过交流获得内心安定,同时通过反复说话的机会,帮助提升认知能力。当然,这类服务比起平时说话机会较多的年轻人,更适合老年人。因此,使用我们服务的会员以40多岁到70多岁的人群为主。我们正是基于“说得越多,认知功能越好”这一着眼点。


- 那么,是否可以把Baikal AI视为一家以“清朗我朋友”等语音分析服务为核心,构建了企业对个人(B2C)业务模式的公司?

▲我们也在推进企业对企业(B2B)业务。正在与地方自治团体以及强调环境、社会与公司治理(ESG)经营的大企业等,洽谈提供我们技术的合作协议。例如,有的地方自治团体正准备开展一项业务,即给独居老人打电话,检查他们的阿尔茨海默病等精神健康状况,我们正在考虑在此类服务过程中提供我们的技术。



- 目前还在准备哪些业务?

▲我们计划在母亲节之前,将“安心电话服务”接入“清朗我朋友”服务并对外开放。通过我们的应用进行通话,再根据录音下来的通话内容,分析说话习惯和阿尔茨海默病可能性。目前这类服务免费提供,但今后计划部分引入付费服务。

语音识别人工智能公司 BaikalAI 代表 Yoon Gihyun。照片=记者 Heo Younghan younghan@

语音识别人工智能公司 BaikalAI 代表 Yoon Gihyun。照片=记者 Heo Younghan younghan@

View original image


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。