本地语音人工智能(AI)初创企业 FreelyScunner 20日表示,其论文凭借出色的技术实力被全球知名语音AI学会“国际语音通信大会(Interspeech 2025)”录用,并进行了口头报告。
国际语音通信大会是语音AI领域规模最大的学术会议之一,包括谷歌、Meta、苹果等大型信息技术企业在内的数千名全球语音AI专家都会参与。今年大会在荷兰鹿特丹举行。
FreelyScunner 的论文提出了一种新的“参数高效微调”(Parameter-efficient Fine-tuning)方法,可将流式语音识别模型轻松转换为高精度的非流式模型。这是一项能够将“用于实时语音识别的模型”快速且经济地转换为“重视准确度的离线分析模型”的技术。
在实现与现有非流式模型相似精度水平的同时,新方法所需新增参数控制在10%以下。只需训练一个流式模型,无需额外的大规模训练,就可以按需立即将其用作非流式模型,从而提高开发和运营效率。
FreelyScunner 正在开发一款可在商用设备上直接运行的本地语音AI基础模型,以及由可轻松应用于各类领域的优化技术构成的引擎“GrassLand”。
FreelyScunner 首席执行官 Kim Kiyeon 表示:“本次研究成果是本地AI市场在受限资源环境下实现高性能所必需的关键技术。我们将持续高度化自研引擎 GrassLand,并在多个产业领域成功落地相关技术。”
本报道由人工智能(AI)翻译技术生成。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。