SOCAR在自然语言处理领域世界顶级学会上获得了人工智能(AI)技术实力的认可。
SOCAR表示,由AI团队(团队长 Park Kyungho、经理 Kim Hyunsu、经理 Cho Chunghyun、经理 Won Haejin)提交并被自然语言处理领域最高权威学会“EMNLP 2023”录用的论文获得了优秀奖,此消息于8日公布。
EMNLP(Empirical Methods in Natural Language Processing,基于经验方法的自然语言处理)被认为是自然语言处理(NLP,Natural Language Processing)领域最顶级的国际学术会议之一。在EMNLP上,主要讨论以语言数据为基础的人工智能研究,如AI翻译、机器阅读理解、翻译等。今年6日至10日在新加坡举行的“EMNLP 2023”上,Google DeepMind、Microsoft Research等知名AI企业均有参与。
SOCAR AI团队于7日参加了多语言表征学习(MRL,Multilingual Representation Learning)研讨会,分享了可在多种语言中应用的多语言语言处理技术研究成果。SOCAR AI团队提出了题为“利用小规模语言数据进行多语言语音基础模型训练方法(Adapt and Prune Strategy for Multilingual Speech Foundation Model on Low-resourced Languages)”的方案,介绍了如何从拥有数十亿到数千亿参数的巨型模型中仅提取必要参数,从而在新的语言或领域中仍能保证性能的案例。
SOCAR AI团队提出的方法首先利用名为“Lottery Ticket Hypothesis”的轻量化技术,从巨型模型中仅提取与目标语言相关的参数。提取出的参数包含与目标语言有关的语法及高层次语言特性,因此即便参数数量较少,也足以解决多种问题。进一步而言,为了额外学习与特定领域相关的知识,该方法采用低秩适配(LoRA,Low-Rank Adaption)技术。通过LoRA技术,仅用约2%的参数即可进行训练,在较少计算资源的情况下也能实现与以往相似的性能。
团队长 Park Kyungho表示:“能够在享有最高权威的学会上分享SOCAR研究的语音语言基础模型,意义重大,也期待此次论文成果能作为自然语言学习模型研究的参考文献加以利用。今后我们将通过持续研究,一方面提升SOCAR出行服务的效率,另一方面也努力将其应用于为用户提供更加合理、便捷的出行体验。”
另一方面,SOCAR AI团队今年在EMNLP、国际表征学习会议(ICLR,International Conference on Learning Representations)等知名国际学会上共发表约7篇研究论文,这些研究成果正被应用于各类AI产品。其中,本次研究结果也被应用于SOCAR将于2024年推出的基于人工智能的联络中心(AICC,AI-based Contact Center)产品,在降低构建语音语言基础模型所需计算资源方面发挥了作用。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。