开发评估指标衡量金融AI服务适配LLM
利用29项评估指标和1200个数据集
LG CNS表示,公司已为计划引入生成式人工智能(AI)的金融企业开发出一款金融定制型AI评估工具。
该评估工具利用预先构建的数据集,对市面上公开的数十种开源大语言模型(LLM)进行评估,从而为银行、保险、证券等各类金融服务筛选出最适合的AI模型。开源LLM公开源代码和算法,任何人都可以使用。LG人工智能研究院的EXAONE 3.5、Meta的Llama、阿里巴巴的Qwen 2.5等都属于开源LLM。
金融企业出于数据泄露等安全原因,在引入AI时,会在开源LLM基础上对其进行额外数据训练,构建自有模型,如此打造出的模型会根据使用目的进行专项化。OpenAI的ChatGPT、谷歌的Gemini等封闭式LLM由于源代码未公开,企业无法将其打造成自有AI模型加以利用。
LG CNS的金融专项评估工具由29项评估指标和约1200个数据集构成。主要评估项目包括基于金融知识的推理能力、数学推理能力、复杂问题理解力、文档摘要能力、金融术语理解度以及AI代理(Agent)使用能力等,并对这些能力进行综合测试。尤其是将AI较难作答的金融相关推理题目应用到29项评估指标中,使性能验证成为可能。
LG CNS与金融专家协同合作,在检查评估数据是否充分反映了金融一线实际使用的服务信息和专业知识的基础上,不断提升工具的完善度。通过这一过程,可以判断AI在涉及金融监管要求或复杂服务结构时,能否给出准确回答。
LG CNS社长 Hyun Singyun 表示:“希望在金融服务中导入生成式AI的企业,最大困扰在于如何判断哪一种AI模型最适合自身服务。LG CNS的金融专项AI评估工具将成为帮助金融企业快速解决这一难题的最佳解决方案。”
另一方面,LG CNS近期已与NH农协银行启动生成式AI平台构建项目,并正在与新韩卡公司共同建设基于生成式AI的客服坐席应答系统。去年,公司与新韩银行合作开发了基于大语言模型(LLM)的未来型营业网点“AI Branch”,并为KB金融集团构建并运营了融合AI、云计算等数字技术的未来型客户中心(Future Contact Center,FCC)。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。