专访 ETRI 研究中心主任 Lee Yeonhee
负责推进开发 AI 税收预测模型

目标打造虚拟经济同步系统
为多种政策实验奠定基础

“关键在于提供高质量数据”
未来有望应用于就业与福利领域

近几年在大规模税收预测误差持续出现的背景下,政府正在开发一套基于人工智能(AI)的高精度、实时税收预测系统。牵头相关研究的人物是韩国电子通信研究院(ETRI)财政·经济政策智能研究中心主任 Lee Yeonhee。Lee主任表示,其目标是“打造一个资金流动与现实相似的虚拟世界,在这个空间中预测税收并试验相关政策,逐步构建这样的基础”。


Lee主任从去年启动试点研究,今年开始正式投入相关课题的研究执行。如果说今年主要聚焦在法人税上,那么明年则计划将适用范围扩大到所得税和增值税等其他税目。她指出,为实现成功开发,必须获取作为“燃料”的数据,但由于个人信息保护、安全等原因,数据获取困难且出现“数据孤岛”现象,这些都是当前面临的难题。以下是与Lee主任的一问一答。


24日,在大田ETRI办公室,韩国电子通信研究院财政·经济政策智能研究中心主任Lee Yeonhui接受《亚洲经济》采访。金平和 记者提供

24日,在大田ETRI办公室,韩国电子通信研究院财政·经济政策智能研究中心主任Lee Yeonhui接受《亚洲经济》采访。金平和 记者提供

View original image

-是什么契机促使您投入税收预测AI系统的开发?


▲大约在2020年,我在ETRI担任开发AI平台的研究室室长,当时正在推进下一代数字预算会计系统(dBrain)项目的企划财政部,向我征求如何将AI技术用于预测工作的咨询意见。当时我们做过一个具有前期研究性质的小型项目。随后从去年4月起,我们用9个月时间开展了关于税收预测的前期研究,而真正以AI为基础开展税收预测研究开发(Research and Development)的课题,则是从今年1月正式启动的。


-具体在执行什么样的课题?


▲我们正在开展的课题,是将信息通信技术(Information and Communication Technology)与AI技术相结合,构建一个与现实高度相似、并持续与现实同步的虚拟经济系统,在其中开展各类政策实验和预测工作。通俗来讲,就是打造一个资金流动方式与现实最为接近的虚拟世界。我们的目标,是利用大语言模型(Large Language Model,LLM)技术和可解释的时间序列预测技术,在保证按月预测时效性的同时,精细到可以看出某一特定企业对税收有何贡献的程度,从而建设一套高精度的AI税收预测系统。目前,在开发AI税收预测系统的过程中,我们正向企划财政部共享有助于法人税预测的企业层面预测结果等内容。政府在发布税收预测值前,通常会征求各方专家意见,AI在其中也相当于发挥一种“专家”的作用。


-听说在诸多税目中,您特别关注法人税?


▲一开始并不是点名从法人税入手。只是很难在所有税目上同时大幅提高预测的时效性和准确性,因此我们先聚焦在国家层面最为头疼的法人税。当时法人税预测误差较大,所以决定先从快速估算法人税的研究做起。


-法人税在其他国家也被视为误差较大的税目。有人认为,这是因为难以预测包括半导体在内的主要企业业绩。


▲我们的目标并不是去预测完全未知的遥远未来,而是在当前时点尽可能多地获取可观测数据,基于这些数据进行快速估算,构建高精度的实时税收预测。由于海量数据实时产生,非结构化数据不可避免地会出现,而能够处理这类数据的技术只有AI,因此我们必须加以利用。为此,我们正在努力尽可能获取更加微观、更加及时的数据并加以运用。


-是否也在考虑法人税之外的其他税目研究?


▲我们在思考,是否也能在所得税或增值税方面发挥一定作用。随着研究推进,我们将根据在政策层面上日益重要的议题,适时调整研究方向。


-研究何时能完成?


▲整个研究课题周期为5年,今年是第一年。年初我们制定了计划:今年先在法人税上进行应用,观察是否具备向其他税目扩展的可能性,并据此规划明年的执行方案。到目前为止,整体进展并未大幅偏离预期范围。我们正在基于目前采用的方法进一步强化技术,寻找取得更好结果的路径。未来若要将研究扩展到其他税目,还面临一个课题,就是要配备足够数量、能够处理相关数据的高素质研究人员。今后5年,我们将持续推进工作,朝着提高预测时效性和精度的模型方向演进。


-研究过程中有哪些困难?


▲人们一提到AI,往往认为只要给出问题就能全部解决,但关键在于要为AI提供合适的“燃料”(数据)。通过前端的数据管线,让AI看到哪些数据、如何在适当时点进行清洗并传递给AI,这一点至关重要。只是即便我们是在为政府政策开展课题,数据获取仍然并不容易。政府所掌握的数据中,存在一些接近“标准答案”的历史高分辨率数据,理论上是可以获取的,但受个人信息保护等各类问题限制,连接触都十分困难。此外,行政数据往往按部门、科室分别生产,导致出现各自为政的数据孤岛问题。并且,政府数据很多只是未经充分清洗的抽象化结果。不是常说,政府生产的资料和文书中有75%到80%是无法直接用于AI的吗?


-最终目标是什么?



▲目前我们所做的,是快速获取实时数据并进行迅速估算,但政府最终想做的,是在施加某项具体政策后,能够预测会产生怎样的结果。而在国家政策层面要把握税收等整体情况,不能只看零散的局部。因此,我们正思考如何尽可能以较高分辨率重构整个国家,将真实数据嵌入其中,并在这个虚拟环境中实施政策,从而观察不同时点的变化趋势。未来,这一系统不仅可以用于税收和财政领域,还有望拓展到就业、福利、环境等多个领域加以应用。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。