个人信息委员会与AI初创企业座谈
拟发布《生成式AI引入与应用指南》
个人信息保护委员会开始着手支持国内开源人工智能(AI)生态系统。随着对国内AI企业而言,开源AI模型可能成为新机遇的判断不断出现,该委员会决定采取行动。
个人信息保护委员会委员长 Ko Haksoo 24日下午在首尔江南区创业联盟 Nspace(&Space)与人工智能(AI)初创企业相关人士会面时表示:“将予以支持,使开源的优势在韩国市场得以充分发挥,并进一步促成创新服务的诞生。”
3月24日下午,在首尔江南区Start-up Alliance举行的人工智能初创企业座谈会上,个人信息保护委员会委员长 Ko Haksoo 正在致开场辞。个人信息保护委员会提供
View original image开源是指公开程序源代码,使任何人都可以将其用于新的开发的一种形式。开源AI模型在降低成本负担的同时,任何人都可以接触到高性能AI模型,因为其运行原理、设计方式、算法等全部公开。Meta的“LLaMA”、DeepSeek的V3、R1等都属于开源模型。
随着开源模型技术水平的提升,其被认为可以提高AI初创企业的成本效率。Scatter Lab律师 Ha Juyeong 表示:“开发大型语言模型(LLM)所需成本过于庞大,而高性能的开源模型已经大量出现,反而使得自行开发的效用并不大”,“开源AI模型追赶闭源模型的趋势将会持续。”
个人信息保护委员会解释称,尽管我国在大规模AI基础设施方面相对不足,但拥有大量高质量数据和优秀AI人才,开源模型有可能成为我国的一大机遇。
实际上,以初创企业为中心,利用开源AI模型的情况正在增加。根据个人信息保护委员会进行的简易问卷调查,10家企业中有9家表示,曾经为内部研究或性能改进应用服务而使用过开源模型。10家企业中有6家表示,会利用自身持有的用户数据对开源模型进行追加训练,或通过检索增强生成(RAG)用于性能提升。所谓检索增强生成,是指通过检索外部数据库等,为提升大型语言模型性能而使其能够输出既准确又最新的回答的一项技术。
但在经过追加训练并实现商业化的过程中,可能会发生个人信息处理行为,因此需要注意。从企业立场来看,在利用开源模型的过程中也存在个人信息处理方面的担忧。
实际上,中国的DeepSeek曾因大范围收集用户个人信息并在没有明确期限的情况下予以保存而引发争议。此后,个人信息保护委员会通过协商,叫停了DeepSeek应用在韩国国内的新下载。Ko委员长当天在致辞中还表示:“个人信息保护委员会正在与DeepSeek方面沟通,协力将个人信息的不安因素降到最低。”
More AI事业总管 Lim Junghwan 表示:“希望能够强调在打造开源模型时使用了何种类型的数据、需要如何加以注意”,“也切实感受到有必要由政府机构出台适度的监管。”
个人信息保护委员会介绍了在“原则为基础的规制”框架下,提出具体数据处理标准的案例,并说明了为消除数据利用壁垒,近期通过第三次国家人工智能委员会发布的《AI数据扩充及开放扩大方案》的主要内容。
在随后进行的自由讨论中,与会企业表示,在将用户数据用于AI开发时,会出现法律不确定性问题。讨论过程中,企业提出了如下建议事项:▲为合法利用用户数据提供明确的法律标准指引 ▲给出匿名化、假名化数据处理的具体方法论 ▲制定对去标识化数据进行再识别评估的标准等。
个人信息保护委员会计划以本次座谈会结果为基础,从个人信息视角制定一份能够切实帮助中小企业和初创企业的《生成式AI导入与利用指南》。
Ko委员长表示:“为了推动我国具有竞争力的AI创新生态系统发展,有必要最大限度地利用开源的优势”,“今后将在国内机构和企业导入及利用开源AI的过程中,与中小企业和初创企业界紧密合作,努力将与AI和数据处理相关的风险因素降到最低。”
个人信息保护委员会委员长 Koh Haksoo(前排右起第四位)24日下午在首尔江南区 Startup Alliance 举行的人工智能初创企业座谈会上与与会者合影留念。个人信息保护委员会提供
View original image版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。