“无需把人脸上传服务器也能生成吉卜力风格”……UNIST开发防止隐私侵害的人工智能

Published 09 Apr.2025 10:55(KST)

Updated 31 Jul.2025 16:06(KST)

open/close

Yoo Jaejun教授团队：通信成本降性能升…开发超轻量联邦学习AI“PRISM”

可应用于医疗、金融、个人移动AI等，被三大人工智能学会之一ICLR 2025录用

一种无需将敏感数据直接发送到服务器、即可帮助生成高质量图像的超轻量级人工智能模型已经被开发出来。

在患者磁共振成像（MRI）、计算机断层扫描（CT）分析等个人信息保护至关重要的环境中，安全地利用高性能生成式人工智能的途径由此打开。

UNIST人工智能研究生院的 Yoo Jaejun 教授团队开发出了联邦学习人工智能模型“PRISM”（PRivacy-preserving Improved Stochastic Masking）。

研究团队成员、第一作者研究员 Seo Kyungguk（左）与教授 Yoo Jaejun。UNIST 提供

联邦学习是一种技术：不把包含敏感信息的数据直接上传到服务器，而是让各自设备上的“本地人工智能”先进行学习，再只汇总其学习结果，构建为一个“全局人工智能”。

PRISM是在联邦学习过程中，起到连接本地人工智能与全局人工智能的学习中介作用的人工智能模型。与现有模型相比，它平均可将通信成本降低38%，模型大小则缩减48%，达到1比特级别的超轻量化，因此在智能手机、平板电脑等小型设备的中央处理器和内存上运行时几乎没有负担。

此外，即使各本地人工智能所拥有的数据和性能差异很大，该模型也能准确判断应当更信任并反映哪些本地人工智能的信息并进行协调，因此最终生成物的质量更高。

例如，以前把“自拍照”转换成吉卜力风格图像时，需要先把照片上传到服务器，存在个人信息被侵犯的隐忧；而利用PRISM，则所有处理都在智能手机内部完成，既可防止隐私被侵犯，又能更快获得结果。但前提是，仍需另外开发能够在智能手机上直接生成图像的本地人工智能模型。

研究团队利用用于验证人工智能性能的数据集MNIST、FMNIST、CelebA、CIFAR10进行了实验，结果显示，在通信量更少的同时，图像生成质量却比既有方法更高。尤其是在使用MNIST数据集的追加实验中，还验证了与主要用于生成吉卜力风格图像的扩散模型之间的兼容性。

研究团队没有采用共享全部信息的大规模参数方式，而是应用仅筛选重要信息进行共享的二值掩码方式，提高了通信效率。

同时，通过引入精细评估生成质量的损失函数——最大平均差异（MMD，Maximum Mean Discrepancy），以及以不同权重统计各本地人工智能贡献度的策略——掩码感知动态聚合（MADA，Mask-Aware Dynamic Aggregation），消除了数据偏差和学习不稳定性。

利用数据集进行生成式图像对比。

Yoo Jaejun 教授表示：“这一模型不仅可以用于图像，还可应用于文本生成、数据仿真、自动文档化等多种生成式人工智能领域”，“在医疗、金融等处理敏感信息的领域，将成为高效且安全的解决方案。”

本次研究由延世大学 Han Dongjun 教授共同参与，UNIST研究员 Seo Kyungkuk 作为第一作者参与了研究。

研究成果已被世界三大人工智能学术会议之一的2025年国际表征学习会议（ICLR，The International Conference on Learning Representations）录用。2025年ICLR将于4月24日至28日在新加坡举行，为期5天。

本研究在科学技术信息通信部韩国研究财团、信息通信企划评价院以及UNIST超级计算中心的支持下完成。

本报道由人工智能(AI)翻译技术生成。