大语言模型应用场景下的数据泄露风险与防护策略研究

程 芳1, 尹 毕成1, 肖 广地2
1、中国电子科技集团公司第十五研究所信息产业信息安全测评中心
2、中国网络安全审查认证和市场监管大数据中心

摘要


随着大语言模型(LLM)在各种应用场景中的广泛部署,数据泄露的风险日益成为业界关注的重点。本文
深入分析了大语言模型在处理敏感信息时可能存在的数据泄露风险,并探讨了一系列有效的防护策略。研究表明,
数据泄露主要源于模型训练过程中的数据暴露、模型推理时的信息泄露以及模型被恶意攻击的风险。为此,本文提
出了多种防护措施,包括但不限于使用差分隐私技术、部署安全多方计算(SMC)和加强数据治理等。通过实证分
析和对比研究,本文旨在为大语言模型的安全使用提供理论支持和实践指导。

关键词


大语言模型;数据泄露;防护策略;差分隐私;安全多方计算

全文:

PDF


参考


[1]李硕,马宁.MDD-TD:大语言模型文本来源及

内容真伪检测数据集[J].中国科学数据(中英文网络版),

1-11.

[2]张津源,李维嘉,黄俊杰.融合多模态大语言模

型的智能数据泄露溯源系统研究[J].中国信息化,2026,

(01):136-137.

[3]张宁,林黄奕,聂小成.信用违约与机器学习:

数据驱动的大语言模型因果推断方法[J].北方民族大学学

报,2026,(01):158-167.

[4]王雪钦,曹建彤.基于大语言模型与遗传算法的

数据价值评估与定价研究[J].现代信息科技,2026,10

(01):47-51+57.

[5]范瑞龙,达虎,李洋,崔娟,金瑞欣.基于大模

型敏感数据泄露风险的量化评估方法改进[J].科技创新与

应用,2025,15(34):123-127.

[6]范瑞龙,章恒,达虎,马鹏,李洋.针对大模型

应用的敏感数据泄露风险识别与评估框架[J].电子元器件

与信息技术,2025,9(07):1-4.

[7]钱汉伟,彭季天,袁明,高光亮,刘晓迁,王

群,朱景羽.影响预训练语言模型数据泄露的因素研究

[J].信息安全研究,2025,11(02):181-188.

[8]万林杰.大语言模型的数据安全风险及法律规制

[D].西南政法大学,2024.


Refbacks

  • 当前没有refback。