大语言模型应用场景下的数据泄露风险与防护策略研究
摘要
随着大语言模型(LLM)在各种应用场景中的广泛部署,数据泄露的风险日益成为业界关注的重点。本文
深入分析了大语言模型在处理敏感信息时可能存在的数据泄露风险,并探讨了一系列有效的防护策略。研究表明,
数据泄露主要源于模型训练过程中的数据暴露、模型推理时的信息泄露以及模型被恶意攻击的风险。为此,本文提
出了多种防护措施,包括但不限于使用差分隐私技术、部署安全多方计算(SMC)和加强数据治理等。通过实证分
析和对比研究,本文旨在为大语言模型的安全使用提供理论支持和实践指导。
深入分析了大语言模型在处理敏感信息时可能存在的数据泄露风险,并探讨了一系列有效的防护策略。研究表明,
数据泄露主要源于模型训练过程中的数据暴露、模型推理时的信息泄露以及模型被恶意攻击的风险。为此,本文提
出了多种防护措施,包括但不限于使用差分隐私技术、部署安全多方计算(SMC)和加强数据治理等。通过实证分
析和对比研究,本文旨在为大语言模型的安全使用提供理论支持和实践指导。
关键词
大语言模型;数据泄露;防护策略;差分隐私;安全多方计算
全文:
PDF参考
[1]李硕,马宁.MDD-TD:大语言模型文本来源及
内容真伪检测数据集[J].中国科学数据(中英文网络版),
1-11.
[2]张津源,李维嘉,黄俊杰.融合多模态大语言模
型的智能数据泄露溯源系统研究[J].中国信息化,2026,
(01):136-137.
[3]张宁,林黄奕,聂小成.信用违约与机器学习:
数据驱动的大语言模型因果推断方法[J].北方民族大学学
报,2026,(01):158-167.
[4]王雪钦,曹建彤.基于大语言模型与遗传算法的
数据价值评估与定价研究[J].现代信息科技,2026,10
(01):47-51+57.
[5]范瑞龙,达虎,李洋,崔娟,金瑞欣.基于大模
型敏感数据泄露风险的量化评估方法改进[J].科技创新与
应用,2025,15(34):123-127.
[6]范瑞龙,章恒,达虎,马鹏,李洋.针对大模型
应用的敏感数据泄露风险识别与评估框架[J].电子元器件
与信息技术,2025,9(07):1-4.
[7]钱汉伟,彭季天,袁明,高光亮,刘晓迁,王
群,朱景羽.影响预训练语言模型数据泄露的因素研究
[J].信息安全研究,2025,11(02):181-188.
[8]万林杰.大语言模型的数据安全风险及法律规制
[D].西南政法大学,2024.
Refbacks
- 当前没有refback。
