开放期刊系统

生成式人工智能内容安全风险分析与安全机制研究

周永礼, 张晓珂, 金霞
中国电子科技集团公司第十五研究所

摘要

生成式人工智能（AI）在推动内容创作、智能交互等领域创新便利的同时，潜藏多重内容安全风险。其中，
虚假信息生成传播呈现技术迭代快、传播链条短的特点，如AI生成的虚假视频可在短时间内引发舆论混乱；有害内
容产出呈现隐蔽化、场景化特征，通过提示词工程规避过滤机制，挑战社会伦理；数据安全与隐私泄露贯穿全生命
周期，训练数据违规使用、交互信息泄露等问题频发；在等级保护领域，还存在系统安全漏洞、日志审计缺失等合
规短板。这些风险根源在于模型黑箱性、数据训练源问题及人工干预瓶颈。对此，需构建“预生成过滤-实时检测-
事后追溯”的多层级审核机制，运用AI生成内容识别模型等技术防控工具，完善法规细则与行业自律公约，落实生
成合成标识双轨制，多维度防范风险，保障生成式人工智能安全有序发展。

关键词

生成式人工智能；内容安全；风险分析；安全机制

全文:

PDF

参考

[1]赵依桐，李小波.生成式人工智能的内容安全风

险及其治理路径研究——基于行动者网络理论的分析[J].

河南警察学院学报，2025，34（01）：102-116.

[2]杨冀龙.生成式人工智能的内容安全风险与应对

策略[J].中国信息安全，2024，（06）：38-41.

[3]张庆国.生成式人工智能内容安全风险分析与安

全机制探讨[J].人工智能，2024，（02）：79-86.

Refbacks

当前没有refback。

生成式人工智能内容安全风险分析与安全机制研究

摘要

关键词

全文:

参考

Refbacks

维图中文期刊

友情链接

联系维图

用户名
密码
记住我