生成式人工智能内容安全风险分析与安全机制研究

周 永礼, 张 晓珂, 金 霞
中国电子科技集团公司第十五研究所

摘要


生成式人工智能(AI)在推动内容创作、智能交互等领域创新便利的同时,潜藏多重内容安全风险。其中,
虚假信息生成传播呈现技术迭代快、传播链条短的特点,如AI生成的虚假视频可在短时间内引发舆论混乱;有害内
容产出呈现隐蔽化、场景化特征,通过提示词工程规避过滤机制,挑战社会伦理;数据安全与隐私泄露贯穿全生命
周期,训练数据违规使用、交互信息泄露等问题频发;在等级保护领域,还存在系统安全漏洞、日志审计缺失等合
规短板。这些风险根源在于模型黑箱性、数据训练源问题及人工干预瓶颈。对此,需构建“预生成过滤-实时检测-
事后追溯”的多层级审核机制,运用AI生成内容识别模型等技术防控工具,完善法规细则与行业自律公约,落实生
成合成标识双轨制,多维度防范风险,保障生成式人工智能安全有序发展。

关键词


生成式人工智能;内容安全;风险分析;安全机制

全文:

PDF


参考


[1]赵依桐,李小波.生成式人工智能的内容安全风

险及其治理路径研究——基于行动者网络理论的分析[J].

河南警察学院学报,2025,34(01):102-116.

[2]杨冀龙.生成式人工智能的内容安全风险与应对

策略[J].中国信息安全,2024,(06):38-41.

[3]张庆国.生成式人工智能内容安全风险分析与安

全机制探讨[J].人工智能,2024,(02):79-86.


Refbacks

  • 当前没有refback。