您好,欢迎来到皮书数据库! | 皮书网首页
登录|注册 |无障碍阅读
国家知识资源服务中心 CARSI
您现在所在的位置:首页  > 中国经济发展数据库
通用人工智能安全技术进展
报告字数:27101字 报告页数:26页
摘要
本报告首先综述了大型语言模型(LLM)安全技术的最新进展,剖析了各类主要风险,涵盖对抗性攻击、数据安全与投毒攻击、隐私泄露风险、价值对齐与滥用风险以及新兴威胁;分析了覆盖LLM全生命周期的防御缓解策略,涉及数据清洗与隐私保护、安全对齐与对抗训练、输入输出过滤与检测以及模型审计与修复等。其次,探讨了用于评估模型安全性和可信赖性的方法和基准,包括红队测试方法、基于LLM的评估等;报告还结合负责任人工智能的原则和治理框架进行讨论,涉及伦理考量与偏见问题、透明度与可解释...
>>
作者简介

邹权臣: 暂无简介

相关报告
文章目录