llm_safety

大模型安全攻防完全指南

前言

本教程面向资深程序员和AI科学家,系统性地探讨大语言模型(LLM)的安全攻防技术。我们不仅覆盖LLM自身的安全问题,还深入探讨如何利用LLM解决传统计算机安全领域的挑战。

本书特色

如何使用本书


第一部分:基础理论与威胁模型

第1章:LLM安全概述与威胁景观

第2章:提示注入攻击原理

第3章:越狱技术深度剖析

第4章:模型逆向与信息提取


第二部分:高级攻击技术

第5章:对抗样本与优化攻击

第6章:后门与供应链攻击

第7章:多模态模型攻击

第8章:多智能体与复合攻击

第9章:工具调用型LLM的系统级攻击

第10章:搜索增强型LLM的信息战攻击


第三部分:防御机制与安全加固

第11章:防御策略与安全对齐

第12章:形式化验证与鲁棒性保证


第四部分:LLM赋能传统安全

第13章:二进制分析与逆向工程

第14章:自动化去混淆技术

第15章:侧信道分析与信号处理

第16章:漏洞挖掘与利用生成

第17章:恶意软件分析与威胁情报

第18章:新兴威胁与研究方向


第五部分:工具、实战与案例分析

第19章:安全研究工具与框架

第20章:重大安全事件深度剖析


附录

附录C:术语表与参考文献


关于作者与贡献

本教程由安全研究社区共同维护。欢迎提交问题报告和改进建议。

最后更新: 2025年1月

版权声明: 本教程采用 CC BY-SA 4.0 许可证