当前位置: 首页 > article >正文

大语言模型安全威胁

文章目录

  • 基座安全
    • 一、大模型训练阶段
      • (1)训练环境安全风险
      • (2)训练环境隔离缺陷
    • 二、大模型部署阶段
      • (1)利用不安全系统配置
      • (2)CI&CD流程攻击
      • (3)部署环境组件供应链漏洞
    • 三、大模型应用阶段
      • (1)容器集群环境探测
      • (2)容器集群环境攻击
      • (3)LLMs拒绝服务&资源耗尽
  • 数据安全
    • 一、大模型训练阶段
      • (1)内部数据保护缺陷
      • (2)不正确&恶意外部数据源
      • (3)训练数据投毒
    • 二、大模型部署阶段
      • (1)备份数据窃取
      • (2)数据传输劫持
      • (3)数据存储服务攻击
      • (4)日志和审计记录窃取
      • (5)缓存数据&索引信息窃取
    • 三、大模型应用阶段
      • (1)元Prompt泄露
      • (2)模型反演攻击
      • (3)隐私数据窃取
      • (4)模型推理API数据窃取
      • (5)成员推断攻击
      • (6)API信息泄露
  • 模型安全
    • 一、大模型训练阶段
      • (1)模型后门
      • (2)预训练模型不安全依赖
    • 二、大模型部署阶段
      • (1)模型文件窃取
      • (2)模型参数篡改
    • 三、大模型应用阶段
      • (1)模型越狱攻击
      • (2)模型幻觉风险
      • (3)非合规内容输出
      • (4)商业违法输出
      • (5)模型功能滥用
      • (6)预训练模型信息窃取与攻击
      • (7)数据漂移
  • 应用安全
    • 一、大模型训练阶段
      • (1)第三方组件漏洞
      • (2)不安全的代码实践
    • 二、大模型部署阶段
      • (1)LLMs应用源代码窃取
      • (2)LLMs应用源代码投毒
    • 三、大模型应用阶段
      • (1)Prompt注入
      • (2)间接Prompt注入
      • (3)业务应用API利用
      • (4)CoT注入攻击
      • (5)关键字混淆
      • (6)对抗编码攻击
      • (7)反向诱导&抑制攻击
  • 身份安全
    • 一、大模型训练阶段
      • (1)训练环境缺少认证授权
      • (2)训练环境过度权限分配
      • (3)LLMs插件:权限管控设计缺陷
    • 二、大模型部署阶段
      • (1)滥用部署环境凭据
      • (2)向量数据库未授权访问
      • (3)未授权访问模型部署环境
    • 三、大模型应用阶段
      • (1)角色逃逸
      • (2)权限管控不当
      • (3)模拟对话攻击
      • (4)应用会话劫持
      • (5)账户劫持风险

基座安全

一、大模型训练阶段

(1)训练环境安全风险

  • 模型开发工具漏洞
  • 训练数据管理系统漏洞

(2)训练环境隔离缺陷

二、大模型部署阶段

(1)利用不安全系统配置

  • 环境隔离缺陷
  • 云平台多租户隔离失效

(2)CI&CD流程攻击

  • 模型部署服务漏洞
  • 模型镜像污染

(3)部署环境组件供应链漏洞

  • 容器&&集群系统漏洞
  • 向量数据库漏洞
  • 云平台安全漏洞

三、大模型应用阶段

(1)容器集群环境探测

(2)容器集群环境攻击

  • 代码解析器执行逃逸

(3)LLMs拒绝服务&资源耗尽

数据安全

一、大模型训练阶段

(1)内部数据保护缺陷

  • 个人隐私数据保护缺陷
  • 企业敏感数据保护缺陷
  • 机密敏感数据保护缺陷

(2)不正确&恶意外部数据源

  • 预训练模型数据偏见

(3)训练数据投毒

  • 对话语料投毒
  • 训练数据篡改

二、大模型部署阶段

(1)备份数据窃取

(2)数据传输劫持

(3)数据存储服务攻击

(4)日志和审计记录窃取

(5)缓存数据&索引信息窃取

三、大模型应用阶段

(1)元Prompt泄露

  • 假定场景泄露
  • 假定角色泄露
  • 关键字前后定位泄露

(2)模型反演攻击

  • 触发模型异常
  • 训练数据推导

(3)隐私数据窃取

  • 个人隐私数据窃取
  • 企业机密数据窃取

(4)模型推理API数据窃取

(5)成员推断攻击

(6)API信息泄露

模型安全

一、大模型训练阶段

(1)模型后门

  • 模型序列化后门
  • 预训练模型投毒

(2)预训练模型不安全依赖

二、大模型部署阶段

(1)模型文件窃取

(2)模型参数篡改

三、大模型应用阶段

(1)模型越狱攻击

  • DAN(Do Anything Now)
  • Many-shot越狱
  • 假定场景越狱
  • 假定角色越狱
  • 对抗性后缀攻击
  • 概念激活攻击

(2)模型幻觉风险

  • 事实性幻觉
  • 忠实性幻觉

(3)非合规内容输出

  • 虚假信息生成
  • 诱导&&不当言论
  • 带有偏见、仇恨、歧视或侮辱问题
  • 恐怖主义&&带有暴力倾向
  • 政治&&军事敏感问题
  • 敏感数据泄露

(4)商业违法输出

  • 知识产权版权侵犯

(5)模型功能滥用

  • 恶意代码生成
  • 钓鱼邮件生成
  • 图片信息伪造
  • 音频信息伪造
  • 视频信息伪造

(6)预训练模型信息窃取与攻击

  • 预训练模型家族探测
  • 预训练模型本体探测
  • 代理预训练模型创建
  • 对抗样本攻击

(7)数据漂移

应用安全

一、大模型训练阶段

(1)第三方组件漏洞

  • 数据处理组件漏洞
  • RAG开发框架漏洞

(2)不安全的代码实践

  • LLMs插件:不安全输入处理
  • LLMs应用传统漏洞风险
  • LLMs应用不安全输出处理
  • LLMs插件:业务过度代理

二、大模型部署阶段

(1)LLMs应用源代码窃取

(2)LLMs应用源代码投毒

三、大模型应用阶段

(1)Prompt注入

(2)间接Prompt注入

  • XSS会话内容劫持
  • 环路Agent蠕虫
  • 应用对话Memory攻击

(3)业务应用API利用

  • SSRF模型环境探测
  • 代码执行注入

(4)CoT注入攻击

  • 思维链干扰注入
  • 思维链操纵注入

(5)关键字混淆

  • 同义词替换攻击

(6)对抗编码攻击

(7)反向诱导&抑制攻击

身份安全

一、大模型训练阶段

(1)训练环境缺少认证授权

(2)训练环境过度权限分配

(3)LLMs插件:权限管控设计缺陷

二、大模型部署阶段

(1)滥用部署环境凭据

  • 公开服务API密钥利用

(2)向量数据库未授权访问

(3)未授权访问模型部署环境

三、大模型应用阶段

(1)角色逃逸

  • 假定场景逃逸
  • 假定角色逃逸
  • 遗忘法角色逃逸
  • Prompt目标劫持

(2)权限管控不当

  • 未授权访问模型
  • 利用云凭证非法访问云端模型
  • 账户越权访问

(3)模拟对话攻击

(4)应用会话劫持

(5)账户劫持风险


http://www.kler.cn/a/392418.html

相关文章:

  • 数据挖掘(九)
  • Qt_day4_Qt_UI设计
  • Jmeter性能测试 -3数据驱动实战
  • MySQL技巧之跨服务器数据查询:进阶篇-从A数据库复制到B数据库的表中
  • 21. Drag-Drop拖放操作(二) - 文件、表格和树的拖放实现
  • 【Vue】Vue3.0(十九)Vue 3.0 中一种组件间通信方式-自定义事件
  • [Docker#3] LXC | 详解安装docker | docker的架构与生态
  • Three.js 纹理与网格的优化
  • Linux将二进制软件包编译成rpm软件包教程详解
  • unity3d————四元数的计算
  • 【每日推荐】使用 Ollama 平台上的 Llama 3.2-vision 模型进行视频目标检测
  • 【PGCCC】Postgresql Toast 原理
  • Maven 构建项目
  • qt creator开发一个Linux 下运行的无界面的程序
  • 力扣617:合并二叉树
  • Cesium基础-(Entity)-(label )
  • 如何快速开发一套MES系统?
  • SpringBoot(八)使用AES库对字符串进行加密解密
  • 每日计划-1109
  • Git - 日志
  • Python+Appium编写脚本
  • TCP(上):成熟可靠的传输层协议
  • MySQL中指定字段的某个值排在前面
  • PET-文件包含-FINISHED
  • LeetCode每日一题1547---切棍子的最小成本
  • [Docker#6] 镜像 | 常用命令 | 迁移镜像 | 压缩与共享