当前位置: 首页 > article >正文

深度学习-77-大模型量化之Post Training Quantization训练后量化PTQ

文章目录

  • 1 PTQ
    • 1.1 动态量化
    • 1.2 静态量化
  • 2 四位量化的领域
    • 2.1 GPTQ
    • 2.2 GGUF(可用CPU)
    • 2.3 定点量化技术
  • 3 参考附录

1 PTQ

训练后量化 :Post-Training Quantization (PTQ),模型训练完成后进行量化。
较流行的量化技术的方法之一是post-training quantization(PTQ),是指在训练后对模型参数中的权重和激活进行量化处理。

在PTQ方法中, 激活值的量化需要通过模型推断来获取其潜在分布,因为其数值范围在推理前处于未知状态。

激活值的量化有两种主要形式:
(1)Dynamic Quantization 动态量化
(2)Static Quantization 静态量化

1.1 动态量化

数据在流转过程中经过激活函数后,其activations被存储:
在这里插入图片描述
使用activations的分布来计算量化时所需要的零点z值和比例因子s值。
假设某层activations分布中的最大值为α,最小值为β,则z、s以及量化后的数值计算如下:


http://www.kler.cn/a/450191.html

相关文章:

  • mysql 查询优化之字段建立全文索引
  • Spring Boot 中的 @Scheduled 定时任务以及开关控制
  • 环网冗余CAN转光纤 CAN光端机在风电项目应用
  • VSCode 搭建Python编程环境 2024新版图文安装教程(Python环境搭建+VSCode安装+运行测试+背景图设置)
  • 被裁20240927 --- 嵌入式硬件开发 前篇
  • CAN201 Introduction to Networking(计算机网络)Pt.1 导论和应用层
  • 嵌入式硬件产品:CC254x 蓝牙升级
  • 机器学习之 KNN 算法
  • Axios 取消上一次重复请求
  • DELL EMC Unity 存储系统扩容之如何查看pool类型
  • Java 异常
  • Next.js 14 数据处理:从服务端组件到状态管理的最佳实践
  • Vue.js前端框架教程11:Vue监听器watch和watchEffect
  • MATLAB直接推导函数的导函数和积分形式(具体方法和用例)
  • JAVA开发 在 Spring Boot 中集成 Swagger
  • 人的心理特征
  • PMO转型提升汽车销售效率:看板工具的关键作用
  • 关于 K8s 的一些基础概念整理-补充【k8s系列之二】
  • 石岩基督教福音堂
  • 【CryptoJS库AES加密】
  • 蓝牙协议——音乐启停控制
  • sward - 一款国产开源免费的企业级知识库管理工具
  • SOME/IP 协议详解——信息格式
  • 构建安全的用户认证系统:PHP实现
  • Ubuntu下通过Docker部署NGINX服务器
  • 如何实现一个充满科技感的官网(一)