当前位置：首页 > article >正文

【hugging face】bitsandbytes中8 bit量化的理解

article 2024/11/15 1:36:23

8 位量化使数十亿参数规模的模型能够适应更小的硬件，而不会降低性能。 8 位量化的工作原理如下：
1.从输入隐藏状态中按列提取较大值（离群值）。
2.对 FP16 中的离群值和 int8 中的非离群值执行矩阵乘法。
3.改变非异常值结果以将值拉回到 FP16，并将它们添加到 FP16 中的异常值结果中。
在这里插入图片描述

因此，本质上，我们执行矩阵乘法以节省精度，然后将非异常值结果拉回到 FP16，而非异常值的初始值和按比例缩小后的值之间没有太大差异。你可以看下面的例子

在这里插入图片描述

http://www.kler.cn/a/163138.html

相关文章：

qt QKeySequence详解

搭建Python2和Python3虚拟环境

Vue 3 介绍及应用

libcurl.net入门使用

Matlab: 生成对抗网络，使用Datastore结构输入mat格式数据

系统架构设计师论文：大数据Lambda架构

在oracle的scn详细说明

Kotlin 中密封类、枚举类与密封接口的对比分析

Linux——基本指令（一）

Nginx按指定格式记录访问日志

联邦多任务蒸馏助力多接入边缘计算下的个性化服务 | TPDS 2023

【LeetCode】28. 找出字符串中第一个匹配项的下标【字符串单模匹配：KMP算法】

Linux设备分类与设备号

Django讲课笔记01：初探Django框架

面试宝典之自我介绍

【嵌入式开发 Linux 常用命令系列 4.2 -- .repo 各个目录介绍】

集简云 x 零售企业丨快速集成有赞商城和微盛企微管家，实现私域运营自动化

YOLOv8分割训练及分割半自动标注

Android MVVM+coroutine+retrofit+flow+hilt

LSTM_预测价格问题_keras_代码实操

喜讯：加速度商城系统全系列产品品牌全新升级为Shopfa

Java工程找不到javax.xml.bind.annotation包

【flink番外篇】1、flink的23种常用算子介绍及详细示例（3）-window、distinct、join等

STM32 map文件详解

Kubernetes(K8s 1.27.x) 快速上手+实践，无废话纯享版

running小程序重要技术流程文档