当前位置: 首页 > article >正文

大模型LLM 在线量化;GPTQ\AWQ量化及推理

1、大模型LLM 在线量化

参考:https://www.cnblogs.com/bruceleely/p/17348782.html

##8bit
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half(

http://www.kler.cn/news/136551.html

相关文章:

  • testing包
  • LearnOpenGL之3D模型加载
  • Discuz发布原创AI帖子内容生成:起尔 | AI原创帖子内容生成插件开发定制
  • FreeSSl 申请免费证书,ACME实现自动化续期(https证书自动续期)
  • 关于写删除接口的一些理解
  • SELinux中的安全标记与强制访问控制
  • Windows 安装 Docker
  • PostgreSQL数据库结合内网穿透实现公网远程连接
  • 2023年中职“网络安全“—Linux系统渗透提权③
  • 如何快速将txt类型的日志文件转换为excel表格并进行数据分析报表统计图(如:饼图、折线图、柱状图)?
  • WPS或Excel查找A列中有B列没有的值
  • synchronized锁膨胀过程
  • 第四代智能井盖传感器,实时守护井盖位安全
  • IF:9.0+期刊被踢除,11月SCI/SSCI期刊目录已更新!
  • 上下文切换
  • 基于龙格-库塔算法优化概率神经网络PNN的分类预测 - 附代码
  • RESTful API 设计指南——为什么要用(上)
  • Ubuntu——卸载、安装CUDA
  • Linux编辑器-gcc/g++使用
  • C#的类型转换
  • 代码随想录算法训练营第六十天 | LeetCode 84. 柱状图中最大的矩形
  • Android13 新增 Stable AIDL接口
  • 海外服务器相较于国内服务器有何特点?亚马逊海外服务器为何零跑全球
  • 电池管理系统设计与实现
  • uniapp小程序相关记录
  • React Native项目接入Sentry指南