当前位置: 首页 > article >正文

大模型LLM 在线量化;GPTQ\AWQ量化

1、大模型LLM 在线量化

参考:https://www.cnblogs.com/bruceleely/p/17348782.html

##8bit
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half(

http://www.kler.cn/a/133410.html

相关文章:

  • 除了 TON, 哪些公链在争夺 Telegram 用户?数据表现如何?
  • 【CICD】CICD 持续集成与持续交付在测试中的应用
  • 实验6记录网络与故障排除
  • linux常见资源查询命令(持续更新)
  • 相机光学(四十)——2x2 Adjacent Pixel Binning
  • 如何在手机上完整下载B站视频并保存到相册?
  • 记录将excel表无变形的弄进word里面来
  • 【Oracle 客户端连接数据库过程解析】
  • 云计算和跨境电商:数字化未来的基石
  • 科研小白成长记37——换档
  • 使用Pandas进行时间重采样,充分挖掘数据价值
  • 详细步骤记录:持续集成Jenkins自动化部署一个Maven项目
  • gittee启动器
  • 【网络奇遇记】那年我与计算机网络的浅相知
  • 数据结构及八种常用数据结构简介
  • 公共字段自动填充-@TableField的fill实现(2)
  • Qt/C++ 获取QProcess启动的第三方软件的窗体标题
  • 「Verilog学习笔记」根据状态转移表实现时序电路
  • Linux_安装docker
  • TS的函数如何定义类型
  • 【手写数据库toadb】SQL解析器的实现架构,create table/insert 多values语句的解析树生成流程和输出结构分析
  • 如何将vscode和Linux远程链接:
  • 节点导纳矩阵
  • redis命令记录
  • 【cpolar】Ubuntu本地快速搭建web小游戏网站,公网用户远程访问
  • 【开源】基于JAVA的大学兼职教师管理系统