当前位置: 首页 > article >正文

[论文笔记] ShortGPT Qwen2-0.5B-instruct Qwen2-1.5B-instruct 大模型剪枝

工作:

        把shortgpt的llama代码改成了Qwen的剪枝。
具体方法:

        用wikitext数据,计算每层的影响力分数即BI分数(1-层前后隐层状态余弦相似度),剪掉影响力低的P%的层数。


剪枝脚本:bash short_qwen_xin.sh
推理脚本:bash short_qwen_xin_test.sh

bash short_qwen_xin.sh

short_qwen_xin.sh

# 模型路径
model_names="/cpfs/074bqrkckm2dg5dq9nc/shared/AI-QIHUAN/OpenModels/Qwen2/Qwen2-0.5B-Instruct /cpfs/074bqrkckm2dg5dq9nc/shared/AI-QIHUAN/OpenModels/Qwen2/Qwen2-1.5B-Instruct"

# 遍历模型
# 遍历剪枝层数从1到20
for model_name in ${model_names};do
echo "[^.^] 模型名称为:${model_name}"
for prune_layers in {1..20};do
    echo 

http://www.kler.cn/news/302182.html

相关文章:

  • 总结拓展九:SAP数据迁移(1)
  • mfc140u.dll错误是什么情况?如何将mfc140u.dll丢失的解决方法详细分析
  • 攻防世界 CTF Pwn(一)
  • Codeforces practice /C++ 2024/9/11 - 2024/9/12
  • HTML + js 生成一个线路走向图,可以标记总共有多少站,用户到达第几站了
  • 惩罚矩阵?动态规划是如何爱上矩阵的
  • MyBatis 源码解析:OGNL 表达式解析与使用
  • 银行业务架构指导应用架构规划及设计方法
  • Redis单机、集群、哨兵、主从架构详解
  • 【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)
  • SpringBoot登录退出|苍穹外卖登录退出分析
  • 软硬链接与动静态库概览
  • 【Python机器学习】循环神经网络(RNN)——循环网络的记忆功能
  • 如何在Chrome中使用HTML构建交互式网页
  • sklearn-逻辑回归-特征工程示例
  • 深度学习-02 Pytorch
  • 安卓显示驱动
  • Flutter 响应式框架
  • Ubuntu20如何设置网络
  • 监控系统添加vcenter上的esxi主机
  • Kafka高吞吐量的原因
  • 苹果的“AI茅”之路只走了一半
  • Unity3D 自定义Debug双击溯源问题详解
  • 何为信创?信创有哪些?
  • FPGA技术赋能云数据中心:提高性能与效率
  • DevOps -分布式追踪与监控
  • 自定义Spring-start学习笔记
  • php转职golang第二期
  • 9.13学习记录
  • 分布式本地缓存 ehcache 缓存同步复制