当前位置: 首页 > article >正文

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

https://github.com/sramshetty/ShortGPT/tree/main

My剪枝方案(暂定):

        剪枝目标:1.5B —> 100~600M

        剪枝方法:

                层粒度剪枝

                1、基于BI分数选择P%的冗余层,P=60~80

                2、对前N%冗余层,直接删除full layer。N=20(N:剪枝崩溃临界点,LLaMA2在45%,Mistral-7B在35%,Qwen在20%,Phi-2在25%)

                对后(P-N)%冗余层,删除attention layer。

                参考:


http://www.kler.cn/a/302738.html

相关文章:

  • 【数据结构与算法】第12课—数据结构之归并排序
  • Linux git-bash配置
  • ubuntu中apt-get的默认安装路径。安装、卸载以及查看的方法总结
  • 【Golang】Channel的ring buffer实现
  • 【Webpack实用指南】如何拆分CSS资源(2)
  • ❤React-React 组件通讯
  • 【JAVA入门】Day34 - Stream流
  • facebook广告和谷歌广告如何选择效果最大化?
  • eclipse配置maven
  • 第T11周:优化器对比实验
  • 【TCP】相关机制:异常处理
  • 泰州高新区法院多层面强化固定资产管理
  • 【数据结构篇】~排序(1)之插入排序
  • 众店绿色积分模式:引领消费新风尚,共筑商业新生态
  • 数据结构算法和算法分析
  • 数据结构第二周做题总结_顺序表
  • [000-01-008].第05节:OpenFeign高级特性-日志打印功能
  • C语言宏参数的使用
  • 【排序算法】之基数排序
  • 运维学习————GitLab的搭建和使用
  • 数组去重、数组扁平化
  • 解锁数字信任之门:SSL证书的安全之旅
  • uniapp业务实现
  • MATLAB-基于高斯过程回归GPR的数据回归预测
  • 解决CORS问题的两种方式——Django+vue
  • Linux中的scp 如何使用