当前位置: 首页 > article >正文

安装unsloth

我在llamafactory微调LLM,简单测了一些(很不精准),加速方法中unsloth比flash_attention速度快了40%,显存占用减少15%;

  1. 创建虚拟环境:conda create -n env_name python=3.10, 然后conda activate env_name
  2. 安装cudatoolkit:conda install cudatoolkit=12.1conda install nvidia/label/cuda-12.1.0::cuda-toolkit,可能失败
  3. 安装pytorch、triton和xformers:pip install torch==2.4.0 triton pip install xformers==0.0.27.post2 --index-url https://download.pytorch.org/whl/cu121(如果第二步失败,这步也会配上cuda环境)(嫌慢可以先去https://download.pytorch.org/whl/cu121把包下好,不过记得这几个包一起安装,不然可能会覆盖前面安装的,例如单独安装triton和xformers会下载cpu版torch)
  4. 安装unsloth:pip install "unsloth[cu121-torch240] @ git+https://github.com/unslothai/unsloth.git"或者pip install --upgrade --force-reinstall --no-cache-dir git+https://github.com/unslothai/unsloth.git
  5. 记得比对一下包的版本是不是如上所述,因为有的包可能会把依赖包卸了装个新的。。(包不太容易安装,依赖很复杂,所以不建议用--no-deps--ignore-installed等方式)

第5步有大佬在博客说要装ampere,我是没装也能用(尝试装了下,在flash-attn那里卡住了),仅供参考:pip install "unsloth[cu121-ampere-torch240] @ git+https://github.com/unslothai/unsloth.git"


http://www.kler.cn/a/598974.html

相关文章:

  • 实战经验:Gone 框架模块化改造中的 go work 反思
  • TCP | 序列号和确认号 [逐包分析] | seq / ack 详解
  • 工业软件的破局与重构:从技术依赖到自主创新的未来路径
  • 连接chatgpt的桌面语音助手
  • 单片机开发资源分析实战——以STM32F103ZET6为例子,分析我们的单片机
  • Binder机制源码分析
  • 详细解析格式化消息框的代码
  • Python Web 框架之 Flask
  • 精密矫平机:解锁工业制造的“平整密码”,打造零瑕疵的金属艺术
  • PHP基本知识
  • 【IDEA】 配置安装 Leetcode 插件
  • 奇迹科技:蓝牙网关赋能少儿篮球教育的创新融合案例研究
  • CentOS与LAMP详解:从概念到实战!!!
  • Redis 内存淘汰策略
  • Python Cookbook-4.8 二维阵列变换
  • 前后端+数据库的项目实战:hbu迎新网-较复杂(下)javaweb
  • 蓝桥备赛(23)算法篇【枚举】
  • Hive与Spark的UDF:数据处理利器的对比与实践
  • 什么是量化?BERT 模型压缩的秘密武器
  • 深度解读DeepSeek:开源周(Open Source Week)技术解读