当前位置: 首页 > article >正文

windows下xinference无法加载本地大模型问题解决

一、打开C盘权限

1 打开【开始】菜单

2 找到windows工具,打开

3 找到命令行

4 右键

5 以管理员身份运行

6 输入:icacls frpc_windows_amd64_v0.2 /grant Users:(RX)

7 等待几分钟

二、创建软链接

以管理员身份在命令行运行下面命令

mklink /d E:\\XinferenceFiles\\cache\\custom-glm4-chat-pytorch-9b E:\\glm_4_9b_chat

启动成功:

C:\Windows\System32>mklink /d E:\\XinferenceFiles\\cache\\custom-glm4-chat-pytorch-9b E:\\glm_4_9b_chat
为 E:\\XinferenceFiles\\cache\\custom-glm4-chat-pytorch-9b <<===>> E:\\glm_4_9b_chat 创建的三、命令方式启动模型

1 在E:\glm_4_9b_chat下创建一个custom-glm4-chat.json配置文件

内容为:

{
  "version": 1,
  "context_length": 131072,
  "model_name": "custom-glm4-chat",
  "model_lang": [
    "en",
    "zh"
  ],
  "model_ability": [
    "chat",
    "tools"
  ],
  "model_family": "glm4-chat",
  "model_specs": [
    {
      "model_format": "pytorch",
      "model_size_in_billions": 9,
      "quantizations": [
        "4-bit",
        "8-bit",
        "none"
      ],
      "model_id": "THUDM/glm-4-9b-chat",
      "model_uri": "E:\\glm_4_9b_chat"
    }
  ]
}

2 启动xinference,执行下面命令

 xinference-local --host 127.0.0.0 --port 9997


3 打开inference的命令行,切换到大模型路径下E:\glm_4_9b_chat

4 注册模型

xinference register --model-type LLM --file custom-glm4-chat.json --persist

5 开启模型

xinference launch --model-name custom-glm4-chat --model-format pytorch --model-engine Transformers

参考链接:

【Gradio-Windows-Linux】解决share=True无法创建共享链接,缺少frpc_windows_amd64_v0.2_gradio share=true-CSDN博客

无错误!xinference部署本地模型glm4-9b-chat、bge-large-zh-v1.5_xinference加载本地模型-CSDN博客

使用xinference下载大模型之后存储的位置

:"E:\XinferenceFiles\modelscope\hub\ZhipuAI\glm-4-9b-chat\modeling_chatglm.py"


http://www.kler.cn/a/372050.html

相关文章:

  • 掌握软件工程基础:知识点全面解析【chap03、chap05、chap06、chap08、chap09】
  • 【Compose multiplatform教程12】【组件】Box组件
  • 15、【OS】【Nuttx】OS裁剪,运行指定程序,周期打印当前任务
  • 金融租赁系统的发展与全球化战略实施探讨
  • SuperMap iDesktopX填补三维可视化地图海岸地形
  • 芯片Tapeout power signoff 之IR Drop Redhawk Ploc文件格式及其意义
  • 网站安全,WAF网站保护暴力破解
  • ubuntu22.04安装向日葵
  • 【python GUI编码入门-03】掌握Tkinter如何高效绑定键盘和鼠标事件
  • 机器学习领域如何做小样本训练背后的原理和逻辑
  • HTML知识点汇总
  • 登录的时候密码使用crypto-js加密解密
  • 【毕业论文+源码】基于SSM(Spring + Spring MVC + MyBatis)的房屋租赁系统
  • Solidity智能合约中的异常处理error、require、assert
  • 物联网智能项目实战:智能温室监控系统
  • 嵌入式学习-网络-Day05
  • OpenCV 3D点到2D图像平面的投影
  • Spring Cache-基于注解的缓存
  • 【话题讨论】把握鸿蒙机遇:开发者的策略与实践
  • Manus在虚拟现实仿真模拟中的应用案例分享
  • 计算机网络和网络安全
  • SpringAOP:对于同一个切入点,不同切面不同通知的执行顺序
  • Linux系统用户和权限
  • 云舟观测:基于eBPF监控主机的TCP网络连接
  • AI与低代码的碰撞:企业数字化转型的新引擎
  • 54页可编辑PPT | 大型集团企业数据治理解决方案