当前位置: 首页 > article >正文

【deepseek】Ubuntu/centos系统中无法直接git clone下载模型的解决方法(手动下载)

问题描述:

在Ubuntu/centos系统中由于在大多数情况下无法科学上网从而无法登录huggingface录入access token下载模型,
常规理论操作如下

# 1. 安装 huggingface_hub (如果尚未安装)
pip install huggingface_hub

# 2. 登录 Hugging Face
huggingface-cli login

# 3. 安装 Git LFS (如果尚未安装)
sudo apt-get update
sudo apt-get install git-lfs
git lfs install

# 4. 克隆模型仓库
git clone https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat

# 5. 下载模型文件
cd deepseek-llm-7b-chat
git lfs pull

由于无法科学上网报错如下
在这里插入图片描述


问题确认:

ping不通huggingface:

ping huggingface.co

可以ping通百度:

ping baidu.com

在这里插入图片描述


解决方案:

由于无法通过 huggingface-cli login 登录,并且无法直接 git clone Hugging Face 上的模型,可以通过设置 HF_ENDPOINT 环境变量来使用镜像网站下载模型。

1. 设置 HF_ENDPOINT 环境变量:

在终端中设置 HF_ENDPOINT 环境变量,指向 Hugging Face 镜像站点。

export HF_ENDPOINT=https://hf-mirror.com

这告诉 huggingface_hub 库使用 https://hf-mirror.com 作为 Hugging Face Hub 的替代端点。

2. 使用 huggingface_hub 库下载模型:

由于无法使用 git clone 命令,需要使用 huggingface_hub 库中的 snapshot_download 函数来下载模型。

首先,需要创建一个 Python 脚本(例如 download_model.py),并在其中使用 snapshot_download 函数:

from huggingface_hub import snapshot_download

model_id = "deepseek-ai/deepseek-llm-7b-chat"  # 模型 ID
local_dir = "./deepseek-llm-7b-chat"  # 本地保存目录 (可选)
local_dir_use_symlinks = False # 是否使用符号链接 (可选)

try:
    snapshot_download(
        repo_id=model_id,
        local_dir=local_dir,
        local_dir_use_symlinks=local_dir_use_symlinks,
        cache_dir="./.cache" # 设置缓存目录 (可选)
    )
    print(f"模型 {model_id} 成功下载到 {local_dir}")
except Exception as e:
    print(f"下载模型时出错: {e}")
    print("请检查你的网络连接和 HF_ENDPOINT 环境变量。")
    print("如果问题仍然存在,请尝试使用其他镜像站点或代理服务器。")

注意:

  • 请将 model_id 替换为你想要下载的deepseek模型的实际 ID。
  • 根据需要修改 local_dirlocal_dir_use_symlinks 参数。

3. 运行 Python 脚本:

在终端中运行 Python 脚本:

python download_model.py

结果展示:

成功下载模型,可进行后续部署操作:

在这里插入图片描述


http://www.kler.cn/a/556428.html

相关文章:

  • js面试八股
  • ESP32 websocket-client
  • DuodooBMS源码解读之 purchase_change 模块
  • ABAP数据库表的增改查
  • 深入理解 SQL 注入漏洞及解决方案
  • QTextEdit达到指定行数自动清理+光标移动到末端(QT/C++)
  • 【CXX】4.1 CXX与Cargo集成配置详解
  • DeepSeek04-导出导入模型文件
  • Bootstrap Blazor UI 中 <Table> 组件 <TableColumn> 使用备忘01:EF Core 外码处理
  • Could not download npm for node v14.21.3(nvm无法下载节点v14.21.3的npm)
  • SeaTunnel社区「Demo方舟计划」首期活动上线—— MySQL CDC实时同步至PostgreSQL实战
  • Android 底层判断/dev/video节点是否是可用摄像头
  • 机器学习实战(10):深度学习初探——卷积神经网络(CNN)
  • Python连接MySQL数据库完全指南
  • 【Linux】命名管道------Linux进程间通信的桥梁
  • AI时代前端工程师的自主学习:挑战与机遇
  • MySQL 5.7优化
  • MySQL(1)基础篇
  • C语言预处理学习笔记
  • Web入侵实战分析-常见web攻击类应急处置实验2