当前位置: 首页 > article >正文

在CentOS服务器上部署DeepSeek R1

在CentOS服务器上部署DeepSeek R1,并通过公网IP与其进行对话,可以按照以下步骤操作:

一、环境准备
系统要求:
CentOS 8+(需支持AVX512指令集)。
硬件配置:
GPU版本:NVIDIA驱动520+,CUDA 11.8+。
CPU版本:至少16核处理器,64GB内存。
存储空间:原始模型需要30GB,量化后约8-20GB。
安装基础工具:
更新系统并安装必要的编译工具:

一定要买GPU服务器。

sudo yum update -y
sudo yum install -y cmake g++ python3-devel

二、安装Ollama及DeepSeek R1模型
安装Ollama核心组件:
curl -fsSL https://ollama.com/install.sh | sh
这里的下载速度可能会特别慢,建议自己配hosts。

安装模型转换工具:

pip3.8 install llama-cpp-python[server] --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cpu

这一步可能依赖版本,g++版本不兼容一直导致报错,建议通过docker方式进行部署。
我自己用的是pip3.8,可根据pip版本自行调整。

下载DeepSeek R1原始模型:


http://www.kler.cn/a/530004.html

相关文章:

  • B+ 树的实现原理与应用场景
  • DeepSeek r1本地安装全指南
  • 【oracle】分组求最新日期的数据
  • C++哈希(链地址法)(二)详解
  • kamailio的日志配置
  • 对比category_encoders库和sklearn库中的OrdinalEncoder
  • 使用 PyTorch 实现逻辑回归并评估模型性能
  • C#魔法秘籍:委托与事件,开启多态回调与消息派对之旅
  • openRv1126 AI算法部署实战之——Tensorflow模型部署实战
  • SQLite Update 语句详解
  • 我用Ai学Android Jetpack Compose之Card
  • Chapter2 Amplifiers, Source followers Cascodes
  • springCload快速入门
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.6 广播机制核心算法:维度扩展的数学建模
  • 亚博microros小车-原生ubuntu支持系列:19 nav2 导航
  • priority_queue
  • Kanass快速安装配置教程(入门级)
  • RK3568 wifi使用(使用Linux指令操作)
  • 每日一题——用两个栈实现队列
  • 一分钟深挖@Value注解和@ConfigurationProperities注解的区别
  • 基于SpringBoot的智慧康老疗养院管理系统的设计与实现(源码+SQL脚本+LW+部署讲解等)
  • Spring Boot Web项目全解析:Thymeleaf语法
  • 『 C 』 `##` 在 C 语言宏定义中的作用解析
  • 2.[网鼎杯 2020 朱雀组]phpweb
  • Android 开发:新的一年,新的征程
  • 【5. C++ 变量作用域及其深入探讨】