当前位置: 首页 > article >正文

【AI】DeepSeek来了!!!

目录

1 DeepSeek简介

2 如何在本地环境中部署和运行 DeepSeek V3 模型?

■ 基本要求

■ 代码和模型

▲ 克隆仓库并安装依赖

▲ 下载模型权重

▲ 部署方案



1 DeepSeek简介

DeepSeek 在国产 AI 领域是一股清流。它专注于技术研发,以卓越的模型性能赢得了用户的认可。DeepSeek V3 的发布,更是展现了 DeepSeek 在 AI 领域的领先地位

DeepSeek官网: DeepSeek

DeepSeek开发者平台: DeepSeek

DeepSeek V3 GitHub 仓库: GitHub - deepseek-ai/DeepSeek-V3

DeepSeek V3 Hugging Face 链接: https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

Deepseek-deploy-guide:DeepSeek V3 本地部署指南:从入门到精通

2 如何在本地环境中部署和运行 DeepSeek V3 模型

■ 基本要求

NVIDIA GPU(推荐A100或H100)或AMD GPU

充足的系统内存(推荐32GB以上)

Linux 操作系统(推荐Ubuntu 20.04或更高版本)

Python 3.8 或更高版本

■ 代码和模型

 克隆仓库并安装依赖

git clone https://github.com/deepseek-ai/DeepSeek-V3.git

cd DeepSeek-V3/inference

pip install -r requirements.txt

▲ 下载模型权重

HuggingFace下载模型权重,并将其放入指定的文件夹。

DeepSeek-V3提供了两种模型版本:

① 基础模型:适用于通用任务。

② 对话模型:针对对话和交互优化。

具体步骤如下:

① 安装Git LFS

对于 Debian 或 Ubuntu 系统,可以使用以下命令安装Git LFS 

sudo apt-get install git-lfs

② 初始化 Git LFS

初始化 Git LFS在本地仓库中运行git lfs install命令,确保Git LFS的钩子被正确设置在Git配置中。

git lfs install

③ 下载模型权重

# For Base Model

git clone https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

# For Chat Model

git clone https://huggingface.co/deepseek-ai/DeepSeek-V3

▲ 部署方案

基础的方式—快速测试和实验。

将FP8权重转换为16权重,可以使用以下命令:

python convert.py --hf-ckpt-path /path/to/DeepSeek-V3 --save-path /path/to/DeepSeek-V3-Demo --n-experts 256 --model-parallel 16

使用DeepSeek-Infer Demo进行推理。推理示例:

torchrun --nnodes 2 --nproc-per-node 8 generate.py --node-rank $RANK --master-addr $ADDR --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --interactive --temperature 0.7 --max-new-tokens 200

说明:本文内容来源于网络,如有侵权,请联系作者删除。

至此,本文的内容就结束啦。


http://www.kler.cn/a/535757.html

相关文章:

  • 【LeetCode】152、乘积最大子数组
  • 通过多层混合MTL结构提升股票市场预测的准确性,R²最高为0.98
  • 禅道社区版项目管理软件部署(记录篇)
  • langchain教程-5.DocumentLoader/多种文档加载器
  • 备考蓝桥杯嵌入式4:使用LCD显示我们捕捉的PWM波
  • Mac M1 ComfyUI 中 AnyText插件安装问题汇总?
  • tolua[一]框架搭建,运行example
  • 【Day33 LeetCode】动态规划DP Ⅵ 背包问题
  • SQL Server的安装和简单使用
  • SQL精度丢失:CAST(ce.fund / 100 AS DECIMAL(10, 2)) 得到 99999999.99
  • 【Uniapp-Vue3】z-paging插件组件实现触底和下拉加载数据
  • 【Elasticsearch】random_sampler聚合
  • Leecode刷题C语言之全排列②
  • Spring Boot + Spring AI快速体验
  • Polardb三节点集群部署安装--附虚拟机
  • Linux 设备驱动分类(快速理解驱动架构)
  • 《大模型面试宝典》(2025版) 发布了
  • 国自然地区基金|基于深度学习多模态影像组学智能诊断非酒精性脂肪肝病的研究|基金申请·25-02-06
  • C#项目引用VB.NET 类库项目,生成一个EXE,这是什么原理
  • 【前端】【面试】【复习详解】【react】react生命周期--函数式全解
  • 深度剖析FFmpeg视频解码后的帧处理到Qt显示 从AVFrame到QImage的转换(一)
  • “卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法
  • 【正点原子K210连载】第六十七章 音频FFT实验 摘自【正点原子】DNK210使用指南-CanMV版指南
  • Django settings详解
  • 在C#中,Array,List,ArrayList,Dictionary,Hashtable,SortList,Stack的区别
  • 电脑可以自己换显卡吗?怎么操作