当前位置: 首页 > article >正文

windows10环境下的Deepseek本地部署及接口调用

windows10环境下的Deepseek本地部署及接口调用

一、Ollama安装和配置

Ollama 是一个开源工具,专门用于在本地计算机上运行和操作大型语言模型(LLM)。它让用户能够轻松下载、管理和运行各种 AI 模型(如 LLaMA、Mistral 等),而无需复杂的配置或依赖云服务

1.下载

- 访问 Ollama 的官方网站(https://ollama.ai/),下载适合你操作系统的安装包,完成安装即可。

image-20250207164048560

命令行中校验安装成功:

image-20250207164403261

2.配置模型文件下载路径

在环境变量中,点击“新建”:

- 变量名:OLLAMA_MODELS

- 变量值:D:\ollama_models(替换为自己保存模型的目录路径)。

重启Shell 或命令提示符,使更改生效。

image-20250207165045082

二、下载并运行Deepseek-R1模型

1.模型文件介绍

访问 Ollama 的官方网站(https://ollama.ai/)查找deepseek-r1模型

image-20250207165250149

在ollama网站上,目前提供了几个不同大小的deepseek模型,最小的1.5b只有1.1GB,最大的671b有404GB

image-20250207165411284

本地测试使用1.5b(1.1GB)模型,本地启动后资源使用情况:

本次windowds测试中,使用NVIDIA MX330显卡:2G专用显存使用1.4G,7.9G共享显存使用0.4G, 总共GPU内存使用1.7G左右。

image-20250207165854658

网友测试:32b(20GB)模型,使用NVIDIA RTX 4090显卡:

image-20250207170636205

网友测试:70b(43GB)模型,使用NVIDIA RTX 4090显卡:

image-20250207170803567

2.下载并运行1.5b模型

image-20250207171209116

后续就可以通过命令行和deepseek进行沟通聊天了:

image-20250207171259166

三、安装chatbox用户界面

使用命令行如果不方便,可以安装chatbox客户端。

Chatbox 是一个开源的桌面应用程序,专门用于与大型语言模型(如 OpenAI 的 GPT 系列、LLaMA、Mistral 等)进行交互。它提供了一个简洁、易用的图形界面,让用户能够轻松地与 AI 模型对话,而无需编写代码或使用复杂的命令行工具。访问 Chatbox网站https://chatboxai.app/zh,下载适合你操作系统的安装包。

1.下载安装

下载安装chatbox即可。

image-20250207171657607

2.配置

打开chatbox,找到"设置",配置“模型提供方”为:OLLAMA API, 同时,选择模型:deepseek-r1:1.5b,即可。

image-20250207171908880

开启“新对话”和deepseek进行聊天:

image-20250207172319636

四、通过接口调用deepseek

上面配置中有个API域名:这个域名是是ollama启动后的默认地址,通过REST API和deepseek进行交互。

具体ollama提供的接口可以参考:https://github.com/ollama/ollama/blob/main/docs/api.md

后续我们可以使用java、python、go等语言调用,做成自己的服务等。

下面通过PostMan测试接口调用:

1.商品卖点提炼

image-20250207173209509

2.商品敏感词识别

image-20250207173407929


http://www.kler.cn/a/536005.html

相关文章:

  • 云计算行业分析
  • nuxt3中报错: `setInterval` should not be used on the server.
  • Google地图瓦片爬虫——进阶版
  • 【deepseek实战】绿色好用,不断网
  • 点(线)集最小包围外轮廓效果赏析
  • Windows 中学习Docker环境准备3、在Ubuntu中安装Docker
  • 网络安全威胁框架与入侵分析模型概述
  • 【PostgreSQL内核学习 —— (WindowAgg(三))】
  • golang命令大全12--命令速查表
  • Vue学习综合案例(四)
  • Spring的三级缓存如何解决循环依赖问题
  • 202412 青少年软件编程等级考试C/C++ 二级真题答案及解析
  • C++证件识别接口-身份证识别-护照识别-驾驶证识别-户口页识别
  • RabbitMQ 从入门到精通:从工作模式到集群部署实战(三)
  • 【AI大模型】Ubuntu18.04安装deepseek-r1模型+服务器部署+内网访问
  • Spring Boot篇
  • 如何查看linux机器有几个cpu
  • Mono里运行C#脚本41—编译MonoEmbed::gimme()调用的过程
  • Java实现数据库图片上传(包含从数据库拿图片传递前端渲染)-图文详解
  • 3. kafka事务消息
  • 分布式事务实战 ——Seata 与最终一致性方案
  • Cables Finance发布 V1.1 白皮书:开创RWA敞口新范式
  • 第二篇:前端VSCode常用快捷键-以及常用技巧
  • ORACLE 数据库的启动和关闭
  • LLM的Deep Research功能:重构人类认知与创新的新范式
  • SQL Server中RANK()函数:处理并列排名与自然跳号