当前位置: 首页 > article >正文

【最后203篇系列】006 -使用ollama运行deepseek-r1前后端搭建

说明

这块已经不算新内容了,年前搭完了后端(ollama),本来想早点分享的,但是当时的openwebui有点不给力,有些地方不适配,然后配置项找不到。所以前端没搭好,也就不完整:只能通过命令行或者接口调用,可用性、体验感不强。

今天看到别的文章推荐了chatbox,试了一下还是挺方便的,所以就顺带补完。

内容

1 ollama

如果是电脑端,那么直接登录ollama的官网下载最新版就好了。老版本的是不能用的。

我用docker部署,那么也需要拉最新的ollama镜像,否则可以pull,但是运行时会报错。

启动命令类似这样

docker run -d --gpus=all \
-v /data/ollama:/root/.ollama \
-p 11434:11434 \
-e OLLAMA_MODELS=/data/ollama/models \
--name ollama \
ollama/ollama

检查版本

curl http://localhost:11434/api/version

{"version":"0.5.7-0-ga420a45-dirty"}

ollama可以与其他多种工具紧密结合,与langchain

from langchain_ollama import OllamaLLM
from langchain_core.prompts import ChatPromptTemplate

# ollama pull deepseek-r1:1.5b
# ollama pull deepseek-r1:8b

# 初始化远端 Ollama 模型
llm = OllamaLLM(
    model="deepseek-r1:1.5b",
    base_url="http://IP:11434"  # 替换为远端服务器的 IP 或域名
)

# 调用模型
response = llm.invoke("langsmith可以帮助测试做什么?")
print(response)

# 使用 ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个世界顶级的文档写手"),
    ("user", "{input}")
])

使用openai风格

from openai import OpenAI

# 初始化 OpenAI 客户端,指向远端 Ollama 服务
client = OpenAI(
    base_url="http://IP:11434/v1",  # 替换为远端服务器的 IP 或域名
    api_key="ollama",  # 必填项,但会被忽略
)

# 调用模型
response = client.chat.completions.create(
    model="deepseek-r1:8b",  # 替换为你下载的模型名称
    messages=[
        {"role": "system", "content": "你是一个世界顶级的文档写手。"},
        {"role": "user", "content": "请用中文描述字节跳动有限公司。"}
    ]
)

# 输出结果
print(response.choices[0].message.content)

2 chatbox

https://chatboxai.app/zh

在这里插入图片描述
chatbox是一款app,直接在商店里下载安装就好了。

里面还很贴心的给了ollama的配置教程

在这里插入图片描述

总结有三点:

  • 1 选择ollama
  • 2 选择地址(这里我的是远端地址,也可以在本运行)
  • 3 选择模型(8b的速度其实非常快了)

使用:感觉非常迅速,毫无迟滞感(4090 backup)。而且我记得ollama似乎是允许4个并发的。
在这里插入图片描述


http://www.kler.cn/a/531641.html

相关文章:

  • 剑指offer 链表 持续更新中...
  • UE学习日志#19 C++笔记#5 基础复习5 引用1
  • Vue 3 30天精进之旅:Day 12 - 异步操作
  • 深入理解Java引用传递
  • JVM-运行时数据区
  • 八、Spring Boot 日志详解
  • Java中的常见对象类型解析
  • 想学习Python编程,应该如何去学习呢
  • ChatGPT怎么回事?
  • Linux环境下的Java项目部署技巧:Nginx 详解
  • powershell编写一个简易的http服务器httpServer
  • 《基于deepseek R1开源大模型的电子数据取证技术发展研究》
  • 计算机组成原理——存储系统(二)
  • 大一计算机的自学总结:数据结构设计相关题
  • 浅谈知识蒸馏技术
  • 【玩转 Postman 接口测试与开发2_014】第11章:测试现成的 API 接口(下)——自动化接口测试脚本实战演练 + 测试集合共享
  • Immutable设计 SimpleDateFormat DateTimeFormatter
  • 如何用一年时间如何能掌握 C++ ?
  • lstm部分代码解释1.0
  • MySQL锁详解
  • 深入探究 Spring 中 FactoryBean 注册服务的实现与原理
  • 【智力测试——二分、前缀和、乘法逆元、组合计数】
  • 【C++】P5734 【深基6.例6】文字处理软件
  • 使用Walk()遍历目录
  • Mac电脑上好用的免费截图软件
  • 【Linux】进程状态和优先级