当前位置：首页 > article >正文

使用DeepSeek R1 + 了解部署

article 2025/2/6 14:59:42

官网注册
R1模型，推理模型
参考视频理解

理解大语言模型的本质

大模型在训练时是将内容token化的
大模型知识是存在截止时间的
大模型缺乏自我认知、自我意识
记忆有限
输出长度有限

智商理解，例如下面的DeepSeek的测试：
在这里插入图片描述

用DeepSeek

官网
手机App
调用API
本地部署

使用技巧

提出明确的要求
要求特定的风格
提供充分的任务背景信息
主动标注自己的知识状态
定义目标而非过程
提供AI不具备的知识背景
从开放到收敛

本地部署

ollama官网
ollama是一个开源项目，可下载和运行模型，帮助开发者更轻松构建和使用模型。

使用ollama

安装ollama
配置模型和参数
使用数据集训练模型
将训练好的模型部署到生产环境

示例：

from ollama import TextGenerator

# 初始化文本生成器
generator = TextGenerator(model_name="gpt-3")

# 生成文本
input_text = "今天天气很好，"
output_text = generator.generate(input_text, max_length=50)

print(output_text)

部署

建议下载小的，成功后根据需求进行配置

参考

DeepSeek R1 本地部署

查看全文

http://www.kler.cn/a/533820.html

【技海登峰】Kafka漫谈系列（二）Kafka高可用副本的数据同步与选主机制

【PDF提取局部内容改名】批量获取PDF局部文字内容改名基于QT和百度云api的完整实现方案

从离散傅里叶变换（DFT）到快速傅里叶变换（FFT）

【蓝桥杯嵌入式】工程创建

MapStruct工具类的使用

[论文笔记] Deepseek技术报告

【Elasticsearch】`auto_date_histogram`聚合功能详解

MLA 架构

Ubuntu部署Deepseek-R1模型（8b）

基于微信小程序的医院综合服务平台的设计与实现ssm+论文源码调试

亚博microros小车-原生ubuntu支持系列：22 物体识别追踪

AI绘画：解锁商业设计新宇宙（6/10）

使用request库实现接口测试-笔记

阿里云 ubuntu22.04 中国区节点安装 Docker

2024年12月 Scratch 图形化（一级）真题解析中国电子学会全国青少年软件编程等级考试

arm 下多线程访问同一变量，使用原子操作性能差问题

【Git】二、分支管理详解

2024年12月 Scratch 图形化（三级）真题解析中国电子学会全国青少年软件编程等级考试

记录一下在Mac下用pyinstallter 打包 Django项目

自己实现的一个缓存数据库（搞着玩） .net Core/6/8/9

【C语言高级特性】位操作（二）：应用场景

python开发：爬虫示例——GET和POST请求处理

理解大语言模型的本质

用DeepSeek

使用技巧

本地部署

使用ollama

部署

参考

相关文章：