当前位置: 首页 > article >正文

使用DeepSeek R1 + 了解部署

官网注册
R1模型,推理模型
参考视频理解

理解大语言模型的本质

  • 大模型在训练时是将内容token化的
  • 大模型知识是存在截止时间的
  • 大模型缺乏自我认知、自我意识
  • 记忆有限
  • 输出长度有限

智商理解,例如下面的DeepSeek的测试:
在这里插入图片描述

用DeepSeek

  • 官网
  • 手机App
  • 调用API
  • 本地部署

使用技巧

  • 提出明确的要求
  • 要求特定的风格
  • 提供充分的任务背景信息
  • 主动标注自己的知识状态
  • 定义目标而非过程
  • 提供AI不具备的知识背景
  • 从开放到收敛

本地部署

ollama官网
ollama是一个开源项目,可下载和运行模型,帮助开发者更轻松构建和使用模型。

使用ollama

  • 安装ollama
  • 配置模型和参数
  • 使用数据集训练模型
  • 将训练好的模型部署到生产环境

示例:

from ollama import TextGenerator

# 初始化文本生成器
generator = TextGenerator(model_name="gpt-3")

# 生成文本
input_text = "今天天气很好,"
output_text = generator.generate(input_text, max_length=50)

print(output_text)

部署

建议下载小的,成功后根据需求进行配置

参考

DeepSeek R1 本地部署


http://www.kler.cn/a/533820.html

相关文章:

  • 【技海登峰】Kafka漫谈系列(二)Kafka高可用副本的数据同步与选主机制
  • Vue.js 如何选择合适的组件库
  • JavaScript模块化
  • Notepad++消除生成bak文件
  • k8s二进制集群之ETCD集群证书生成
  • 【PDF提取局部内容改名】批量获取PDF局部文字内容改名 基于QT和百度云api的完整实现方案
  • 从离散傅里叶变换(DFT)到快速傅里叶变换(FFT)
  • 【蓝桥杯嵌入式】工程创建
  • MapStruct工具类的使用
  • [论文笔记] Deepseek技术报告
  • 【Elasticsearch】`auto_date_histogram`聚合功能详解
  • MLA 架构
  • Ubuntu部署Deepseek-R1模型(8b)
  • 基于微信小程序的医院综合服务平台的设计与实现ssm+论文源码调试
  • 亚博microros小车-原生ubuntu支持系列:22 物体识别追踪
  • AI绘画:解锁商业设计新宇宙(6/10)
  • 使用request库实现接口测试-笔记
  • 阿里云 ubuntu22.04 中国区节点安装 Docker
  • 2024年12月 Scratch 图形化(一级)真题解析 中国电子学会全国青少年软件编程等级考试
  • arm 下 多线程访问同一变量 ,使用原子操作 性能差问题
  • 【Git】二、分支管理详解
  • 2024年12月 Scratch 图形化(三级)真题解析 中国电子学会全国青少年软件编程等级考试
  • 记录一下 在Mac下用pyinstallter 打包 Django项目
  • 自己实现的一个缓存数据库(搞着玩) .net Core/6/8/9
  • 【C语言高级特性】位操作(二):应用场景
  • python开发:爬虫示例——GET和POST请求处理