使用DeepSeek R1 + 了解部署
官网注册
R1模型,推理模型
参考视频理解
理解大语言模型的本质
- 大模型在训练时是将内容token化的
- 大模型知识是存在截止时间的
- 大模型缺乏自我认知、自我意识
- 记忆有限
- 输出长度有限
智商理解,例如下面的DeepSeek的测试:
用DeepSeek
- 官网
- 手机App
- 调用API
- 本地部署
使用技巧
- 提出明确的要求
- 要求特定的风格
- 提供充分的任务背景信息
- 主动标注自己的知识状态
- 定义目标而非过程
- 提供AI不具备的知识背景
- 从开放到收敛
本地部署
ollama官网
ollama是一个开源项目,可下载和运行模型,帮助开发者更轻松构建和使用模型。
使用ollama
- 安装ollama
- 配置模型和参数
- 使用数据集训练模型
- 将训练好的模型部署到生产环境
示例:
from ollama import TextGenerator
# 初始化文本生成器
generator = TextGenerator(model_name="gpt-3")
# 生成文本
input_text = "今天天气很好,"
output_text = generator.generate(input_text, max_length=50)
print(output_text)
部署
建议下载小的,成功后根据需求进行配置
参考
DeepSeek R1 本地部署