当前位置: 首页 > article >正文

快速建立私有化知识库(私有化训练DeepSeek,通过ollama方式)

简介

什么?!老是有人问你需求,不同版本的需求你记不清还得去扒拉过程文档、设计文档?
什么?!领导会询问功能使用情况、用户相关数据,你每次还得手动查询反馈?
什么?! 项目太多了,每次迭代需求查立项信息太头痛不知道找谁要?

你可以把需求文档、过程文档、接口文档全部喂给它,然后直接问就完事了,再也不用问开发人员了。解放开发人员的双手。

好了,不开玩笑了。通过这种可以成本最小的建立知识库,个人、部门、企业知识库都可以建立,而且都是本地话训练,训练数据和模型的关联关系是放在内存中的,不会有安全风险。通过私有化知识库,企业可以提升相关效率。

接下来,我将做一个工作日志的训练示例: 将工作日志给他,并且让他协助你的工作。

前提

请确保你已经安装Ollama且DeepSeek模型下载完毕。具体请参考私有化部署DeepSeek
私有化部署DppeSeek

安装AnythingLLM

企业很多的敏感数据和用户数据是宝贵的,所以需要根据特定数据私有化训练DeepSeek。
AnythingLLM到底是什么?AnythingLLM是由Mintplex Labs Inc.开发的一个全栈应用程序,是一款高效、可定制、开源的企业级文档聊天机器人解决方案。它能够将任何文档、资源或内容片段转化为大语言模型在聊天中可以利用的相关上下文。

以下是下载途径:
官网下载安装包 https://anythingllm.com/desktop

Github下载安装包 https://github.com/Mintplex-Labs/anything-llm/releases

这里找到当前最新版本:1.4.0 https://github.com/Mintplex-Labs/anything-llm/releases/download/v1.4.0/AnythingLLMDesktop.exe (GitHub直接下载,有可能限速,需要采用Github代理进行下载)

在这里插入图片描述

安装

安装过程无脑下一步就行了。
在这里插入图片描述

安装过程大约20min,因为我的网速比较慢
期间会中间下载一个1.8G的模型文件,如果下载失败不必担心,重新打开安装包重新安装一遍就行。中间的那个下载并没有限制下载速度。

设置

语言

在这里插入图片描述

LLM

在这里插入图片描述

嵌入首选项

在这里插入图片描述

新建工作区

在这里插入图片描述

工作区设置

点击齿轮

设置LLM模型

在这里插入图片描述

设置人工智能体性格

在这里插入图片描述

这是我的示例:你是一个协助我的工作的机器人,我将给你我工作相关的文档资料,我需要你根据这些资料回复我的问题,协助我的工作,成为我的工作助手。

确认保存

当设置完以后,你需要update才能生效
在这里插入图片描述

代理设置

在这里插入图片描述

私有化训练

准备训练数据

什么形式都行,你可以看官方文档,我这里是excel
在这里插入图片描述

导入数据

点击上传

在这里插入图片描述

拖入工作区

在这里插入图片描述

开始训练

在这里插入图片描述
成功标志如下图所示,右侧出现数据
在这里插入图片描述

使用训练数据

点击,使其pin进工作区
在这里插入图片描述

验收成果

打开对话开始对话
在这里插入图片描述
现在开始提问你训练文档中的数据
在这里插入图片描述
现在可以看到它已经可以根据我们的训练数据回答我们相应的问题了。
ps:你可以注意到它回复的还是有缺陷,一方面是我下载的模型是最小的,一方面是训练数据过少。实际体现只用作知识库我觉得是绰绰有余的。

官方接口调用文档

这个软件已经集成了API文档,如果你想接口形式调用或者linux安装都是完全可以支持的。总之文档详细,定制化程度高。
https://docs.anythingllm.com/features/api


http://www.kler.cn/a/538020.html

相关文章:

  • 在 Java 中使用数据库的存储过程有什么好处?如何在 JDBC 中调用存储过程?
  • C++ 中信号转异常机制:在磁盘 I/O 内存映射场景下的应用与解析
  • 【虚幻引擎UE】AOI算法介绍与实现案例
  • windows蓝牙驱动开发-蓝牙常见问题解答
  • 算法篇——动态规划
  • 大数据项目2a:基于spark的电影推荐和分析系统设计与实现
  • python 使用OpenAI Whisper进行显卡推理语音翻译
  • 探秘树莓集团海南战略:文创领军者的市场破局之路
  • 【Go语言快速上手】第二部分:Go语言进阶
  • opencv打开摄像头出现读取帧错误问题
  • 原子核链式反应与曼哈顿计划
  • 【docker】Failed to allocate manager object, freezing:兼容兼容 cgroup v1 和 v2
  • Django+simpleui实现文件上传预览功能
  • Unity-Mirror网络框架-从入门到精通之Discovery示例
  • LabVIEW污水生化处理在线监测
  • 【Pandas】pandas Series var
  • 线程状态:
  • ##__VA_ARGS__有什么作用
  • Java并发篇
  • Deepseek得两种访问方式与本地部署
  • 【0403】Postgres内核 检查(procArray )给定 db 是否有其他 backend process 正在运行
  • 车机音频参数下发流程
  • H2模拟mysql的存储过程
  • 视频采集卡接口
  • python脚本实现windows电脑内存监控内存清理(类似rammap清空工作集功能)
  • “现代C++ RAII库:设计、优化及实战应用“