打造个人知识库(Page Assist版)- 私人专属AI-本地化部署deepseek
上篇介绍了实现浏览器交互Ai Web Ui - chrome浏览器插件-Page Assist,安装即可使用,实现最简单的本地化部署AI使用。
实现浏览器交互Ai Web Ui-本地化部署的deepseek + Ollama + Page Assist
本编介绍使用 Page Assist 构建个人知识库,利用个人私有数据,实现私人专属AI。
一、RAG 介绍
RAG 的中文名称是检索增强生成,从字面意思来理解,包含三个检索、增强和生成三个过程。
检索:根据用户的查询内容,从外挂知识库获取相关信息。具体来说,就是将用户的查询通过嵌入模型转换成向量,以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索,从向量数据库中找出最匹配的前 K 个数据。
增强:将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。
生成:将经过检索增强的提示词内容输入到大语言模型(LLM)中,以此生成所需的输出。
流程图如下所示:
二、文本嵌入模型
将个人数据向量化存入向量数据库需要嵌入式模型,检索向量数据库也需要嵌入式模型。
下载嵌入式模型
浏览器打开Page Assist - 设置 - 模型管理 - 添加新模型 - 输入“nomic-embed-text:latest” - 拉取模型。
也可使用命令行下载
ollama pull nomic-embed-text:latest
等待安装完毕
也可选在安装 bge-m3 模型。
模型名称 | 使用场景 | 安装命令 |
---|---|---|
nomic-embed-text | 功能强大的英文文本嵌入模型 | ollama pull nomic-embed-text |
bge-m3 | 适用于多种高级自然语言处理任务 | ollama pull bge-m3 |
三、RAG设置
设置 - RAG设置 - 文本嵌入模型 - 选择“nomic-embed-text:latest” - 保存,其他设置暂默认即可。
四、知识库数据
用 Deepseek 虚构了一个人物的全套资料,包含个人档案、简历、教育经历、工作成果、新闻介绍等内容,有TXT、MD、DOC、PPT、PDF等格式。方便用于deepseek本地化部署+个人知识库测试。
虚构人物的全套资料提供给大家免费下载使用。
下载地址:余傲天-虚拟人物资料-deepseek本地化部署+个人知识库测试
五、导入个人数据
设置 - 管理知识 - 添加知识 - 选择上传文件- 提交。
Page Assist 单个知识库默认文件上传限制为5个文档,可在RAG设置里修改,但不支持追加文档。
后续再给大家介绍其他知识库管理能力更强的工具,关注后续文章。
稍等一会,导入处理完成。
六、应用知识库
不使用知识库
使用知识库
选择知识库:
Deepseek 1.5b 提问:
模型确实引用了知识库的内容进行回复,并在文末列出引用文档
Deepseek 7b 提问:
七、总结
综上结论:
Deepseek 1.5b 模型,回答效果不太理想。Deepseek 7b 模型,回答效果比1.5b 效果要好很多。明显回答更加精准更富有逻辑性。参数越多的大模型回答效果越好。
Page Assist 插件知识库管理能力较弱,用于简单测试尚可,实际应用还差点意思。
后续更新其他更好用的工具,并且可以用个人知识库+Deepseek 官方API,打造更实用的私人专属AI。