当前位置: 首页 > article >正文

构建中国人自己的私人GPT—支持中文

上一篇已经讲解了如何构建自己的私人GPT,这一篇主要讲如何让GPT支持中文。

a7dcd7b0e52c4efda096c09d6f70f222.jpeg


privateGPT 本地部署目前只支持基于llama.cpp 的 gguf格式模型,GGUF 是 llama.cpp 团队于 2023 年 8 月 21 日推出的一种新格式。它是 GGML 的替代品,llama.cpp 不再支持 GGML。

本文主要采用国产YI-34B-CHAT模型。
1.模型下载
yi模型下载:TheBloke/Yi-34B-Chat-GGUF · Hugging Face

下载后放置在 models 文件夹下
embedding模型下载:BAAI/bge-small-en-v1.5 · Hugging Face

下载后放置在models/cache文件夹下,bge is short for BAAI general embedding,FlagEmbedding 可以将任何文本映射到低维密集向量,该向量可用于检索、分类、聚类或语义搜索等任务。它还可以用于法学硕士的矢量数据库

2.settings.yaml 文件修改:
主要修改local部分,使用YI模型使用prompt_style: "tag"类型的提示词模板

llm_hf_model_file: yi-34b-chat.Q4_K_M.gguf
prompt_style: "tag"

3.代码修改
使用YI-34B-CHAT模型,源码要简单修改下,修改如下

文件路径 privateGPT/private_gpt/components/llm/llm_component.py

第44行,添加如下内容:

generate_kwargs={'stop':['<|im_end|>']},

如图:

87a7f5bd9b0a70cee1b39687f070c8ed.png

导航到 UI:在浏览器中打开 http://localhost:8001/。
 

e2e8717aa27ecb638b17e7692e1585e7.png





创作不易,多多支持!

 

 


http://www.kler.cn/a/231002.html

相关文章:

  • 机顶盒晶晨s905l3b芯片刷第三方系统+安卓9 root教程+armbian写入EMMC教程
  • CloudStack Agent重新安装与卸载指南
  • 【机器学习】机器学习流程之收集数据
  • 提升你的PHP开发效率:探索JetBrains PhpStorm 2022的全新特性
  • ROS笔记二:launch
  • Zoho Creator低代码平台:克服移动应用开发四大挑战的利器
  • 数据库分库分表:提升系统性能的必由之路
  • VBA技术资料MF116:测试操作系统是否为64位
  • 网络协议与攻击模拟_15FTP协议
  • okgo引入失败 (failed to resolve: com.lzy.net:okgo:)
  • 工业以太网交换机引领现代工厂自动化新潮流
  • 初识C语言·预处理详解
  • 9.0 Zookeeper 节点特性
  • Android:ViewAdapter
  • 【C生万物】C语言数据类型、变量和运算符
  • 板块一 Servlet编程:第一节 HTTP协议理论与服务器请求响应原理 来自【汤米尼克的JAVAEE全套教程专栏】
  • 数据结构——单链表详解
  • P3870 [TJOI2009] 开关
  • openssl3.2 - update debian12‘s default openssl to openssl3.2
  • Flutter 仿抖音 TikTok 上下滑动 播放视频