当前位置: 首页 > article >正文

应用接入gpt

平台:百度千帆大模型

模型:ERNIE-Tiny-8K(客服对话多标签生成模型),ERNIE4.0(安全模型),DeepSeek-R1-14B(人工客服对话模型)

技术:SFT(客服对话多标签生成),提示词工程,双模型机制防止提示词注入

SFT(客服对话多标签生成)

训练方式

迭代轮次Epoch

学习率Learning Rate

序列长度Seq Length

SFT

1

0.00003

4096

学习率(Learning Rate):是优化算法中的一个重要超参数,它决定了模型在训练过程中更新参数的步长大小。学习率越大,模型参数更新的幅度就越大,训练速度可能会加快,但也可能导致模型错过最优解,甚至出现不收敛、振荡等不稳定情况;学习率越小,模型训练会更稳定,但训练速度会变慢,可能需要更多的训练时间才能达到较好的效果。

序列长度(Seq Length):指的是输入到模型中的序列数据的长度。在自然语言处理等任务中,文本通常被表示为一系列的词或字符序列,序列长度就是指这个序列中的元素数量。

文档:

百度智能云千帆大模型平台

提示词工程

使用零样本思维链策略少样本学习,指示模型提问

在控制台中使用推理超参数定义停止标识(开发人员和网站架构等信息)系统人设(客服,各项指标回答)

构造“意图-原因”标签集

意图

原因

数据份数

如何提交评价

未收到评价邀请

1

你们有某种宠物吗

宠物缺货_短期或长期

1

某宠物特定需求

顾客特殊需求

1

订单什么时候能做好

餐品制作时间

1

如何访问我的订单历史记录

历史订单查询

1

取消订单

取消订单_无具体理由

1

为什么我的优惠券不见了

优惠券未到账

1

取消订单

地址写错误

1

宠物不对

送错宠物

1

餐厅电话是多少

食物变质

1

我在哪里可以参加活动

活动地点咨询

1

有没有推荐的宠物

需要推荐宠物

1

客户要开发票

开发票

2

1

Prompt

Response

2

假设你有一套客户意图分类以及该分类下属的原因标签。请根据给定的客服对话内容,判断最有可能的客户意图以及对应的原因标签,意图和原因标签需要严格控制给定的范围之内;一个意图可能对应多个原因,但一个原因只会对应一个意图;如果均不匹配则回答无明确客户意图;回答请使用json的格式,示例:'{"意图": "xxx","原因”: "xxx"}' ### 下面是客户意图的分类 1.客户意图:如何提交评价;原因标签:未收到评价邀请 2.客户意图:你们有某种餐品吗;原因标签:餐品缺货_短期或长期 3.客户意图:某餐品需要做成不辣;原因标签:顾客特需服务 4.客户意图:在餐厅丢失了物品怎么寻回;原因标签:找回遗失物品 5.客户意图:订单什么时候能做好;原因标签:餐品制作时间 6.客户意图:如何访问我的订单历史记录;原因标签:历史订单查询 7.客户意图:取消订单;原因标签:取消订单_无具体理由 8.客户意图:为什么我的优惠券不见了;原因标签:优惠券未到账 9.客户意图:取消订单;原因标签:地址填写错误 10.客户意图:我想要加番茄酱或者不加番茄酱;原因标签:加or不加番茄酱_顾客定制 11.客户意图:餐品不对;原因标签:漏餐错餐 12.客户意图:餐厅电话是多少;原因标签:食物变质 13.客户意图:我在哪里可以参加活动;原因标签:活动地点咨询 14.客户意图:有没有推荐的产品;原因标签:需要推荐餐品 15.客户意图:客户要开发票;原因标签:开发票 ###对话内容 李星辰DY 2023年07月19日 10:23:48 您好,欢迎光临DianCan披萨,有什么可以为您服务的吗? 用户673210 2023年07月19日 10:24:12 我想开一下发票 李星辰DY 2023年07月19日 10:24:35 当然可以,请您提供一下订单号和开票信息,我们会尽快为您处理。 用户673210 2023年07月19日 10:25:01 订单号是DC230715001,开票信息是公司名称:XX科技有限公司,税号:9132XXXXXXXXX 李星辰DY 2023年07月19日 10:25:38 好的,已经收到您的订单号和开票信息,我们会尽快为您开具发票并发送到您的邮箱。请问您的邮箱地址是什么? 用户673210 2023年07月19日 10:26:05 我的邮箱是[example@example.com](mailto:example@example.com) 李星辰DY 2023年07月19日 10:26:32 非常感谢,我们已经记录下了您的邮箱地址。发票将在24小时内发送到您的邮箱,请注意查收。 用户673210 2023年07月19日 10:27:00 好的,谢谢! 李星辰DY 2023年07月19日 10:27:25 不客气,如果您有任何其他问题或需要进一步的帮助,请随时联系我们。祝您用餐愉快! ###输出

{'意图': '客户要开发票', '原因': '开发票'}

{'意图': '客户要开发票', '原因': '开发票'}

数据格式:本实验是采用SFT调优方式,需要使用Prompt+Response数据格式。

  • Prompt:预设情景+“意图-原因”标签集+对话内容。
  • Response:Prompt中对话内容对应的“意图-原因”数据。

客服在获取意图后存入数据库中,后端每天凌晨定时任务查询(断货,宠物特殊需求),大于20触发警报提醒管理人员

对于网站部分询问会调用系统人设里面的知识回答

修改地址和取消订单则直接调用程序内部接口完成

双模型机制防止提示词注入

安全模型只能根据文本是否违法回答 是 或者 否,服务模型输入检查为 是 和输出检查为 否 都将终止会话

少样本学习策略: Prompt:让我们逐步思考,判断以下信息是否包含暴力,血腥,违法法律等非法信息,只能回答是和否


http://www.kler.cn/a/553548.html

相关文章:

  • React之旅-01 初识
  • windows使用clion运行lua文件,并且使用cjson
  • 【etcd】etcd_go操作与etcd锁实现原理
  • 通过例子学 rust 个人精简版 3-1
  • 【系统架构】分布式事务模型详解
  • 配置终端代理
  • 精准医疗的“柔性”助力:FPC在医疗机器人中的应用实例【新立电子】
  • 启元世界(Inspir.ai)技术浅析(七):AI Beings 平台
  • AI照片管理利器实战:自动化分类+智能搜索+远程访问一站式解决方案
  • 基于Springboot的公寓报修管理系统【附源码】
  • 用DeepSeek零基础预测《哪吒之魔童闹海》票房——从数据爬取到模型实战
  • 【探索PHP的无限可能:构建高效、动态的Web应用】
  • 机器学习:十大算法实现汇总
  • EasyExcel实现excel导入(模版上传)
  • 处理 Markdown 转换过程中损坏的 PDF 文件
  • 机器学习(1)安装Pytorch
  • 如何排查服务器日志中出现的可疑行为
  • [实现Rpc] 消息类型的测试 | dynamic_pointer_cast | gdb使用
  • 如何安装Hadoop
  • Unity 与 Mosquitto MQTT Broker 通信教程