应用接入gpt
平台:百度千帆大模型
模型:ERNIE-Tiny-8K(客服对话多标签生成模型),ERNIE4.0(安全模型),DeepSeek-R1-14B(人工客服对话模型)
技术:SFT(客服对话多标签生成),提示词工程,双模型机制防止提示词注入
SFT(客服对话多标签生成)
训练方式 | 迭代轮次Epoch | 学习率Learning Rate | 序列长度Seq Length |
SFT | 1 | 0.00003 | 4096 |
学习率(Learning Rate):是优化算法中的一个重要超参数,它决定了模型在训练过程中更新参数的步长大小。学习率越大,模型参数更新的幅度就越大,训练速度可能会加快,但也可能导致模型错过最优解,甚至出现不收敛、振荡等不稳定情况;学习率越小,模型训练会更稳定,但训练速度会变慢,可能需要更多的训练时间才能达到较好的效果。
序列长度(Seq Length):指的是输入到模型中的序列数据的长度。在自然语言处理等任务中,文本通常被表示为一系列的词或字符序列,序列长度就是指这个序列中的元素数量。
文档:
百度智能云千帆大模型平台
提示词工程
使用零样本思维链策略和少样本学习,指示模型提问
在控制台中使用推理超参数定义停止标识(开发人员和网站架构等信息),系统人设(客服,各项指标回答)
构造“意图-原因”标签集
意图 | 原因 | 数据份数 |
如何提交评价 | 未收到评价邀请 | 1 |
你们有某种宠物吗 | 宠物缺货_短期或长期 | 1 |
某宠物特定需求 | 顾客特殊需求 | 1 |
订单什么时候能做好 | 餐品制作时间 | 1 |
如何访问我的订单历史记录 | 历史订单查询 | 1 |
取消订单 | 取消订单_无具体理由 | 1 |
为什么我的优惠券不见了 | 优惠券未到账 | 1 |
取消订单 | 地址写错误 | 1 |
宠物不对 | 送错宠物 | 1 |
餐厅电话是多少 | 食物变质 | 1 |
我在哪里可以参加活动 | 活动地点咨询 | 1 |
有没有推荐的宠物 | 需要推荐宠物 | 1 |
客户要开发票 | 开发票 | 2 |
1 | Prompt | Response |
2 | 假设你有一套客户意图分类以及该分类下属的原因标签。请根据给定的客服对话内容,判断最有可能的客户意图以及对应的原因标签,意图和原因标签需要严格控制给定的范围之内;一个意图可能对应多个原因,但一个原因只会对应一个意图;如果均不匹配则回答无明确客户意图;回答请使用json的格式,示例:'{"意图": "xxx","原因”: "xxx"}' ### 下面是客户意图的分类 1.客户意图:如何提交评价;原因标签:未收到评价邀请 2.客户意图:你们有某种餐品吗;原因标签:餐品缺货_短期或长期 3.客户意图:某餐品需要做成不辣;原因标签:顾客特需服务 4.客户意图:在餐厅丢失了物品怎么寻回;原因标签:找回遗失物品 5.客户意图:订单什么时候能做好;原因标签:餐品制作时间 6.客户意图:如何访问我的订单历史记录;原因标签:历史订单查询 7.客户意图:取消订单;原因标签:取消订单_无具体理由 8.客户意图:为什么我的优惠券不见了;原因标签:优惠券未到账 9.客户意图:取消订单;原因标签:地址填写错误 10.客户意图:我想要加番茄酱或者不加番茄酱;原因标签:加or不加番茄酱_顾客定制 11.客户意图:餐品不对;原因标签:漏餐错餐 12.客户意图:餐厅电话是多少;原因标签:食物变质 13.客户意图:我在哪里可以参加活动;原因标签:活动地点咨询 14.客户意图:有没有推荐的产品;原因标签:需要推荐餐品 15.客户意图:客户要开发票;原因标签:开发票 ###对话内容 李星辰DY 2023年07月19日 10:23:48 您好,欢迎光临DianCan披萨,有什么可以为您服务的吗? 用户673210 2023年07月19日 10:24:12 我想开一下发票 李星辰DY 2023年07月19日 10:24:35 当然可以,请您提供一下订单号和开票信息,我们会尽快为您处理。 用户673210 2023年07月19日 10:25:01 订单号是DC230715001,开票信息是公司名称:XX科技有限公司,税号:9132XXXXXXXXX 李星辰DY 2023年07月19日 10:25:38 好的,已经收到您的订单号和开票信息,我们会尽快为您开具发票并发送到您的邮箱。请问您的邮箱地址是什么? 用户673210 2023年07月19日 10:26:05 我的邮箱是[example@example.com](mailto:example@example.com) 李星辰DY 2023年07月19日 10:26:32 非常感谢,我们已经记录下了您的邮箱地址。发票将在24小时内发送到您的邮箱,请注意查收。 用户673210 2023年07月19日 10:27:00 好的,谢谢! 李星辰DY 2023年07月19日 10:27:25 不客气,如果您有任何其他问题或需要进一步的帮助,请随时联系我们。祝您用餐愉快! ###输出 | {'意图': '客户要开发票', '原因': '开发票'} |
{'意图': '客户要开发票', '原因': '开发票'}
数据格式:本实验是采用SFT调优方式,需要使用Prompt+Response数据格式。
- Prompt:预设情景+“意图-原因”标签集+对话内容。
- Response:Prompt中对话内容对应的“意图-原因”数据。
客服在获取意图后存入数据库中,后端每天凌晨定时任务查询(断货,宠物特殊需求),大于20触发警报提醒管理人员
对于网站部分询问会调用系统人设里面的知识回答
修改地址和取消订单则直接调用程序内部接口完成
双模型机制防止提示词注入
安全模型只能根据文本是否违法回答 是 或者 否,服务模型输入检查为 是 和输出检查为 否 都将终止会话
少样本学习策略: Prompt:让我们逐步思考,判断以下信息是否包含暴力,血腥,违法法律等非法信息,只能回答是和否