当前位置：首页 > article >正文

应用接入gpt

article 2025/2/21 21:34:22

平台：百度千帆大模型

模型：ERNIE-Tiny-8K（客服对话多标签生成模型），ERNIE4.0（安全模型），DeepSeek-R1-14B（人工客服对话模型）

技术：SFT（客服对话多标签生成），提示词工程，双模型机制防止提示词注入

SFT（客服对话多标签生成）

训练方式	迭代轮次Epoch	学习率Learning Rate	序列长度Seq Length
SFT	1	0.00003	4096

学习率（Learning Rate）：是优化算法中的一个重要超参数，它决定了模型在训练过程中更新参数的步长大小。学习率越大，模型参数更新的幅度就越大，训练速度可能会加快，但也可能导致模型错过最优解，甚至出现不收敛、振荡等不稳定情况；学习率越小，模型训练会更稳定，但训练速度会变慢，可能需要更多的训练时间才能达到较好的效果。

序列长度（Seq Length）：指的是输入到模型中的序列数据的长度。在自然语言处理等任务中，文本通常被表示为一系列的词或字符序列，序列长度就是指这个序列中的元素数量。

文档：

百度智能云千帆大模型平台

提示词工程

使用零样本思维链策略和少样本学习，指示模型提问

在控制台中使用推理超参数定义停止标识（开发人员和网站架构等信息），系统人设（客服，各项指标回答）

构造“意图-原因”标签集

意图	原因	数据份数
如何提交评价	未收到评价邀请	1
你们有某种宠物吗	宠物缺货_短期或长期	1
某宠物特定需求	顾客特殊需求	1
订单什么时候能做好	餐品制作时间	1
如何访问我的订单历史记录	历史订单查询	1
取消订单	取消订单_无具体理由	1
为什么我的优惠券不见了	优惠券未到账	1
取消订单	地址写错误	1
宠物不对	送错宠物	1
餐厅电话是多少	食物变质	1
我在哪里可以参加活动	活动地点咨询	1
有没有推荐的宠物	需要推荐宠物	1
客户要开发票	开发票	2

1	Prompt	Response
2	假设你有一套客户意图分类以及该分类下属的原因标签。请根据给定的客服对话内容，判断最有可能的客户意图以及对应的原因标签，意图和原因标签需要严格控制给定的范围之内；一个意图可能对应多个原因，但一个原因只会对应一个意图；如果均不匹配则回答无明确客户意图；回答请使用json的格式，示例：'{"意图": "xxx","原因”: "xxx"}' ### 下面是客户意图的分类 1.客户意图：如何提交评价;原因标签：未收到评价邀请 2.客户意图：你们有某种餐品吗;原因标签：餐品缺货_短期或长期 3.客户意图：某餐品需要做成不辣;原因标签：顾客特需服务 4.客户意图：在餐厅丢失了物品怎么寻回;原因标签：找回遗失物品 5.客户意图：订单什么时候能做好;原因标签：餐品制作时间 6.客户意图：如何访问我的订单历史记录;原因标签：历史订单查询 7.客户意图：取消订单;原因标签：取消订单_无具体理由 8.客户意图：为什么我的优惠券不见了;原因标签：优惠券未到账 9.客户意图：取消订单;原因标签：地址填写错误 10.客户意图：我想要加番茄酱或者不加番茄酱;原因标签：加or不加番茄酱_顾客定制 11.客户意图：餐品不对;原因标签：漏餐错餐 12.客户意图：餐厅电话是多少;原因标签：食物变质 13.客户意图：我在哪里可以参加活动;原因标签：活动地点咨询 14.客户意图：有没有推荐的产品;原因标签：需要推荐餐品 15.客户意图：客户要开发票;原因标签：开发票 ###对话内容李星辰DY 2023年07月19日 10:23:48 您好，欢迎光临DianCan披萨，有什么可以为您服务的吗？用户673210 2023年07月19日 10:24:12 我想开一下发票李星辰DY 2023年07月19日 10:24:35 当然可以，请您提供一下订单号和开票信息，我们会尽快为您处理。用户673210 2023年07月19日 10:25:01 订单号是DC230715001，开票信息是公司名称：XX科技有限公司，税号：9132XXXXXXXXX 李星辰DY 2023年07月19日 10:25:38 好的，已经收到您的订单号和开票信息，我们会尽快为您开具发票并发送到您的邮箱。请问您的邮箱地址是什么？用户673210 2023年07月19日 10:26:05 我的邮箱是[example@example.com](mailto:example@example.com) 李星辰DY 2023年07月19日 10:26:32 非常感谢，我们已经记录下了您的邮箱地址。发票将在24小时内发送到您的邮箱，请注意查收。用户673210 2023年07月19日 10:27:00 好的，谢谢！李星辰DY 2023年07月19日 10:27:25 不客气，如果您有任何其他问题或需要进一步的帮助，请随时联系我们。祝您用餐愉快！ ###输出	{'意图': '客户要开发票', '原因': '开发票'}

{'意图': '客户要开发票', '原因': '开发票'}

数据格式：本实验是采用SFT调优方式，需要使用Prompt+Response数据格式。