当前位置: 首页 > article >正文

Prompt优化 COT/COD

文章目录

      • 基本的方法论框架
      • COT / COD
      • COT / COD对比
      • 其他优化点
        • 1. 示例引导与少样本学习
        • 2. 角色设定与背景引导
        • 3. 任务分解与步骤引导

基本的方法论框架

基础要素:指令、背景信息、补充数据(要求)、输出格式、(其他限制条件)

有时背景信息较长,限制信息可能会失效,可以最后再写一个限制信息。

例如:

大模型用来画思维导图

指令: 帮我写一个模型训练的思维导图。
背景信息:千帆ModelBuilder训练流程为框架。
补充数据:思维导图为横版展示。
输出格式:输出内容要有数据准备、模型训练、模型管理和服务管理4大流程。

大模型担任律师

能力与角色:你现在是一个资深律师。
背景信息:最近你接了一个财务侵占的官司,涉案金额5xxx元,你是受害人的辩护律师。
指令: 请帮忙出一个法律公告,警示被告尽快偿还非法侵占的财务。
输出风格:公告内容要严谨严肃专业。
输出范围:公告内容不宜超过800字。

COT / COD

Chain of Thought(思维链)

COT(Chain of Thought)是一种通过引导大语言模型(LLM)生成逐步推理过程来提升复杂任务解决能力的技术。其核心在于让模型模仿人类分步骤思考的思维链,将问题分解为多个中间推理环节,最终推导出答案

技术特点:
结构化推理:通过示例或指令要求模型展示“解题过程”,例如数学问题中的分步计算;
可解释性增强:中间步骤的输出便于用户理解模型逻辑,提升信任度;
适用场景:数学推理、符号逻辑、复杂问答等需要多步验证的任务

  • 添加“请逐步思考”“分三步论证”等指令,引导模型展示完整推理路径。测试显示该方法可使数学题准确率提升

Chain of Draft(草稿链)

COD(Chain of Draft)是COT的高效演化版本,其核心是仅保留推理中的关键步骤,通过极简的中间表达(如公式、符号)降低计算成本。

技术特点:
极简输出:每个推理步骤仅用5个词以内表达,例如“20-12=8→答案8”;
效率优势:相比COT减少80%的Token使用量,延迟降低40%-76%;
适用场景:实时交互(客服、语音助手)、资源受限环境(手机、IoT设备)

我的应用场景:在RAG等系统中,与大模型交互的中间步骤,有需要大模型判断的节点。

例如:我需要让视觉大模型判断是否已经打开了某个APP。

{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}

Prompt拆解:

  1. 提供角色
  2. 在分析过程中,请逐步思考
  3. 每个思考步骤不超过10个字
  4. 也可以添加要识别APP的背景信息,如盒马:盒马是一家线上买菜平台

使用通义千问2.5-VL-72B:
在这里插入图片描述

1. COD
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考,但每个步骤的描述尽量简洁(不超过10个字)。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
						盒马APP:盒马是一家线上买菜平台。"""
}

回复:搜索框有水果促销信息####是

2. COT
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中,请逐步思考。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图,判断它是否属于盒马APP的页面。
						盒马APP:盒马是一家线上买菜平台。"""
}

回复:
从屏幕截图中可以看到以下特征:
页面顶部显示了“星宝店”,这是盒马APP中常见的店铺名称。
页面中部有多个分类标签,如“水果鲜花”、“蔬菜豆制品”、“肉禽蛋品”等,这些分类与盒马APP的食品分类一致。
页面底部有“分类”、“盒马小镇”、“购物车”和“我的”等标签,这些标签也是盒马APP的标准导航栏。
页面整体设计风格和布局与盒马APP非常相似。
综合以上分析,可以判断这个屏幕截图属于盒马APP的页面。
是

COT / COD对比

image-20250310103518349

对大模型在数据集GSM8K上对测试,可发现COD的准确率几乎和COT相同。

但在所需Token、延迟时间上,COD有明显的优势。

image-20250310103539497

例如:

问题: 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖?

1.标准提示(直接答案)

回复: 8

2.思维链(CoT)提示(逐步解释)

回复:

杰森一开始有20个棒棒糖。

给了一些之后,他剩下12个。

要找出他给了多少,我们做减法:20 - 12。

这给出了8

3.草稿链(CoD)提示(简洁推理)

回复: 20 - 12 = 8 → 最终答案:8.

CoT是全面的,但可能过于繁琐。CoD去除了不必要的部分,保留清晰度的同时节省时间。

其他优化点

1. 示例引导与少样本学习
  • 提供3-5个输入输出示例,帮助模型快速掌握任务模式。如翻译任务可给出中英对照样例
  • 对于创意类任务,给出风格参考(如:“模仿鲁迅杂文风格写作”)
  • 对于文本分类,“样例:'CPU性能升级’→科技 样例2:'欧冠决赛’→体育 请分类:‘新型电池技术’”
2. 角色设定与背景引导

明确要求模型扮演特定角色(如科学家、程序员),并设定其职业背景、目标动机,可提升回答的专业性与一致性。例如:“你是一名资深营养学家,需用通俗语言解释维生素C的作用”。

  1. 科学解释场景
    “你是一位量子物理研究员,需用生活化比喻向中学生解释量子纠缠现象”
    → 输出会使用"如同心灵感应的粒子"等类比
  2. 商业分析场景
    “作为麦肯锡咨询顾问,请用SWOT分析法评估新能源汽车市场”
    → 生成包含竞争优势、政策风险等维度的结构化报告
3. 任务分解与步骤引导
  • 将复杂任务拆解为明确步骤,例如:“第一步分析数据特征→第二步建立模型→第三步验证结果”

  • 要求模型先展示推理过程再输出结论,可提升数学类问题的准确性

  • 活动策划:“1.确定主题→2.预算分配→3.流程设计→4.风险评估”。→ 生成包含时间轴、应急预案的方案


http://www.kler.cn/a/584460.html

相关文章:

  • 时间有限,如何精确设计测试用例?5种关键方法
  • pop_dialog_state(state: State)弹出对话栈并返回到主助手,让整个对话流程图可以明确追踪对话流,并将控制权委派给特定的子对话图。
  • 使用conda将python环境打包,移植到另一个linux服务器项目中
  • Matplotlib高阶技术全景解析
  • 【数据挖掘】知识蒸馏(Knowledge Distillation, KD)
  • kali linux 漏洞扫描
  • (每日一题) 力扣 179 最大数
  • 前端面试:如何实现预览 PDF 文件?
  • 基于深度学习的肺炎X光影像自动诊断系统实现,真实操作案例分享,值得学习!
  • 【文献阅读】SPRec:用自我博弈打破大语言模型推荐的“同质化”困境
  • 电子电气架构 --- 智能电动汽车概述
  • 塔能IVO-SCY智能机箱:点亮智慧城市的电力“智慧核芯”
  • python语言写的一款pdf转word、word转pdf的免费工具
  • 微店关键词搜索接口(micro.item_search)返回数据测试指南
  • Spring 注解解析
  • java: system类
  • 高效集成聚水潭采购退货数据到MySQL的最佳实践
  • PHP批量去除Bom头的方法
  • JVM崩溃时产生的文件 hs_err.pid.log
  • 【实战ES】实战 Elasticsearch:快速上手与深度实践-8.2.1AWS OpenSearch无服务器方案