当前位置：首页 > article >正文

Prompt优化 COT/COD

article 2025/3/14 18:15:23

文章目录

- - 基本的方法论框架
  - COT / COD
  - COT / COD对比
  - 其他优化点
  - - 1. 示例引导与少样本学习
    - 2. 角色设定与背景引导
    - 3. 任务分解与步骤引导

基本的方法论框架

基础要素：指令、背景信息、补充数据（要求）、输出格式、（其他限制条件）

有时背景信息较长，限制信息可能会失效，可以最后再写一个限制信息。

例如：

大模型用来画思维导图

指令：帮我写一个模型训练的思维导图。
背景信息：千帆ModelBuilder训练流程为框架。
补充数据：思维导图为横版展示。
输出格式：输出内容要有数据准备、模型训练、模型管理和服务管理4大流程。

大模型担任律师

能力与角色：你现在是一个资深律师。
背景信息：最近你接了一个财务侵占的官司，涉案金额5xxx元，你是受害人的辩护律师。
指令：请帮忙出一个法律公告，警示被告尽快偿还非法侵占的财务。
输出风格：公告内容要严谨严肃专业。
输出范围：公告内容不宜超过800字。

COT / COD

Chain of Thought（思维链）

COT（Chain of Thought）是一种通过引导大语言模型（LLM）生成逐步推理过程来提升复杂任务解决能力的技术。其核心在于让模型模仿人类分步骤思考的思维链，将问题分解为多个中间推理环节，最终推导出答案

技术特点：
结构化推理：通过示例或指令要求模型展示“解题过程”，例如数学问题中的分步计算；
可解释性增强：中间步骤的输出便于用户理解模型逻辑，提升信任度；
适用场景：数学推理、符号逻辑、复杂问答等需要多步验证的任务

添加“请逐步思考”“分三步论证”等指令，引导模型展示完整推理路径。测试显示该方法可使数学题准确率提升

Chain of Draft（草稿链）

COD（Chain of Draft）是COT的高效演化版本，其核心是仅保留推理中的关键步骤，通过极简的中间表达（如公式、符号）降低计算成本。

技术特点：
极简输出：每个推理步骤仅用5个词以内表达，例如“20-12=8→答案8”；
效率优势：相比COT减少80%的Token使用量，延迟降低40%-76%；
适用场景：实时交互（客服、语音助手）、资源受限环境（手机、IoT设备）

我的应用场景：在RAG等系统中，与大模型交互的中间步骤，有需要大模型判断的节点。

例如：我需要让视觉大模型判断是否已经打开了某个APP。

{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考，但每个步骤的描述尽量简洁（不超过10个字）。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}

Prompt拆解：

提供角色
在分析过程中，请逐步思考
每个思考步骤不超过10个字
也可以添加要识别APP的背景信息，如盒马：盒马是一家线上买菜平台

使用通义千问2.5-VL-72B：
在这里插入图片描述

1. COD
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考，但每个步骤的描述尽量简洁（不超过10个字）。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图，判断它是否属于盒马APP的页面。
						盒马APP：盒马是一家线上买菜平台。"""
}

回复：搜索框有水果促销信息####是

2. COT
{
            "role": "system",
            "content": """你是一个移动应用识别专家。
            请根据提供的移动应用屏幕截图判断目标应用是否匹配。
            在分析过程中，请逐步思考。
            使用分隔符“####”来区分思考过程与最终答案。
            最终只需回答“是”或“否”。"""
}
{
            "role": "user",
            "content": """请分析这个屏幕截图，判断它是否属于盒马APP的页面。
						盒马APP：盒马是一家线上买菜平台。"""
}

回复：
从屏幕截图中可以看到以下特征：
页面顶部显示了“星宝店”，这是盒马APP中常见的店铺名称。
页面中部有多个分类标签，如“水果鲜花”、“蔬菜豆制品”、“肉禽蛋品”等，这些分类与盒马APP的食品分类一致。
页面底部有“分类”、“盒马小镇”、“购物车”和“我的”等标签，这些标签也是盒马APP的标准导航栏。
页面整体设计风格和布局与盒马APP非常相似。
综合以上分析，可以判断这个屏幕截图属于盒马APP的页面。
是