当前位置: 首页 > article >正文

要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 4 章:控制温度和 Top-p 采样

要求CHATGPT高质量回答的艺术:提示工程技术的完整指南—第 4 章:控制温度和 Top-p 采样

控制温度和 Top-p 采样是用于管理人工智能语言模型在生成文本时输出的创造性、连贯性和集中性的技术。

让我们打一个比方来简化它:把人工智能想象成一位用文字描绘图画的艺术家。

控制温度: 这种技术就好比艺术家在为画作选择颜色时调整大胆程度。较低的温度(较少的大胆程度)意味着艺术家会选择熟悉和安全的颜色,结果产生更加连贯和可预测的画作。

较高的温度(更大胆)则会鼓励艺术家尝试不同寻常的颜色组合,使画作更具创造性,但可能不太连贯。

示例: 在低温设置下,艺术家可能会用现实主义的色彩来描绘一幅风景画,比如用绿色来描绘草地,用蓝色来描绘天空。在高温设置下,画家可能会使用非传统的颜色,如紫色的草地和橙色的天空,从而使画作更具创造性,但不那么逼真。

Top-p取样是一种进一步优化的生成策略。在每个时间步,选择累积概率超过阈值p的最小词集,然后根据这个词集的概率分布进行随机抽样。这种方法可以更好地平衡生成文本的连贯性和多样性。

Top-p取样: 这种技术就像选择一个调色板,供艺术家在绘画时选择。较低的 top-p 值(较小的调色板)会限制艺术家的色彩选择,从而使绘画更集中、更连贯。较高的 top-p 值(较大的调色板)可为艺术家提供更多的颜色选择,从而使绘画在保持某种程度的连贯性的同时,更具多样性和创造性。

举例: 如果调色板较小(top-p值较低时),艺术家可能只能使用红、蓝、黄等基本颜色,从而导致画作简单而连贯。如果使用较大的调色板(高top-p值),艺术家就可以选择各种色调,从而创作出更多样、更有创意的画作,同时又不会过于混乱。

这两种技术可以单独使用,也可以一起使用,以影响艺术家(人工智能)在绘画(生成文字)时的创造力和连贯性。

控制温度可以调整色彩选择的大胆程度,而 Top-p 采样则可以设置调色板的大小。将这两种技术结合起来,就能在人工智能生成的输出结果中找到创意和清晰度之间的平衡点。

连贯性指的是文章或演讲中的观点和思想之间的关联性和合理性。连贯的文章易于理解,因为它具有逻辑流程,每个句子或段落都与前后句子或段落相关联。连贯有助于确保读者或听众能够跟上作者或演讲者的信息,而不会迷失或混淆。

它们的数值范围是多少?

从技术上讲,温度值的范围可以从 0 到正无穷大,而 Pop-p 值的范围通常在 0 到 1 之间。 此外,0.5 到 1.5 之间的温度值可以在多样性和有意义的输出之间进行合理权衡,但可能需要进行实验才能找到特定情况下的最佳值。

以下是典型温度范围的细分:

最低温度值: 实用的最低温度值接近于 0,但不能正好为 0,因为这会使模型在每一步都只选择最有可能的标记,从而导致高度重复和无意义的输出。

极低的温度值(如 0.1)将导致非常保守和确定性的输出,从而降低创造性和多样性。

最高温度值: 没有严格的最高温度值。但是,当温度升高到一定程度后(如 3 或更高),生成的输出结果会变得越来越随机、不连贯和缺乏意义。一般不建议使用很高的温度值,因为模型输出可能会失去相关性和连贯性。

最佳温度值取决于具体应用以及所需的创造性和连贯性之间的平衡。

较低的 top-p 值(如 0.1)可以创建一个更加集中的词库,从而产生更加连贯和可预测的输出结果。

较高的 top-p 值(如 0.9)可提供更多、更多样化的单词选择,从而产生更具创造性的文本。

以下是提示范例

提示 1:“辩论实施全民基本收入(UBI)的利弊。提供三个支持 UBI 的论据和三个反对 UBI 的论据”。温度: 0.6, Top-p:0.9.

提示 2:(使用上下文链):"与太空探索相关的挑战是什么?温度: 0.7, Top-p: 0.9。

以下是在 ChatGPT 上控制温度和 Top-p 采样的其他真实案例。

**示例 1:**产品评论

想象一下,您想为电子商务网站上【插入产品名称并列出您对该产品的一些看法】的产品评论生成文本。您希望评论内容连贯、相关,但也要显示出一定的创造性和多样性,以吸引读者。

温度:0.7(兼顾连贯性和创造性)

Top-p:0.8(允许多种选词,但不会变得混乱)。

提示:“为一款名为【嵌入名称。 包括其功能、性能和设计方面】的新型无线蓝牙音箱撰写产品评论”。

温度:0.7

Top-p:0.8

**示例 2:**社交媒体营销

假设您正在管理一个品牌的社交媒体,希望创建有关[插入主题]的引人入胜、富有创意的内容,同时确保内容连贯一致、符合品牌形象。

温度: 1.0(鼓励创造性,同时保持连贯性)

Top-p:0.9(为更具创造性的文本提供多样化的词语选择)。

提示: “创建一个社交媒体帖子,宣传我们最新的环保服装系列”。

温度:1.0

Top-p:0.9

**示例 3:**小说写作

假设您正在撰写一篇短篇小说,希望所生成的文字既要有高度的创造性,又要有连贯性,以保持读者的兴趣。

温度:1.2(提高创造性,同时又不牺牲太多连贯性)

Top-p:0.9(允许多种选词,以创造丰富的叙事内容)

提示: “写一个科幻小说的开头段,故事的背景是一个遥远的星球,居住着智慧的外星物种。”

温度:1.2

Top-p:0.9

在上述每个真实例子中,控制温度和 top-p 采样都有助于在生成的文本的创造性和连贯性之间取得适当的平衡。

通过调整这些参数,您可以对输出进行微调,以满足您的特定需求和语境,并增加创造力。


http://www.kler.cn/news/160351.html

相关文章:

  • k8s 安装 Longhorn
  • 【数据结构】动态规划(Dynamic Programming)
  • qt 5.15.2 网络文件下载功能
  • Pair<T, U>
  • Ubuntu22.04 安装nvida-docker2和改路径
  • 分布式数据库HBase
  • 使用Go快速开发TCP公共服务
  • 深信服技术认证“SCSA-S”划重点:XSS漏洞
  • APP测试的测试内容有哪些,常见的Bug分类介绍!
  • 网络和Linux网络_11(数据链路层)以太网(MAC帧)协议+局域网转发+ARP协议
  • jvs智能bi新增:数据集添加sql自定义节点、添加websocket任务进度动态展示等等
  • springboot引入swagger2
  • 10-tornado项目部署
  • 18、XSS——cookie安全
  • RPG项目01_脚本代码
  • Apache Ofbiz XML-RPC RCE漏洞复现(CVE-2023-49070)
  • 识别低效io引起的free buffer waits
  • 日志框架梳理(Log4j,Reload4j,JUL,JCL,SLF4J,Logback,Log4j2)
  • wsl2 ubuntu下配置go执行make init 错误 /bin/bash line 1 go command not found
  • DevOps搭建(三)-Docker环境安装细步骤
  • 多个项目复用node_modules
  • mac电池最大充电限制工具 AlDente Pro中文 for Mac
  • 深入理解Sentinel系列-1.初识Sentinel
  • 【WPF】扫描的方式发现局域网中的Android设备
  • 利用阿里云 DDoS、WAF、CDN 和云防火墙为在线业务赋能
  • 笔记67:Transformer
  • springboot 接口文档
  • 【基于openGauss5.0.0简单使用DBMind】
  • AWS Remote Control ( Wi-Fi ) on i.MX RT1060 EVK - 2 “架构 AWS”
  • 会声会影2024软件还包含了视频教学以及模板素材