当前位置: 首页 > article >正文

【AI协作】让所有用电脑的场景都能在ChatGPT里完成。Canvas :新一代可视化交互,让AI易用易得

Canvas :新一代可视化交互,让AI易用易得

要使 AI 更有用、更易获得,需要重新思考我们如何与 AI 交互。Canvas 是一种新方法,也是自两年前推出以来对 ChatGPT 视觉界面的首次重大更新。

Canvas 目前处于早期测试阶段,我们计划快速改进其功能。

当前AI局限:聊天界面易于使用并且适用于许多任务

当您想处理需要编辑和修订的项目时,它会受到限制。Canvas 为此类工作提供了一个新界面。

使用 canvas,ChatGPT 可以更好地了解您要完成的任务的上下文。您可以突出显示特定部分以准确表明您希望 ChatGPT 关注的内容。就像文案编辑器或代码审阅者一样,它可以在考虑整个项目的情况下提供内联反馈和建议。

您可以在 canvas 中控制项目。您可以直接编辑文本或代码。有一个快捷方式菜单供您要求 ChatGPT 调整写入长度、调试代码并快速执行其他有用的操作。您还可以使用 canvas 中的后退按钮来恢复作品的先前版本。

当 ChatGPT 检测到可能有帮助的场景时,Canvas 会自动打开。 您还可以在提示中包含“use canvas”以打开 canvas 并使用它来处理现有项目。

编写快捷方式包括:

建议编辑:ChatGPT 提供内联建议和反馈。

调整长度:将文档长度编辑为更短或更长。

更改阅读级别:调整阅读级别,从 Kindergarten (幼儿园) 到 Graduate School(研究生院)。

添加最终润色:检查语法、清晰度和一致性。

添加表情符号:添加相关的表情符号以强调和着色。

编写和编码:对文件工程等编辑修订

编码是一个迭代过程,在聊天中跟踪对代码的所有修订可能很困难。Canvas 可以更轻松地跟踪和理解 ChatGPT 的更改,我们计划继续提高此类编辑的透明度。

编码快捷方式包括:

审查代码: ChatGPT 提供内联建议来改进您的代码。

添加日志:插入 print 语句以帮助您调试和理解代码。

添加注释:向代码添加注释以使其更易于理解。

修复错误:检测并重写有问题的代码以解决错误。

移植到某种语言:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

训练模型成为协作者

我们训练 GPT-4o 作为创意合作伙伴进行协作。该模型知道何时打开画布、进行有针对性的编辑和完全重写。它还了解更广泛的上下文,以提供准确的反馈和建议。

为了支持这一点,我们的研究团队开发了以下核心行为:

触发画布进行编写和编码

生成多样化的内容类型

进行有针对性的编辑

重写文档

提供内联评论

我们通过 20 多项自动化内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术,例如从 OpenAI o1-preview 中提取输出,以针对其核心行为对模型进行后训练。这种方法使我们能够快速解决写作质量和新用户交互问题,而无需依赖人工生成的数据。

一个关键挑战是定义何时触发画布。我们教模型打开画布以提示 “Write a blog post about the history of coffee beans” ,同时避免过度触发一般的问答任务 “Help me cook a new recipe for dinner” 等。对于编写任务,我们优先改进“正确的触发器”(以牺牲“正确的非触发器”为代价),与带有提示说明的基线零镜头 GPT-83o 相比,达到了 4%。

值得注意的是,此类基线的质量对所使用的特定提示高度敏感。使用不同的提示,基线可能仍然表现不佳,但方式不同,例如,编码和编写任务之间均匀不准确,从而导致错误分布不同和性能欠佳的替代形式。对于编码,我们故意使模型不触发,以避免干扰我们的高级用户。我们将继续根据用户反馈进行改进。

效果对比:带prompt与带Canvas 的ChatGPT

人工评估评估了画布评论的质量和准确性功能。我们的画布模型在提示指令方面优于零镜头 GPT-4o,准确率提高了 30%,质量提高了 16%。


http://www.kler.cn/a/396665.html

相关文章:

  • 从电动汽车到车载充电器:LM317LBDR2G 线性稳压器在汽车中的多场景应用
  • 深入理解 source 和 sh、bash 的区别
  • Springboot定时任务
  • python抓取工具【pyppeteer】用法 直接运行 无错
  • 昆明华厦眼科医院举办中外专家眼科技术研讨会
  • 【postman】怎么通过curl看请求报什么错
  • 新手小白学习docker第八弹------实现MySQL主从复制搭建
  • tauri开发中,使用node将png图片转成苹果的icns图标格式,解决tauri icon生成的mac图标过大问题
  • 高级java每日一道面试题-2024年11月07日-Redis篇-Redis有哪些功能?
  • 演员王子辰—专注革命题材 《前行者》后再出发
  • 【软考】系统架构设计师-计算机系统基础(3):嵌入式系统
  • 搭建 PostgreSQL 主从架构
  • ElementUI的日期组件中禁止选择小时、分钟、秒
  • 卡尔曼滤波:从理论到应用的简介
  • Android 中线程网络超时的处理
  • 缓存及其不一致
  • Yocto - 使用Yocto开发嵌入式Linux系统_13 创建定制层
  • 什么是 Go 语言?
  • 【计算机体系架构】 MESI缓冲一致性
  • 力扣每日一题 3261. 统计满足 K 约束的子字符串数量 II
  • DAY65||Bellman_ford 队列优化算法(又名SPFA)|bellman_ford之判断负权回路|bellman_ford之单源有限最短路
  • LogViewer NLog, Log4Net, Log4j 文本日志可视化
  • 安全见闻1-5
  • 分布式-事务
  • # 第20章 Cortex-M4-触摸屏
  • 深入理解AIGC背后的核心算法:GAN、Transformer与Diffusion Models