当前位置: 首页 > article >正文

自动创作PPT 利用提示词和大模型自动创建ppt

背景

ppt创作可以分为3个步骤:1.大纲撰写;2.内容填充;3.ppt实现。我前几天用十分钟的时间做了一个ppt,主讲大模型测评。这里给大家分享一下我的创作过程。

关于步骤1和步骤2,最近发现一个非常好的提示词,能够帮助模型更好的思考,并给出逻辑完备的大纲和内容填充。关于步骤3,我发现了几个好用的网站,最后会议并分享给大家。

步骤1:大纲撰写

1.1 提示词

我使用kimi探索版完成相关任务。创作大纲,你可以使用以下的提示词帮助模型思考、反思、创作。

您是一个旨在提供详细的、逐步的回答的Al助手。您的输出应遵循以下结构:
1.<thinking>部分开始。
2.在思考部分内:
	a.简要分析问题并概述您的方法。
	b.提出一个清晰的解决问题的步骤计划。
	c.如有必要,使用"思维链"推理过程,将您的思考过程分解为编号的步骤。
3.为每个想法包含一个<reflection>部分,其中您要:
	a.回顾您的推理。
	b.检查潜在的错误或疏忽。
	c.如有必要,确认或调整您的结论。
4.确保关闭所有反思部分。
5.</thinking>结束思考部分。
6.<output>部分提供您的最终答案。
在您的回答中始终使用这些标签。在您的解释中要彻底,展示您推理过程的每一步。努力使您的方法精确和合乎逻辑,不要犹豫将复杂问题分解为更简单的组成部分。您的语气应该是分析性的,稍微正式一些,重点是清晰地传达您的思维过程。
记住:<thinking><reflection>必须是标签,并且必须在结束时关闭。确保所有<标签>都在单独的行上,没有其他文本。不要在包含标签的行上包含其他文本。
请帮我解决这个问题:请撰写大纲,介绍大模型评估方面的知识。

1.2 模型输出思考过程

使用该提示词,模型会首先输出思考过程:

<thinking>
a. 分析问题并概述方法:
用户要求撰写一个大纲,介绍大模型评估方面的知识。为了满足这个需求,需要涵盖大模型评估的基本概念、评估方法、指标、工具以及当前的挑战和未来发展方向。

b. 解决问题的步骤计划:
介绍大模型评估的背景和重要性。
详细描述大模型评估的主要维度和类别。
介绍常用的评估方法和指标。
讨论大模型评估的工具和平台。
分析当前大模型评估面临的挑战。
展望大模型评估的未来发展方向。

c. 思维链推理过程:
背景和重要性:解释为什么大模型评估是必要的,以及它在AI发展中的角色。
评估维度和类别:列出并解释不同的评估维度,如知识和能力评测、对齐评测、安全评测等。
评估方法和指标:详细介绍各种评估方法和指标,如BLEU、ROUGE、F1分数等。
工具和平台:介绍一些常用的大模型评估工具和平台,如OpenCompass、FlagEval等。
当前挑战:讨论大模型评估中存在的问题,如数据标注困难、评估成本高等。
未来方向:展望大模型评估的潜在发展方向,如动态评测、智能体评测等。
<reflection>

a. 回顾推理:
上述步骤涵盖了大模型评估的各个方面,从背景到具体方法,再到工具和未来展望,确保了内容的全面性和逻辑性。

b. 检查潜在的错误或疏忽:
需要确保每个部分都有足够的详细信息,并且逻辑上前后连贯。同时,确保引用的内容准确无误。

c. 确认或调整结论:
当前的步骤计划合理且全面,可以按照这个大纲进行详细撰写。

</reflection> 
</thinking>

1.3 模型生成大纲

然后,模型会生成以下的大纲:

<output>
大模型评估大纲
1. 背景和重要性
1.1 大模型的定义和发展
1.2 大模型评估的必要性
1.3 大模型评估在AI发展中的角色

2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
2.1.2 知识补全能力评测
2.1.3 推理能力评测
2.1.4 工具学习能力评测
2.2 对齐评测
2.2.1 道德和伦理评测
2.2.2 偏见性评测
2.2.3 毒性评测
2.2.4 诚实性评测
2.3 安全评测
2.3.1 鲁棒性评测
2.3.2 风险评测
2.4 行业大模型评测
2.4.1 生物 & 医疗
2.4.2 教育
2.4.3 法律
2.4.4 计算机
2.4.5 金融
2.5 综合评测组织
2.5.1 评测基准
2.5.2 评测平台和排行榜

3. 评估方法和指标
3.1 直接评估指标
3.1.1 BLEU
3.1.2 ROUGE
3.1.3 F1分数
3.2 基于辅助模型的评估
3.2.1 QAEval
3.2.2 QuestEval
3.3 基于模型的评估
3.3.1 Perplexity
3.3.2 Generation-based methods

4. 工具和平台
4.1 OpenCompass
4.1.1 概述和特点
4.1.2 安装和使用
4.1.3 评测结果可视化
4.2 FlagEval
4.2.1 概述和特点
4.2.2 使用方法
4.3 其他评估工具
4.3.1 Scikit-learn
4.3.2 TensorFlow 和 Keras
4.3.3 PyTorch
4.3.4 Hugging Face Transformers

5. 当前挑战
5.1 数据标注困难
5.2 评估成本高
5.3 标准答案的多样性和复杂性
5.4 真实应用场景中的表现难以评估

6. 未来发展方向
6.1 动态评测
6.2 智能体评测
6.3 风险评测
6.4 以优化大模型为目标的评测
</output>

可以看到,生成的大纲非常的全面,除了章节4.3之外,基本满足了我作为一个计算机专业人员的需求。

不是用相关提示词,大纲如下:

大纲:大模型评估知识
一、引言
背景介绍:大模型在人工智能领域的重要性及其广泛应用。
评估的必要性:确保模型的可靠性、安全性、公平性和实际应用效果。
二、评估动力与需求
技术创新推动:通过评估发现模型的优势和局限性,推动技术进步。
实际应用验证:验证模型在实际场景中的表现。
安全性与合规评估:确保模型在使用过程中不产生潜在危害。
用户体验提升:通过评估优化用户交互体验。
三、评估维度与框架
文本理解:文本分类、命名实体识别、信息抽取等。
文本生成:摘要生成、文本改写、作文生成等。
知识掌握:学科知识问答、常识推理等。
逻辑推理:逻辑推理、数学计算等。
多模态能力:视觉问答、视觉推理、图文一致性等。
智能性与鲁棒性:指令跟随能力、思维链能力、鲁棒性等。
四、评估方法
人工评估:通过人类专家对模型输出进行定性和定量评估。
自动评估:基于规则或模型的自动化评估方法。
Rule-based方法:基于预定义规则的评估。
Model-based方法:使用裁判员模型或对等评估的方法。
五、评估指标
基础评估指标:准确率、召回率、F1分数等。
高级评估指标:BLEU、ROUGE、METEOR等。
RAI指标:评估模型的责任性,包括公平性、安全性等。
应用场景评估指标:根据具体应用场景定制的评估指标。
六、评估工具与平台
Azure AI Studio:用于构建、评估和部署大模型的平台。
Prompt Flow:简化大模型应用开发的工具。
Weights & Biases:用于跟踪实验和评估模型性能的平台。
LangSmith:帮助跟踪和评估大模型应用的平台。
TruLens:用于神经网络评估和监控的工具。
Vertex AI Studio:评估生成式AI模型的平台。
Amazon Bedrock:支持大模型评估的Amazon平台。
七、评估挑战与未来展望
评估数据集构建:高质量评估数据集的构建及其挑战。
动态评估:持续更新测试样本和评估方法。
智能体评估:在模拟环境中评估大模型的自主性和风险。
以优化为目标的评估:不仅给出评分,还提供改进建议。
八、总结
全面性与公正性:未来评估体系的发展方向。
行业结合:针对不同领域的需求制定专门的评估标准。
持续改进:随着技术发展不断更新和完善评估体系

1.4 效果分析

以评估方法和指标为例,前者说得更详细,例如关于模型评估,前者详细的说出了方法名字“QAEval”,而后者只是一笔带过,这说明前者更加专业。前者更像大纲,后者写了很多具体内容,这些内容应该在步骤2实现,这说明提示词帮助模型更好的理清了我的需求。前者的章节5,也比后者的章节7更加提纲挈领。

步骤2:内容填充

在内容撰写的时候,你可以直接把大纲丢给模型,让模型生成相关内容。

你也可以参照步骤1中的方法,把1.1中的提示词和1.3中的大纲结合起来,重新提问(你可以每次让模型写一个小章节,也可以让模型一口气完成6个章节的思考和撰写,前者效果更好)。我让模型每次撰写一个章节,以章节2“评估维度和类别”为例(这里仍然使用kimi探索版):

2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
问答能力评测主要评估大模型在回答问题时的准确性和流畅性。
常用的评测工具包括QAEval、QAFactEval和QuestEval,分别关注答案的质量、事实准确性和信息完整性。
评估指标包括精确度、召回率和F1分数等。复杂问答任务中,模型需要展示出色的多跳推理和低资源语言处理能力。

2.1.2 知识补全能力评测
知识补全能力评测考察模型掌握大量事实性知识的能力。
常用的方法和基准包括LAMA(使用完形填空形式的知识探针评估语言模型中的关系知识)、Kola(针对世界知识的大规模中文评测基准)和WikiFact(基于维基百科构建的事实准确性评估方法)。
这些方法帮助评估模型在知识问答和知识补全任务中的表现。

步骤3:ppt实现

你可以使用以下几个软件来撰写ppt。你可以把步骤2中文字内容发给他们。个人使用了gamma。

islide、
Kimi、
gamma、
wps的AI生成、
MotionGO、
mindshow、
博思AI PPT、
腾讯文档、
canva:https://www.canva.com/design/

http://www.kler.cn/news/363192.html

相关文章:

  • zh/FAQ/CentOSStream-CentOS Stream 常见问题
  • ECharts饼图-饼图纹理,附视频讲解与代码下载
  • 深入解析C++游戏开发:从基础到高级应用
  • excel判断某一列(A列)中的数据是否在另一列(B列)中
  • AudioSegment 提高音频音量 - python 实现
  • Git_IDEA集成Git
  • Java第三周:继承和多态,抽象类和接口
  • 基于SSM消防物资存储系统的设计
  • 实验03分支---7-9 真睡还是装睡
  • 构建后端为etcd的CoreDNS的容器集群(四)、etcd挂载私有自签名证书进行访问测试
  • 探索未来社交新纪元:元宇宙展厅的无限魅力
  • 修改huggingface的缓存目录以及镜像源
  • 代码随想录算法训练营第三十七天|509. 斐波那契数,70. 爬楼梯,746. 使用最小花费爬楼梯
  • C语言中单字符I/O的使用
  • Go的客户端与服务器通信案例
  • 基于PHP+MySQL+Vue的网上订餐系统
  • jmeter是怎么用的,怎么设计接口测试用例的
  • SEO基础:什么是LSI关键词?【百度SEO优化专家】
  • elementUI提示、通知、弹框每次只出现一个
  • Flutter仿京东商城APP底部导航实现
  • 代码随想录训练营Day06 | 454.四数相加II - 383. 赎金信 - 15. 三数之和 - 18. 四数之和
  • 毕业设计选题:基于django+vue的个人博客系统设计与开发
  • Github 2024-10-17 Go开源项目日报 Top10
  • 华为Eth-Trunk级联堆叠接入IPTV网络部署案例
  • 网络安全:数字世界的护卫
  • 访问kerberos认证华为的kafka集群