当前位置：首页 > article >正文

大数据术语系列（1）——COW和MOR，我如何使用chatgpt通俗易懂地理解了hudi这两种表类型

article 2025/1/12 0:57:42

从传统数据库到大数据的转变，首当其冲的是各种术语的理解。

所以我与chatgpt发生了一系列对话，以便于我能快速理解这些术语。

我先把汇总的结果放在前边，后边会一步步地来说明我是如何获取这些信息的。前边我也发过一些关于chatgpt提示词相关的文章，能更好地帮助我们与chatgpt进行沟通。

提示词工程技术

Copy on Write (COW)和Merge on Read (MOR)两种模式的主要特点和区别：

特性/模式	Copy on Write (COW)	Merge on Read (MOR)
数据更新	通过复制并重写整个文件来更新	将更改作为增量日志保存
读取性能	高；因为总是直接读取最新的完整快照	较低；需要在读取时合并基础文件与日志
写入性能	较低；每次变更都需重写整个文件	高；仅追加变化至增量日志
存储效率	较低；每次更新均产生新的全量数据副本	较高；只需额外存储变化部分
实时查询支持	不适用于需要极端实时反馈的场景	支持近乎实时地查询最新数据
适用场景	主要针对读操作多、数据变动较少的应用	主要针对写操作频繁、需要即时视图更新的应用

问题1：零样本提示（Zero-Shot Prompting）

你能跟我通俗易懂地解释一下hudi表cow类型和mor类型的区别吗

问题2：自洽性可能(Self-Consistency)

你可以结合实际例子再做一个解释说明吗？

问题3：定向刺激提示（Directional Stimulus Prompting）

我感觉我还不是很懂，你再解释得更通俗易懂一些

问题4：定向刺激提示（Directional Stimulus Prompting）

你能把上边COW和MOR的特点做一个表格吗，让我非常清楚地能看出两者的区别

问题4：零样本提示（Zero-Shot Prompting）和自洽性可能(Self-Consistency)

使用MOR模式的时候，为何要多删除带_ro和_rt的表？

http://www.kler.cn/a/233471.html

相关文章：

嵌入式入门Day38

Vue2: el-table为每一行添加超链接，并实现光标移至文字上时改变形状

机器学习无处不在，AI顺势而为，创新未来

系统思考与因果智慧

Vue进阶（贰幺贰）npm run build多环境编译

linux centos挂载未分配的磁盘空间

为什么说重载发生在编译期而重写发生在运行期

【Redis笔记】分布式锁及4种常见实现方法

Linux cp命令（cp指令）解析

零基础学Python之整合MySQL

Vite 下一代的前端工具链，前端开发与构建工具

C++重新入门-C++运算符

2024春晚刘谦魔术与约瑟夫环问题

C++ 贪心区间问题最大不相交区间数

C#，雷卡曼数（Recamán Number）的算法与源代码

【Nicn的刷题日常】之有序序列合并

unity editor 编辑器 GUID localID LocalFileId 查找问题

Android java基础_类的封装

React环境配置

程序的内存模型

SpringMVC第一天

动态内存管理（下）

SpringMVC第二天

2024年2月5日-2月11日（全面进行+收集虚幻引擎免费资源）

洛谷 P1048 [NOIP2005 普及组] 采药

用python写个类