当前位置: 首页 > article >正文

理解clickhouse 里的分区和分片键区别

文章目录

      • 分片
      • 分区
      • 两分片,0副本的cluster

分片

CREATE TABLE logs_distributed
AS logs_local
ENGINE = Distributed(
    cluster_name,        -- 集群名称
    database_name,       -- 数据库名称
    logs_local,          -- 本地表名
    cityHash64(user_id)  -- 分片键:按 `user_id` 分片
);

分片键用于在分布式表中,将数据分布到不同的节点(shard)上。
它决定数据存储在具体哪个节点,目的是负载均衡和查询分布。
通常由 Distributed 表定义,通过哈希函数计算。

分区

CREATE TABLE logs_local
(
    event_date Date,
    user_id UInt64,
    event String
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(event_date)  -- 分区键:按月份分区
ORDER BY (user_id, event_date);   -- 排序键

分区键用于将数据按逻辑分块存储在物理磁盘上。
主要目的是方便数据的删除、归档以及查询优化。
常见的分区方式包括按日期、按时间区间等

两分片,0副本的cluster

在这里插入图片描述


http://www.kler.cn/a/409602.html

相关文章:

  • Gbase8s 允许内置用户创建用户以及创建只读权限用户以及利用角色管理普通用户权限
  • 【vue】vue中插槽slot的用法详解
  • c ++零基础可视化——vector
  • 《数据结构》学习系列——图(中)
  • 详解Oracle表的类型(二)
  • 力扣 LeetCode 110. 平衡二叉树(Day8:二叉树)
  • 降本增效的新利器
  • 第49届ICPC亚洲区域赛,非凸科技再次支持上海赛站
  • TensorFlow手动更新模型特定变量
  • 重写radioselect类自定义个性化单选框
  • Flink四大基石之Window
  • 黄仁勋:人形机器人在内,仅有三种机器人有望实现大规模生产
  • Web 学习笔记 - 网络安全
  • 简单快速区分Shell, sh, bash:
  • C/C++中的回调用法
  • 【测试工具JMeter篇】JMeter性能测试入门级教程(二)出炉,测试君请各位收藏了!!!
  • 《用 Python 和 Tkinter 打造惊喜弹窗小应用教程》
  • 【MySQL】数据库 Navicat 可视化工具与 MySQL 命令行基本操作
  • 【青牛科技】D3308 一块带有 ALC 的双通道前置放大器。它适用于立体声收录机和盒式录音机。
  • 小米C++ 面试题及参考答案下(120道面试题覆盖各种类型八股文)
  • 对象的大小
  • Paddle Inference部署推理(十二)
  • Flink Standalone 集群模式安装部署教程
  • 「Mac玩转仓颉内测版32」基础篇12 - Cangjie中的变量操作与类型管理
  • FileLink内外网文件共享系统与FTP对比:高效、安全的文件传输新选择
  • Js-对象-04-String