当前位置: 首页 > article >正文

Clickhouse分布式表初体验

ClickHouse的分布式表是一种特殊类型的表,它允许你跨多个节点进行数据的查询和写入操作。以下是创建分布式表的步骤和案例:

1. 创建本地表:
   在集群的每个节点上创建一个本地表,可以使用`ReplicatedMergeTree`系列引擎来实现数据的复制。例如: 

CREATE TABLE city_local (
  `fdate` Int64,
  `city_code` Int32,
  `city_name` String,
  `total_cnt` Int64
) ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/city_local', '{replica}')
PARTITION BY fdate
ORDER BY (fdate, city_code, city_name)
SETTINGS index_granularity = 8192, storage_policy = 'ssd_to_hdd';

   这里`{shard}`和`{replica}`是集群配置中的占位符,用于指定分片和副本信息。

2. 创建分布式表:
   使用`Distributed`引擎创建一个分布式表,它不会存储数据,而是将查询和写入操作代理到本地表。例如:
  

CREATE TABLE city_all ON CLUSTER ck_cluster_name AS city_local
ENGINE = Distributed(ck_cluster_name, 'test_db', 'city_local', rand());

   这里`ck_cluster_name`是集群名称,`test_db`是数据库名称,`city_local`是本地表名称,`rand()`是一个分片键,用于数据的随机分布。

3. 插入数据:
   可以直接向分布式表插入数据,ClickHouse会将数据分发到对应的本地表。例如:
  

INSERT INTO city_all (fdate, city_code, city_name, total_cnt) VALUES (20210131, 4000, 'guangzhou', 420000);

   数据会被写入到对应的本地表中。

4. 查询分布式表:
   查询分布式表时,ClickHouse会在所有分片上执行查询并将结果合并。例如:
 

SELECT * FROM city_all;

   这会返回所有分片上的`city_all`表的数据。

5. 更新和删除操作:
   分布式表本身不支持直接的`UPDATE`和`DELETE`操作,这些操作需要在本地表上执行。例如:
 

ALTER TABLE city_local ON CLUSTER ck_cluster_name UPDATE total_cnt = 3333 WHERE city_name = 'foshan';
ALTER TABLE city_local ON CLUSTER ck_cluster_name DELETE WHERE city_name = 'foshan';

   这些操作会应用到集群中的所有本地表。

6. 添加字段:
   可以为本地表添加新字段,并且这个变化会自动反映到分布式表上。例如:

ALTER TABLE city_local ON CLUSTER ck_cluster_name ADD COLUMN history Int32;

   添加字段后,新插入的数据会包含这个新字段。

7. 删除表:
   删除分布式表或本地表时,需要指定集群名称。例如:
 

DROP TABLE city_all ON CLUSTER ck_cluster_name;
DROP TABLE city_local ON CLUSTER ck_cluster_name;

   这会删除集群中的相应表。

以上步骤和示例展示了如何在ClickHouse中创建和使用分布式表。需要注意的是,分布式表的写入操作默认是异步的,可能会在短时间内造成数据的不一致性。因此,在生产环境中,通常建议直接写入本地表,而从分布式表进行读取操作。
 


http://www.kler.cn/news/327739.html

相关文章:

  • python的内存管理机制
  • DOM元素导出图片与PDF:多种方案对比与实现
  • 数据集-目标检测系列-豹子 猎豹 检测数据集 leopard>> DataBall
  • 线程池:线程池的实现 | 日志
  • 普通人如何在未来市场中寻找赚钱机会?
  • 深信服2025届全球校招研发笔试-C卷(AK)
  • UE4/UE5开发资源
  • pyqt QGraphicsView 以鼠标为中心进行缩放
  • uniapp中实现评分组件,多用于购买商品后,对商品进行评价等场景
  • 数据结构-AC自动机
  • python 实现矩阵的Schur complement舒尔补算法
  • Goland无法使用debug的修复
  • 【源码+文档+调试讲解】无人超市系统python
  • 【Docker】02-数据卷
  • 【研1深度学习】《神经网络和深度学习》阅读笔记(记录中......
  • 博弈论(学习笔记)
  • RK3568 android11 适配鼎桥MT5710-CN 5G模块
  • 墙绘产品在线展示:SpringBoot技术的应用
  • 数据结构——对顺序线性表的操作
  • docker 私有仓库的镜像删除
  • 基于SSM的O20兼职系统的设计与实现(源码+定制+文档)
  • Windows下安装 LLama-Factory 保姆级教程
  • leetcode:字符串相加
  • leetcode每日一题day19(24.9.29)——买票需要的时间
  • 为啥数据需转换成tensor才能参与后续建模训练
  • Kafka学习笔记(一)Linux环境基于Zookeeper搭建Kafka集群、Kafka的架构
  • 生信名词|脱靶效应|表型药物发现|VAE|批次效应|基于表型|自监督学习
  • pdf怎么编辑修改内容?详细介绍6款pdf编辑器功能
  • 解决docker一直出现“=> ERROR [internal] load metadata for docker.io/library/xxx“的问题
  • 基于SpringBoot+Vue的服装销售管理系统