当前位置：首页 > article >正文

ClickHouse的特点与优势

article 2024/10/24 13:50:45

副本特点

副本机制

ClickHouse利用ZooKeeper，通过ReplicatedMergeTree引擎（Replicated 系列引擎）实现了副本机制。副本机制是多主架构，可以将INSERT语句发送给任意一个副本，其余副本会进行数据的异步复制。

副本机制功能：

ClickHouse 副本机制的设计可以最大限度的减少网络数据传输，用以在不同的数据中心进行同步，可以用来建设多数据中心、异地多活的集群架构。
副本机制是实现：高可用（HA）、负载均衡（Load Balance）、迁移/升级（Migration/Upgrade）功能的基础。
高可用：系统会监视副本数据的同步情况，识别故障节点，并在节点恢复正常时进行故障恢复，保证服务整体高可用。

分布式查询

ClickHouse通过分片和分布式表机制提供了线性扩展的能力。

分片机制：用来解决单节点的性能瓶颈，通过将数据进行水平切分，将一张表中的数据拆分到多个节点，不同节点之间的数据没有重复，这样就可以通过增加分片对ClickHouse进行线性扩展。
分布式表：在查询分片的数据时，通过分布式表进行查询，分布式表引擎自身不存储任何数据，仅是一层代理，能够自动路由到集群中的各个分片节点获取数据，即分布式表需要和其他数据表一起协同工作。

如图图1所示，在查询时，我们需要查询分布式表 table_distributed，分布式表会将查询请求自动路由到各个分片节点上，并进行结果的汇聚。

图1 分布式查询

MergeTree引擎

MergeTree（合并树）及其系列（*MergeTree）是ClickHouse最强大的存储引擎，被设计用于插入大量数据到一张表中。数据以数据块的形式被快速写入，数据块在后台会进行异步合并，确保高效的插入和查询性能。

主要支持的功能点有：

主键排序、稀疏索引
支持数据分区
支持副本机制（ReplicatedMergeTree 系列）
支持数据采样
并发数据访问
支持TTL
支持二级索引（Data Skipping Index 跳数索引）

http://www.kler.cn/news/363065.html

相关文章：

SQL高级查询03

关于jmeter中没有jp@gc - response times over time

N9042B UXA 信号分析仪

【三】企业级JavaScript开发之手册与规范

【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit（3）

设计循环双端队列

C#/.NET/.NET Core技术前沿周刊 | 第 10 期（2024年10.14-10.20）

认识maven

Linux中定时任务调度工具——crontab

NASA：全球鹰无人机系统（UAS）上收集的在位云层测量

申请https证书

Spring Boot与JavaWeb融合：在线考试系统的新架构

基于SSM品牌银饰售卖系统的设计

Socket 网络编程与 C# 中的应用实例

GitHub上传文件

串口空闲中断加DMA数据搬运

「C/C++」C++ STL容器库之 std::queue 队列容器

u盘装win10系统提示“windows无法安装到这个磁盘,选中的磁盘采用GPT分区形式”解决方法

蓝桥杯2017年第八届真题-包子凑数

Oracle VirtualBox虚拟机导入VMware ESXi的方法

redis的渐进式哈希？说一下细节？------面试题分享

23种设计模式之工厂方法模式

在 Python 的神经网络程序（特别是 PyTorch 框架中），`class` 和 `forward()` 是定义神经网络模型的关键部分。它们的作用如下：

pytorch调用手写CUDA算子和pybind11的使用

军事领域的深度学习不同于机器学习中的深度学习

如何在本地运行threejs官方示例