当前位置: 首页 > article >正文

Clickhouse初认识

技术主题-clickhouse

一什么是clickHouse

1)本质上就是一款数据库管理系统,能提供海量数据的存储和检索
2)基于列存储,数据是按照列进行存储的(数据格式一样,方便进行压缩)
3)具备功能(多核并发处理、分布式处理、兼容sql)兼容mysql的sql语法,有sql经验,便于快速上手熟悉
4)基于OLAP,和传统的事物数据库不同,倾向于大数据量的分析

二clickHouse的4个概念

1)granule: a logical breakdown of rows inside an uncompressed block;default is 8192 rows
逻辑的概念,默认是8192行,最小的不可分的数据集

2)primary key:the sort order of a table
表的主键,用来排序的一个键

3)primary index: an in-memory index containing the values of the primary keys of the first row of each granule
稀疏索引,加速查询

4)part: a folder of files consisting of the column files and index file of a subset of a table is data
就是一个目录,目录里面包含列文件和索引文件,批量插入一次创建一个part

三Inserting data into a table

1)创建数据表-primary key

请添加图片描述

2)每次批量插入创建一个part,官方建议最少1000行,举个例子
请添加图片描述

3)数据的存储,文件是基于主键的顺序,有索引文件,每个列是一个文件

请添加图片描述

4)mergetree合并part

请添加图片描述

5)mergetree合并part,默认最大的part由参数控制
请添加图片描述

6)primary indexs

请添加图片描述

5)每一个granule用单独的线程去处理,处理快的线程可以处理慢线程的任务

请添加图片描述


http://www.kler.cn/a/134471.html

相关文章:

  • 【R78/G15 开发板测评】串口打印 DHT11 温湿度传感器、DS18B20 温度传感器数据,LabVIEW 上位机绘制演化曲线
  • golang如何实现sse
  • 《C++在金融领域的技术革命:高效、安全与创新的融合》
  • vivo 游戏中心包体积优化方案与实践
  • 【Pikachu】目录遍历实战
  • 在 Service Worker 中caches.put() 和 caches.add()/caches.addAll() 方法他们之间的区别
  • Android设置控件透明度
  • 2023.11.17 hadoop之HDFS进阶
  • 计算机毕业设计选题推荐-掌心办公微信小程序/安卓APP-项目实战
  • SpringBoot学习笔记-创建个人中心页面(上)
  • ZYNQ_project:test_fifo_255X8
  • 人工智能:科技的魔术师
  • Ultipa Transporter V4.3.22 即将发布,解锁更多易用功能!
  • 智慧环保:科技驱动下的环境保护新篇章
  • 概念理论类: TCP/IP、Http、Socket之间的区别
  • axios的原理及实现一个简易版axios
  • 基于 gin + websocket 即时通讯项目 (一、项目初始化)
  • SpringCloudAlibaba系列之Nacos服务注册与发现
  • 十倍增量的海外客户开发新方式来了!外贸企业可直接照做
  • 【ELK01】ELK简介以及ElasticSearch安装、ES客户端工具-Head安装、报错问题整理
  • 6 个问题搞懂 HTTPS 加密通信的原理与 HTTPS 通信安全协议
  • JPA整合Sqlite解决Dialect报错问题, 最新版Hibernate6
  • Spring cloud负载均衡@LoadBalanced LoadBalancerClient
  • “我们把最扎心的话,说给了自己最亲近的人” 何解?| IDCF
  • 多标签页之间的通信
  • GoLong的学习之路,进阶,标准库之并发(context)补充并发三部曲,你真的明白context吗?