当前位置: 首页 > article >正文

clickhouse里的数组数据类型与相关使用介绍

文章目录

    • clickhouse数组类型
    • Array介绍
    • 使用示例
    • 包含查询

clickhouse数组类型

  • clickhouse支持丰富的数据类型,给我们的数据存储和查询带来很多遍历。我比较喜欢的一种类型是数组类型,MySQL和PostgreSQL不支持这种数据结构,clickhouse提供了支持
  • clickhouse支持以下数组类型:
    • Array(T):其中T可以是任何有效的数据类型,例如Array(Int32),Array(String)等。
    • FixedString(N):其中N表示固定的字符串长度,例如FixedString(10)表示固定长度为10的字符串数组。
    • Nested:嵌套数组类型,可以用于表示复杂的数据结构。
    • Tuple(T1, T2, …, Tn):定义一个元组数组,元组中包含n个元素,每个元素表示一个T类型的值。
  • clickhouse数组类型可以用于存储和处理具有重复性质的数据。例如,一个包含学生姓名和他们所上的课程的数据集可以使用数组类型来处理课程名的多个条目。

Array介绍

  • 本次主要介绍最传统的数组 Array(T),因为四种符合数组类型,我对Array(T)使用最多
  • 想看官方文档的,可以去这里:官方社区参考文档
  • Array(T)是一种将T类型的值组合成一个有序列表的数据结构,存储的数值类型必须是T
  • 数组类型可以使用[]语法来表示,例如Int64[]就是一个由Int64类型值组成的数组
  • 数组类型可以作为表中的一列数据类型,也可以嵌套在其他数据类型中使用,例如可以将Array(String)类型作为某个Tuple类型的一个字段,或者将Array(Tuple(Int32,String))类型作为某个表的一列
  • 可以使用ClickHouse的函数来对数组类型进行操作,例如对数组进行聚合操作avg,对数组中的元素进行排序sort等
  • ClickHouse还支持将数组中的元素拆分成多行,以便更方便地进行数据分析和处理

使用示例

ClickHouse支持数组类型Array(T),其中T可以是任何其他数据类型,例如Int32、Float64、String等。以下是一些常见的用法举例:

  1. 创建Array类型的列(这里可以使用Array(String),也可以使用String[]):
CREATE TABLE mytable (
  id Int32,
  myarray Array(String)
) ENGINE = MergeTree()
ORDER BY id;
  1. 插入数据到Array类型的列:
INSERT INTO mytable VALUES (1, ['apple', 'banana', 'orange']), (2, ['cat', 'dog']);
  1. 查询包含Array类型的列:
SELECT id, myarray FROM mytable;

输出结果:

┌─id─┬─myarray─────────────────────┐
│  1 │ ['apple','banana','orange'] │
│  2 │ ['cat','dog']               │
└────┴─────────────────────────────┘
  1. 使用arrayJoin函数展开Array类型的列(这个很常用,将数组值展开成多条记录,用于展示或者统计):
SELECT id, arrayJoin(myarray) FROM mytable;

输出结果:

┌─id─┬─arrayJoin(myarray)─┐
│  1 │ apple              │
│  1 │ banana             │
│  1 │ orange             │
│  2 │ cat                │
│  2 │ dog                │
└────┴────────────────────┘
  1. 使用arrayMap函数对Array类型的列进行映射:
SELECT id, arrayMap(x -> length(x), myarray) as lengths FROM mytable;

输出结果:

┌─id─┬─lengths─────┐
│  1 │ [5,6,6]     │
│  2 │ [3,3]       │
└────┴─────────────┘

这里使用arrayMap函数对myarray中的每个元素应用length函数,得到数组长度的列表。

包含查询

  • 对于数组类型Array(T),明白其具体含义后,使用起来并不复杂
  • 像前文所说一样,创建表定义数组类型,插入时插入对应数组
  • 显然,使用数组类型,主要是为了后面的查询功能,前面已经给出了arrayJoin函数和arrayMap函数的简单举例
  • 最后给出大家可能比较常用的包含查询函数,indexOf函数和has函数,都是查询是否包含给定值,返回符合条件的列
SELECT * FROM signal_status ss where time_stamp = '2022-12-27 15:30:00' and indexOf(green_movement , 'EB:CROSSING') > 0;
SELECT * FROM signal_status ss where time_stamp = '2022-12-27 15:30:00' and has(green_movement , 'EB:CROSSING') = 1;

http://www.kler.cn/news/17371.html

相关文章:

  • 【C++复习1】程序结构和C++的工作原理
  • Java程序设计入门教程--数组
  • 小球下落(dropping balls)uva679
  • go 打包文件夹成zip文件
  • Envoy控制面实践
  • 漫画 | Linux之父:财务自由以后,我失眠了!
  • 华为OD机试 - 整理扑克牌(Python)
  • [计算机图形学]光场,颜色与感知(前瞻预习/复习回顾)
  • 对比 LVS 负载均衡群集的 NAT 模式和 DR 模式,基于 CentOS 7 构建 LVS-DR 群集
  • springboot 集成 shardingSphere 加mybatisplus 自带增加 分页查询 和源代码包 分库分表 单库 分表 使用雪花算法id
  • node.js 处理路径问题
  • VR与AR:哪个有更大的潜力改变未来?
  • 今天面了个字节跳动拿35K出来的,真是砂纸擦屁股,给我露了一手啊
  • Skywalking
  • gtest之高级主题
  • Spring常用注解总结
  • PAT A1024 Palindromic Number
  • Java对象的创建方式以及对象的引用
  • 【Elsevier】中科院2区TOP, 高被引119篇, 稳定检索22年, 1周可见刊,5月15截稿~
  • Simulink 自动代码生成电机控制:弱磁控制从仿真到硬件开发板验证实验
  • 豪取BAT!超详细暑期实习算法面经(非科班无论文)
  • 如何监控一个程序的运行情况,然后视情况将进程杀死并重启
  • redis使用总结
  • 对传递函数的零极点、频率响应、稳定性的理解
  • Vue3 如何全局使用按钮截流指令
  • 复古决战快速施法穿墙秒怪分析流程及安全防护
  • 网络基础设施 拥塞控制
  • 基于JavaWeb实现的寻码网文章资讯管理系统
  • 动态页面配置
  • 我有一个方法判断你有没有编程天赋