当前位置：首页 > article >正文

30.1 时序数据库TSDB的典型特点

article 2025/1/17 6:05:11

本节重点介绍 :

一个神奇的网站 https://db-engines.com/en/ranking

时序数据ranking https://db-engines.com/en/ranking/time+series+dbms

排名方法 https://db-engines.com/en/ranking_definition

DB引擎排名得分的计算方法
DB-Engines排名是按当前流行程度排名的数据库管理系统的列表。我们通过使用以下参数来衡量系统的普及程度：
网站上系统提及的次数，以搜索引擎查询中结果的数量来衡量。目前，我们使用Google和Bing进行此度量。为了仅计算相关结果，我们正在与术语数据库（例如“ Oracle”和“ database”）一起搜索<system name>。
对系统的普遍兴趣。对于此度量，我们使用Google趋势中的搜索频率。
有关系统的技术讨论频率。我们使用与IT相关的著名问答站点Stack Overflow和DBA Stack Exchange上的相关问题数量和感兴趣的用户数量。
提及系统的工作机会数量。我们使用的确有实物，只是雇用了领先的求职引擎上的报价。
提到系统的专业网络中的配置文件数。我们使用国际上最受欢迎的专业网络LinkedIn。
社交网络中的相关性。我们计算提到该系统的Twitter推文的数量。

带时间标签的数据也称为时间序列数据

具有不变性,、唯一性、时间排序性

时序数据库就是存放时序数据的数据库，并且需要支持时序数据的快速写入、持久化、多纬度的聚合查询等基本功能。

Time Series DBMS are designed to efficiently collect, store and query various time series with high transaction volumes

写入平稳、持续、高并发高吞吐

写多读少

实时写入最近生成的数据，无更新

数据量大

冷热分明

具有时效性

多精度数据存储

能否使用关系型数据库实现tsdb

可以看到时序数据库需要解决以下几个问题

时间轴

简介

RRDTool 是最早的时间序列数据库，它自带画图功能，现在大部分时间序列数据库都使用Grafana来画图。
Graphite 是用 Python 写的 RRD 数据库，它的存储引擎 Whisper 也是 Python 写的，它画图和聚合能力都强了很多，但是很难水平扩展。
OpenTSDB 使用 HBase 解决了水平扩展的问题
KairosDB 最初是基于OpenTSDB修改的，但是作者认为兼容HBase导致他们不能使用很多 Cassandra 独有的特性，于是就抛弃了HBase仅支持Cassandra。
新发布的 OpenTSDB 中也加入了对 Cassandra 的支持。故事还没完，Spotify 的人本来想使用 KairosDB，但是觉得项目发展方向不对以及性能太差，就自己撸了一个 Heroic。
InfluxDB 早期是完全开源的，后来为了维持公司运营，闭源了集群版本。在 Percona Live 上他们做了一个开源数据库商业模型正面临危机的演讲，里面调侃红帽的段子很不错。并且今年的 Percona Live 还有专门的时间序列数据库单元。