Hbase入门
目录
Hbase逻辑结构
一、基础知识
1. Hbase逻辑结构
- 行键(Rowkey):唯一标识一行数据,按照字典序(row_key1 < row_key11 < rowkey2)排列.
- 列Col:数据记录的一条属性
- 列族:将多列划分为一类,视为一个列族。例如上图中(math、DS、DB列被归到Scores这一列族)
- Region:将行数据进行切片后得到的,记录切片。(数据按行切分后的一部分)
- Store:对Region再按照列族切分后,得到的一块一块的零散数据。
这个逻辑结构只是方便我们理解数据,但是在存储上并不是这样的结构。
2. 物理存储结构
逻辑结构上的每一列的值,都要使用一行去存储。
Row_key用于对应逻辑结构中的一行数据,其中有两个重要列:TimeStamp
,Type
;
- Timestamp,时间戳:相当于数据的一个版本号,每次操作数据后都会对应一个时间戳。具有最新的时间戳的数据代表最新的数据。
- Type,操作类型:数据的操作类型
大数据学习之HBase入门笔记 - 5akura - 博客园