数据仓库与数据建模理论
数据仓库的特性:
面向主题 按主题分类
集成 将分散在各个数据库的数据集中到一起
稳定 非实时,一般只做查询
变化 记录历史,反映最近一段时间的变化
数仓分层的意义之一是1.问题定位简化,每层只处理一个简单的问题;
2.中间结果数据,增加复用,减少冗余
3.真实数据与统计数据的解耦
范式建模可以降低数据一致性维护的难度
第一范式:原子性
第二范式:不能有部分函数依赖(部分依赖于主键
第三范式:不能有传递函数依赖
事实表主要有两类字段:一类是事实度量,一类是纬度外键
范式建模的基础上进行一定的冗余,也就是星型模型,雪花模型就是在星型的基础上对维表进行范式,但也不可能变成完全的范式(完全的范式就是关系模型)