大数据的技术栈-逐步完善
目录
1.hadoop
a.HDFS分布式文件系统
b.Yarn集群资源管理器
c.MapReduce sql引擎
d.Impala sql引擎
e.工具概观
2.数据仓库知识
a.Hive数据库
1)Hive Sql
2)数据库结构
b.Doris数据库
3.混合处理框架SPARK
a.Spark
b.集群架构
4.数仓模型知识
5.开发工具
a.Dbeaver
b.Idea
6.kafka
7.实时处理框架flink
转职开始做大数据了,逐步跟着学习的脚本把知识变成自己的
1.hadoop
a.HDFS分布式文件系统
b.Yarn集群资源管理器
前端工作流异常时候 yarn检查异常信息-CSDN博客
c.MapReduce sql引擎
d.Impala sql引擎
e.工具概观
2.数据仓库知识
a.Hive数据库
1)Hive Sql
2)数据库结构
b.Doris数据库
3.混合处理框架SPARK
a.Spark
1)SCALA
Scala中的选项(Options )-CSDN博客
b.集群架构
使用spark进行递归的可行方案-CSDN博客
spark读取和保存本机文件-CSDN博客
本机spark 通idea连接Oracle的坑-CSDN博客
4.数仓模型知识
a.分层逻辑
b.模型规范
c.指标检查
5.开发工具
a.Dbeaver
b.Idea
windows idea本地执行spark sql避坑-CSDN博客