大数据面试——引入
引入
随着市场行情的变化,大数据领域也从当初我初入这个行业时的火爆,到如今趋于平静。从培训机构都开始不怎么搞大数据课程,就可见一斑。
但是大数据是真的不缺人了吗?
这倒也不是,只是对应的需求越来越高了。就以我所在部门为例,最近需要招资深数仓开发,我作为技术面的面试官,这几个月下来,能从我这边通过的候选人都寥寥无几。而且由于招的岗位对学历、工作经历等要求都很高,所以到我这边的时候,对应候选人的过往履历,都已经是看起来很不错的了。
但是他们中绝大多数,在面试过程中,都存在以下问题:
- 对于技术深度细节掌握不够。很多人连自己写着“精通”的技术,理解都是很欠缺的;
- 技术面太窄。以这里招的目标岗位为例,需要候选人具备离线和实时能力外,最好还需要有一定的数据湖相关技术栈使用经验,但绝大多数候选人都不具备;
- 项目理解不足。很多候选人对自己做过的项目完全没有自己的思考,只知道做了什么,不知道为什么做,以及如何做的更好。
本专栏主要分为技术面试(技术概览+面试)、项目面试两个模块,适合初中高级数据工程师。
下面是我梳理的大数据面试专栏的内容概要:
- 技术面试
- 数据结构与算法
- Linux
- Java
- Zookeeper与分布式原理
- Hadoop
- HBase
- Kafka
- Hive
- Spark
- Flink
- 全域数仓到数据资产
- 数据湖到湖仓一体
- 红色标识的为需要精通,黄色标识为需要熟悉,白色标识为需要掌握
- 项目面试
- 产品
- 技术
- 落地
我个人认为,学习最好的方法就是通过输出倒逼输入,而面试是最好的输出方式之一。
希望能够通过这个专栏给小伙伴以下帮助
- 对于刚进入大数据行业的中低级工程师们,能够起到扫盲和指引的作用;
- 对于中高级以上的工程师们,能够起到细节拓展,和广度提升的效果。