【运维专题】大数据面试笔试宝典之大数据运维面试(四)
31、如果发现现有集群出现数据倾斜,生产环境中 HBase 出现数据倾斜了该如何解决呢?出现数据倾斜的原因到底是什么,换句话说,导致数据倾斜的罪魁祸首到底时开发,运维还是软件自身缺陷呢?
参考答案:
导致数据倾斜的原因是因为 rowkey 设计的不合理,跟 HBase 本身关系不大,这个我们在 HBase 组件运维的时候会讲解。
32、最近大数据运维 JD 上写着"负责公司大数据平台和机器学习平台的运维工作",这两个平台是否就是咱们的 CDH 集群呢?能介绍一下啊机器学习平台的日常运维都有哪些吗?
参考答案:
按老师的理解都是 hadoop 平台的运维,不过还要具体看企业自身的情况。