当前位置: 首页 > article >正文

大数据面试笔试宝典之HBase面试

1.HBase 数据存储位置

HBase 中的数据存储在哪里? 以什么格式存储?和 Zookeeper 什么关系?

参考答案:
1.HBase 中的所有数据文件都存储在 Hadoop HDFS 文件系统上。

2.包含两种文件类型:
HFile : HBase 中 KeyValue 数据的存储格式。HFile 是 Hadoop 的二进制格式文件。
HLog File:HBase 中 WAL(Write Ahead Log) 的存储格式,物理上是 Hadoop 的 Sequence File
3.
1)hbase meta 表的位置存储在 Zookeeper
2)hbase master  利用 Zookeeper 选举
3)master 与 RegionServer 通信通过 Zookeeper
4)Zookeeper 存储 hbase 元数据信息

2.HBase 与 Hive 对比

底层数据同样存储在 HDFS,HBase 为什么比 Hive 查询速度快?


参考答案:

Hive
1 、hive  是基于 MapReduce 来处理,离线计算速度慢。
2 、MapReduce 处理数据是基于行的模式,查询数据默认是扫描整个表。
3、hive 中的表是纯逻辑表,只是表的定义&#


http://www.kler.cn/a/459268.html

相关文章:

  • ECMAScript基础
  • Cypress测试框架详解:轻松实现端到端自动化测试
  • 项目总结-ElasticSearch性能优化考虑点
  • 飞搭系列 | 移动端列表批量选择:让数据处理更便捷
  • Mac、Linux命令
  • Facebook数据分析和报告不准确该如何解决?
  • 2025常见的软件测试面试题
  • Flask 与 SocketIO 正确初始化及最佳实践调试
  • 解读目前AI就业岗位——大语言模型(LLM)应用工程师学习路线、就业前景及岗位全解析
  • 电脑缺失libcurl.dll怎么解决?详解电脑libcurl.dll文件丢失问题
  • Rocky9网络基本连接配置
  • SpringBoot开发——整合 Elasticsearch 实现数据高效搜索
  • 【数据结构】线性数据结构——队列
  • 如何用jmeter工具进行性能测试
  • .net core 的网络编程
  • 线性代数概念整理笔记
  • python去水印
  • HAL 库 HAL_UARTEx_ReceiveToIdle_IT 函数解析
  • 《深入挖掘Python加解密:自定义加密算法的设计与实现》
  • 2-200基于Matlab-GUI的SVM和ANN的废弃金属分类、分等级系统