当前位置：首页 > article >正文

推荐基于Hadoop的大数据相关环境安装

article 2025/2/25 22:17:16

如下博客文章请倒序阅读：

分布式开源协调服务——Zookeeper

大数据Hadoop之——Kafka 图形化工具 EFAK（EFAK环境部署）

大数据Hadoop之——数据采集存储到HDFS实战（Python版本）

大数据Hadoop之——数据同步工具DataX

大数据Hadoop之——数据同步工具Sqoop

大数据Hadoop之——数据分析引擎Apache Pig

大数据Hadoop之——任务调度器Oozie（Oozie环境部署）

大数据Hadoop之——Hadoop图形化管理系统Hue（Hue环境部署）

大数据Hadoop之——基于Hive的内存型SQL查询引擎Impala（Impala环境部署）

大数据Hadoop之——Cloudera Hadoop（CM 6.3.1+CDH 6.3.2环境部署）

大数据Hadoop之——基于内存型SQL查询引擎Presto（Presto-Trino环境部署）

大数据Hadoop之——Azkaban API详解

大数据Hadoop之——任务调度器Azkaban（Azkaban环境部署）

大数据Hadoop之——Flink CEP（Complex Event Processing：复合事件处理）详解（kafka on window）

大数据Hadoop之——Flink的状态管理和容错机制(checkpoint)

大数据Hadoop之——Flink中的Window API+时间语义+Watermark

大数据Hadoop之——Flink DataStream API 和 DataSet API

大数据Hadoop之——搭建本地flink开发环境详解（window10）

大数据Hadoop之——部署hadoop+hive环境（window10）

大数据Hadoop之——Flink Table API 和 SQL（单机Kafka）

大数据Hadoop之——Spark Streaming原理

大数据Hadoop之——Spark on Hive 和 Hive on Spark的区别与实现

大数据Hadoop之——Spark SQL+Spark Streaming

大数据Hadoop之——Spark集群部署（Standalone）

大数据Hadoop之——计算引擎Spark

大数据Hadoop之——数据仓库Hive

大数据Hadoop原理介绍+安装+实战操作（HDFS+YARN+MapReduce）

大数据Hadoop生态系统介绍

博客园经验不善，所以不保证随时都能看，已经为大家做成了文档可以去我的pdd购买：

大数据生态系统与环境搭建

http://www.kler.cn/a/373279.html

相关文章：

【WPF】用于图形绘制的三个重要类：Canvas 类，PathGeometry 类，Path 类

天锐绿盾加密软件与Ping32：企业数据安全备受关注的两款加密软件

算法定制LiteAIServer视频智能分析软件的过亮、过暗及抖动检测应用场景

【项目实战】通过LLaMaFactory+Qwen2-VL-2B微调一个多模态医疗大模型

【01】ZooKeeper特性与节点数据类型

【LLM论文日更】LongReward：利用人工智能反馈改进长上下文大语言模型

【贪心算法】（第十二篇）

鸿蒙生态崛起带来的机遇与挑战

React面试常见题目（基础-进阶）

使用Selenium时，如何模拟正常用户行为？

Python数据分析NumPy和pandas（十六、文本格式数据的读取与存储：csv、json、xml和html）

使用 BERT 和逻辑回归进行文本分类及示例验证

Pycharm，2024最新版Pycharm现在安装环境配置汉化详细教程！

网管平台（三）：如何高效管理无线网络

leetcode:面试题 05.07. 配对交换（python3解法）

第二十章 Vue组件通信之父子通信

Flutter Color 大调整，需适配迁移，颜色不再是 0-255，而是 0-1.0，支持更大色域

Spring5学习记录（一）之IOC容器管理（基于XML方式）

vue前端使用pdfjs与pdfdist-mergeofd 实现预览pdf并翻页，同时解决预览pdf显示模糊的问题

【算法与数据结构】二分查找思想