当前位置: 首页 > article >正文

Hadoop•用Web UI查看Hadoop状态词频统计

听说这里是目录哦

  • 通过Web UI查看Hadoop运行状态🐇
    • 一、关闭防火墙
    • 二、在物理计算机添加集群的IP映射
    • 三、启动集群
    • 四、进入HDFS的Web UI
  • 词频统计🦩
    • 1、准备文本数据
    • 2、在HDFS创建目录
    • 3、上传文件
    • 4、查看文件是否上传成功
    • 5、运行MapReduce程序
    • 6、查看MapReduce程序运行状态
    • 7、查看统计结果
  • 能量站😚

通过Web UI查看Hadoop运行状态🐇

一、关闭防火墙

在集群中每个虚拟机内执行
systemctl stop firewalld 【关闭防火墙】
systemctl disable firewalld 【禁止防火墙开机启动】

二、在物理计算机添加集群的IP映射

在这里插入图片描述

hosts文件末尾添加【解决HDFS网页无法查看文件
这是我的,格式就是IP 虚拟机名

在这里插入图片描述
刷新DNS缓存:以管理员身份运行命令提示符,在命令提示符中输入ipconfig /flushdns

三、启动集群

看Hadoop•搭建完全分布式集群目录中的启动Hadoop

四、进入HDFS的Web UI

在浏览器输入IP:9870,如192.168.88.151:9870192.168.88.151是我的主机IP,HDFS的Web UI端口一般都是9870

在这里插入图片描述

词频统计🦩

1、准备文本数据

在哪个目录下创建,路径就在哪。切到需要的目录下哦~【记住路径!!!】
命令用touch word.txt或者vi word.txt都行(创建一个名为word.txt文件)。
文件内要编写的内容如下图:
在这里插入图片描述

2、在HDFS创建目录

用命令hdfs dfs -mkdir -p /wordcount/input在HDFS创建/wordcount/input用于存放文件word.txt

3、上传文件

用命令hdfs dfs -put /export/data/word.txt /wordcount/input把位于/export/data/word.txt上传到HDFS的/wordcount/input

4、查看文件是否上传成功

进入HDFS的Web UI输入路径/wordcount/input,如果看到该目录下有word.txt,那word.txt就上传成功了

5、运行MapReduce程序

在主机node1进入/export/servers/hadoop-3.1.4/share/hadoop/mapreduce目录下执行ll命令查看Hadoop提供的MapReduce程序hadoop-mapreduce-examples-3.1.4.jar。在该程序所在目录下执行命令hadoop jar hadoop-mapreduce-examples-3.1.4.jar wordcount /wordcount/input wordcount/output运行该程序即可实现词频统计,该命令中hadoop jar指定运行的MapReduce程序,第一个wordcount是程序名称【执行操作要用的】,/wordcount/input是要计算的文件word.txt所在的目录,wordcount/output是统计结果输出的目录【该目录会自动创建,所以不能提前创建】。注意,这里使用的都是HDFS文件系统的目录。

在这里插入图片描述

6、查看MapReduce程序运行状态

使用浏览器访问YARN在浏览器输入IP:8088,如192.168.88.151:8088192.168.88.151是我的主机IP,YARN的Web UI端口一般都是8088

在这里插入图片描述

7、查看统计结果

进入HDFS的Web UI,结果存放在wordcount/output目录,输入路径,然后Go!就行了。

在这里插入图片描述

🐇🐇🐇我是分割线
就是在物理计算机添加集群的IP映射
在这里插入图片描述

能量站😚

祝有爱者有爱,无爱者自由。
请添加图片描述

❤️谢谢你为自己努力❤️


http://www.kler.cn/a/510173.html

相关文章:

  • Phi小模型开发教程:用C#开发本地部署AI聊天工具,只需CPU,不需要GPU,3G内存就可以运行,不输GPT-3.5
  • gitlab runner正常连接 提示 作业挂起中,等待进入队列 解决办法
  • 安装httpd
  • 飞牛 使用docker部署Watchtower 自动更新 Docker 容器
  • Excel 技巧10 - 如何检查输入重复数据(★★)
  • 【人工智能】Python中的自动化机器学习(AutoML):如何使用TPOT优化模型选择
  • Spring Boot + Apache POI 实现 Excel 导出:BOM物料清单生成器(支持中文文件名、样式美化、数据合并)
  • 学习threejs,使用FlyControls相机控制器
  • 速通Docker === 目录挂载 卷映射
  • 02JavaWeb——JavaScript-Vue(项目实战)
  • 【机器学习实战中阶】音乐流派分类-自动化分类不同音乐风格
  • Springboot之错误端点/error
  • 两个关于TCP/IP的问题
  • 搜维尔科技:Xsens人形机器人解决方案的优势
  • dockerhub上一些镜像
  • Vue.js项目核心:深入解析App.vue的结构与作用
  • 【深度学习】自编码器(Autoencoder, AE)
  • PHP企业微信SCRM社群营销系统
  • 使用 Python 操作 MySQL 数据库
  • Linux链接
  • 2.3.1(项目)kv存储——框架梳理(待定)
  • 地址转坐标:利用高德API进行批量地理编码
  • C++(二十二)
  • 财务RPA就是财务机器人吗?有什么作用
  • 安装matlab2024a错误license checkout failed Error-8
  • MATLAB基础应用精讲-【数模应用】基于QPSK的调制和解调(附MATLAB代码实现)