当前位置: 首页 > article >正文

大数据应用——Hadoop运行模式(本地运行)

Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式

Hadoop官方网站:http://hadoop.apache.org/

4.1本地运行模式

4.1.1 官方Grep案例

1. 创建在hadoop-2.7.1文件下面创建一个input文件夹

[hadoop@hadoop101 hadoop-2.7.1]$ mkdir input

2. 将Hadoop的xml配置文件复制到input

[hadoop@hadoop101 hadoop-2.7.1]$ cp etc/hadoop/*.xml input

[hadoop@hadoop101 hadoop-2.7.1]$ cd input/

3. 执行share目录下的MapReduce程序

[hadoop@hadoop101 hadoop-2.7.1]$

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep input output 'dfs[a-z.]+' #找出与dfs所有字符满足的要求

4. 查看输出结果

[hadoop@hadoop101 hadoop-2.7.1]$ cat output/part-r-00000

4.1.2 官方WordCount案例

1. 创建在hadoop-2.7.1文件下面创建一个wcinput文件夹

[hadoop@hadoop101 hadoop-2.7.1]$ mkdir wcinput

2. 在wcinput文件下创建一个wc.input文件

[hadoop@hadoop101 hadoop-2.7.1]$ cd wcinput

[hadoop@hadoop101 wcinput]$ touch wc.txt

3. 编辑wc.input文件

[hadoop@hadoop101 wcinput]$ sudo vi wc.txt

在文件中输入如下内容

hadoop yarn

hadoop mapreduce

hadoop

hadoop

保存退出::wq

4. 回到Hadoop目录/opt/module/hadoop-2.7.1

5. 执行程序

[hadoop@hadoop101hadoop-2.7.1]$

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount wcinput wcoutput

6. 查看结果

[hadoop@hadoop101 hadoop-2.7.2]$ cat wcoutput/part-r-00000

hadoop 2

hadoop 2

mapreduce 1

yarn 1


http://www.kler.cn/a/4462.html

相关文章:

  • 线程池底部工作原理
  • docker swarm 部署问题 和 指定节点部署服务
  • 小结:路由器和交换机的指令对比
  • c++领域展开第十二幕——类和对象(STL简介——简单了解STL)超详细!!!!
  • LVGL移植高通点阵字库GT30L24A3W
  • 总结SpringBoot项目中读取resource目录下的文件多种方法
  • nacos入门
  • SpringBatch-Demo1
  • 多线程的几种状态
  • 2023最新版360度无死角python学习路线
  • Python提取文本文件中某个位置的数据
  • 简化代码,提高效率:C++ auto关键字的魅力
  • 短信宝接入发送短信实测 Java
  • 【操作系统】一文带你深入浅出零拷贝技术
  • Apache POI 入门·第一话
  • Autosar诊断-简介和功能概述
  • 网络基础知识
  • 应用层 —— HTTP协议
  • Spark大数据处理讲课笔记2.3 Spark运行架构与原理
  • Android的虚拟机垃圾回收解析,简单明了看完通透
  • Jython
  • 1652_MIT 6.828 shell例程重定向的实现分析
  • mysql隐式转换 “undefined“字符串匹配到mysql int类型0值字段
  • MySQL——锁
  • K8s CrashLoopBackOff 如何排障?
  • 如何注册Shopify商店