我是靠谱客的博主 威武犀牛,最近开发中收集的这篇文章主要介绍Hadoop 程序运行两大模型 Hadoop MapReduce--程序运行模型--本地运行模式,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

案例 : world count

 

IDEA pom文件 :

 

 

指定本次MapReduce程序中 数据输入的路径(hdfs文件系统中的路径) 和 数据最终输出 存放在什么位置(hdfs文件系统中的路径)
        1.创建数据输入的路径(hdfs文件系统中的路径):hadoop fs -mkdir -p /Hadoop_daima/input
        2.把要计算的文件放到数据输入的路径(hdfs文件系统中的路径)中:hadoop fs -put xx.txt yy.txt /Hadoop_daima/input
        3.注意:不需要创建 数据最终输出目录(hdfs文件系统中的路径),否则会报错:FileAlreadyExistsException: Output directory,
               数据最终输出目录会由MapReduce程序创建

 Hadoop MapReduce--程序运行模型--集群运行模式

将 mapreduce 程序提交给 yarn 集群的命令:
    格式一:hadoop jar xx.jar mapreduce程序的全限定类名 args参数
    例子:hadoop jar wordcount.jar cn.itcast.bigdata.mrsimple.WordCountDriver args

    格式二:hadoop jar xx.jar
        (无需配置mapreduce程序的全限定类名,因为在pom.xml中的<mainClass>标签体中配置了mapreduce程序的全限定类名)
    例子:hadoop jar wordcount.jar

 

Hadoop MapReduce--程序运行模型--本地运行模式

conf.set("mapreduce.framework.name","local")代码语句 为设置本地模式运行,但要注意的是 mapred-default.xml中已经默认配置是本地模式,
所以即使不配置conf.set(“mapreduce.framework.name”,“local”),只要右键run运行该程序仍然是本地模式

最后

以上就是威武犀牛为你收集整理的Hadoop 程序运行两大模型 Hadoop MapReduce--程序运行模型--本地运行模式的全部内容,希望文章能够帮你解决Hadoop 程序运行两大模型 Hadoop MapReduce--程序运行模型--本地运行模式所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(74)

评论列表共有 0 条评论

立即
投稿
返回
顶部