hadoop搭建教程，多环境通吃

77 阅读 0 评论 51 点赞

我是靠谱客的博主强健老鼠，最近开发中收集的这篇文章主要介绍hadoop搭建教程，多环境通吃，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

前言：

网上有很多关于hadoop搭建的教程，由于搭建环境不同，会出现各种各样的问题。那么就由我来带大家排坑吧，小编虚拟机Ubuntu14.0，centos7，centos6，阿里云centos6，阿里云centos7，腾讯云centos6，腾讯云centos7都搭建成功，中间出现很多不同的情况。只要你跟着我来，就不会出现问题。不管你是伪分布式，还是分布式。

服务器：

用户：hadoop

ip	机器名	系统
192.168.2.100	master	centos7
192.168.2.101	slave1	centos7
192.168.2.102	slave2	centos7

注意先把防火墙关了！

安装JDK：

1.wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u112-b15/jdk-8u112-linux-x64.tar.gz 建议下载到/opt下

2.解压 tar -zxvf 文件名

修改profile文件:

vim /etc/profile(没有vim 就用vi)

添加以下内容：

export JAVA_HOME=/opt/jdk8
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

更新一下配置

source /etc/profile

然后输入jps

这就可以了 jdk配置完成

下载hadoop:

wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

然后解压和解压jdk一样，还是建议/opt

给/opt 目录下所有文件权限，方便操作

chmod -R 777 /opt

我们到 /opt/hadoop-2.7.3/etc/hadoop 这个目录下

修改 hadoop-env.sh：

修改这一个就好了

修改 core-site.xml：

添加

<name>fs.defaultFS</name>

<value>hdfs://127.0.0.1:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/hadoop-2.7.3/hadoop_tmp</value>
</property>

注意：这里的hdfs地址我用的是127.0.0.1，这是伪分布式搭建绝对不会有问题的一个配置，不管你host配置什么。分布式的话，填上mastdeIP地址192.168.2.100

修改 hdfs-site.xml：

添加：

<name>dfs.replication</name>

这是hdfs文件系统的副本数量，伪分布式建议1，分布式有几台机器就填几

注意：hdfs的datanode目录，还有namenode新手目录不要指定，默认就好

修改 mapred-site.xml：

添加：

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

修改 yarn-site.xml：

添加：

<property>
<name>yarn.resourcemanager.hostname</name>
<value>127.0.0.1</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

注意：这里yarn的hostname伪分布式就填写127.0.0.1不会有错，分布式的话就填192.168.2.100

修改 slaves：

这个文件决定了你搭建完全分布式系统，还是伪分布式系统

直接添加一个127.0.0.1的话就是伪分布式系统

添加192.168.2.101和192.168.2.102的话就是分布式系统，这两个服务器就会启动DataNode进程

我们这里只添加127.0.0.1