概述
1,介绍
从hadoop2.2以后的版本中开始有windows的本地支持的包。官方的hadoop版本中没有windows的安装版,但是我们可以通过源码安装。
不要试图通过Cygwin来安装hadoop,因为这些是完全没必要的。
2,windows安装
2.1安装配置java环境(这部分内容省略)确保配置环境中类似 c:Program FilesJava 中有空格的用windows8的路径方式替换为c:Progra~1Java
2.2直接下载官方的hadoop binares包我下载的是 hadoop-2.8.1版本
2.3 解压后进入到 hadoop-2.8.1/etc/hadoop目录,修改hadoop的配置环境,编辑hadoop-env.cmd
在接近文件末尾的地方加入
set HADOOP_PREFIX=c:hadoop-2.8.1 set HADOOP_CONF_DIR=%HADOOP_PREFIX%etchadoop set YARN_CONF_DIR=%HADOOP_CONF_DIR% set PATH=%PATH%;%HADOOP_PREFIX%bin
HADOOP_PREFIX 是你自己的hadoop-2.8.1的目录路径
2.4修改core-site.xml
<configuration> <property> <name>fs.default.name</name> <value>hdfs://0.0.0.0:19000</value> </property> </configuration>
修改 hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
最后确保你的slaves文件有这些内容
localhost
默认配置会把HDFS数据元数据和数据文件放在tmp目录下面,我们这样默认会放在c:tmp目录下。
2.5修改YARN配置
<configuration> <property> <name>mapreduce.job.user.name</name> <value>%USERNAME%</value> </property> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>yarn.apps.stagingDir</name> <value>/user/%USERNAME%/staging</value> </property> <property> <name>mapreduce.jobtracker.address</name> <value>local</value> </property> </configuration>
记得把%USERNAME%替换为你当前windows登录的用户名
修改 yarn-site.xml
<configuration> <property> <name>yarn.server.resourcemanager.address</name> <value>0.0.0.0:8020</value> </property> <property> <name>yarn.server.resourcemanager.application.expiry.interval</name> <value>60000</value> </property> <property> <name>yarn.server.nodemanager.address</name> <value>0.0.0.0:45454</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.server.nodemanager.remote-app-log-dir</name> <value>/app-logs</value> </property> <property> <name>yarn.nodemanager.log-dirs</name> <value>/dep/logs/userlogs</value> </property> <property> <name>yarn.server.mapreduce-appmanager.attempt-listener.bindAddress</name> <value>0.0.0.0</value> </property> <property> <name>yarn.server.mapreduce-appmanager.client-service.bindAddress</name> <value>0.0.0.0</value> </property> <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>-1</value> </property> <property> <name>yarn.application.classpath</name> <value>%HADOOP_CONF_DIR%,%HADOOP_COMMON_HOME%/share/hadoop/common/*,%HADOOP_COMMON_HOME%/share/hadoop/common/lib/*,%HADOOP_HDFS_HOME%/share/hadoop/hdfs/*,%HADOOP_HDFS_HOME%/share/hadoop/hdfs/lib/*,%HADOOP_MAPRED_HOME%/share/hadoop/mapreduce/*,%HADOOP_MAPRED_HOME%/share/hadoop/mapreduce/lib/*,%HADOOP_YARN_HOME%/share/hadoop/yarn/*,%HADOOP_YARN_HOME%/share/hadoop/yarn/lib/*</value> </property> </configuration>
2.6 初始化环境变量
运行c:hadoop-2.8.1etchadoophadoop-env.cmd
2.7 格式化文件系统
进入 hadoop-2.8.1bin,运行.hdfs.cmd namenode -format
14/01/18 08:36:23 INFO namenode.FSImage: Saving image file tmphadoop-usernamedfsnamecurrentfsimage.ckpt_0000000000000000000 using no compression 14/01/18 08:36:23 INFO namenode.FSImage: Image file tmphadoop-usernamedfsnamecurrentfsimage.ckpt_0000000000000000000 of size 200 bytes saved in 0 seconds.
看到一大堆启动内容如果没有报错就启动正常,一般不会有问题。
3,启动hadoop hdfs
.start-dfs.cmd
在hadoop-2.8.1bin 执行 ./hdfs.cmd dfs -put test.txt / 将一个测试文件加入到hdfs系统文件中。
然后可以通过 ./hdfs.cmd dfs =ls / 查看文件 具体指令 可以通过--help查看或者看官方文档。
启动yarn
.start-yarn.cmd
运行一个yarn JOB
.yarn.cmd jar c:hadoop-2.8.1sharehadoopmapreducehadoop-mapreduce-examples-2.8.1.jar wordcount /test.txt /out
打开浏览器 http://localhost:50070 it works!!! 由于是单机模式 localhost:9000 无法访问改用localhost:8088
转载于:https://my.oschina.net/u/2322090/blog/1523274
最后
以上就是爱听歌鸡为你收集整理的Hadoop部署(windows)的全部内容,希望文章能够帮你解决Hadoop部署(windows)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复