标题:Hadoop 伪分布式集群安装详细步骤
一、引言
Hadoop 是一个开源的分布式计算框架,用于处理大规模数据,Hadoop 伪分布式模式是在单机上模拟分布式环境,方便开发者进行 Hadoop 开发和测试,本文将详细介绍 Hadoop 伪分布式集群的安装步骤。
二、环境准备
1、操作系统:CentOS 7
2、JDK:安装 JDK 1.8 或以上版本
3、下载 Hadoop:从 Hadoop 官方网站下载 Hadoop 2.7.7 版本
三、安装 JDK
1、下载 JDK 安装包:从 Oracle 官方网站下载 JDK 1.8 或以上版本的安装包。
2、安装 JDK:运行安装包,按照安装向导进行安装。
3、配置环境变量:
- 编辑 /etc/profile 文件,添加以下内容:
export JAVA_HOME=/usr/java/jdk1.8.0_251 export PATH=$JAVA_HOME/bin:$PATH
- 使环境变量生效:执行 source /etc/profile 命令。
四、安装 Hadoop
1、解压 Hadoop 安装包:将下载的 Hadoop 2.7.7 版本的安装包解压到 /usr/local/hadoop 目录下。
2、配置 Hadoop:
- 编辑 /usr/local/hadoop/etc/hadoop/hadoop-env.sh 文件,添加以下内容:
export JAVA_HOME=/usr/java/jdk1.8.0_251
- 编辑 /usr/local/hadoop/etc/hadoop/core-site.xml 文件,添加以下内容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop/tmp</value> </property> </configuration>
- 编辑 /usr/local/hadoop/etc/hadoop/hdfs-site.xml 文件,添加以下内容:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
- 编辑 /usr/local/hadoop/etc/hadoop/mapred-site.xml 文件,添加以下内容:
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
- 编辑 /usr/local/hadoop/etc/hadoop/yarn-site.xml 文件,添加以下内容:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
3、格式化 HDFS:在终端中执行以下命令:
hdfs namenode -format
4、启动 Hadoop:在终端中执行以下命令:
start-dfs.sh start-yarn.sh
5、验证 Hadoop:在浏览器中访问 http://localhost:50070,可以看到 HDFS 的界面,在浏览器中访问 http://localhost:8088,可以看到 YARN 的界面。
五、总结
本文介绍了 Hadoop 伪分布式集群的安装步骤,包括环境准备、安装 JDK、安装 Hadoop、配置 Hadoop、格式化 HDFS、启动 Hadoop 和验证 Hadoop,通过这些步骤,我们可以在单机上模拟分布式环境,方便开发者进行 Hadoop 开发和测试。
评论列表