标题:Hadoop 伪分布式搭建详细步骤
一、引言
Hadoop 是一个开源的分布式计算框架,它可以处理大规模数据,并提供高可靠性和高容错性,Hadoop 伪分布式模式是在单机上模拟分布式环境,方便开发者进行 Hadoop 开发和测试,本文将详细介绍 Hadoop 伪分布式搭建的步骤。
二、环境准备
1、安装 JDK
- 下载 JDK 安装包,并解压到指定目录。
- 配置环境变量:
- 编辑/etc/profile
文件,添加以下内容:
export JAVA_HOME=/path/to/jdk export PATH=$JAVA_HOME/bin:$PATH
- 使环境变量生效:
source /etc/profile
2、下载 Hadoop
- 访问 Hadoop 官方网站,下载 Hadoop 最新版本。
- 解压 Hadoop 安装包到指定目录。
三、配置 Hadoop
1、配置环境变量
- 编辑/etc/profile
文件,添加以下内容:
export HADOOP_HOME=/path/to/hadoop export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
- 使环境变量生效:
source /etc/profile
2、配置 Hadoop 核心配置文件
- 复制 Hadoop 配置文件到/etc/hadoop
目录:
cp $HADOOP_HOME/etc/hadoop/*.xml /etc/hadoop
- 编辑/etc/hadoop/core-site.xml
文件,添加以下内容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/path/to/hadoop/tmp</value> </property> </configuration>
- 编辑/etc/hadoop/hdfs-site.xml
文件,添加以下内容:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/path/to/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/path/to/hadoop/tmp/dfs/data</value> </property> </configuration>
- 编辑/etc/hadoop/mapred-site.xml
文件,添加以下内容:
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
- 编辑/etc/hadoop/yarn-site.xml
文件,添加以下内容:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property> </configuration>
3、格式化 HDFS 文件系统
- 执行以下命令格式化 HDFS 文件系统:
hdfs namenode -format
4、启动 Hadoop 服务
- 执行以下命令启动 Hadoop 服务:
start-dfs.sh start-yarn.sh
5、查看 Hadoop 服务状态
- 执行以下命令查看 Hadoop 服务状态:
jps
- 输出结果应该包含以下进程:
NameNode DataNode ResourceManager NodeManager
四、验证 Hadoop 伪分布式搭建
1、上传文件到 HDFS
- 执行以下命令上传文件到 HDFS:
hdfs dfs -put /path/to/local/file /path/to/hdfs/directory
2、查看 HDFS 文件系统
- 执行以下命令查看 HDFS 文件系统:
hdfs dfs -ls /
3、运行 WordCount 示例程序
- 执行以下命令运行 WordCount 示例程序:
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount /input /output
- 执行以下命令查看 WordCount 输出结果:
hdfs dfs -cat /output/part
五、总结
本文详细介绍了 Hadoop 伪分布式搭建的步骤,包括环境准备、配置 Hadoop、格式化 HDFS 文件系统、启动 Hadoop 服务和验证 Hadoop 伪分布式搭建,通过这些步骤,我们可以在单机上模拟分布式环境,方便开发者进行 Hadoop 开发和测试。
评论列表