深入解析Hadoop3.3.6完全分布式搭建过程及关键步骤，hadoop完全分布式jps

欧气 2024年11月26日 21:04 0 0

本文目录导读：

环境准备
搭建步骤

随着大数据时代的到来，Hadoop作为一款开源的大数据处理框架，在我国得到了广泛的应用，本文将深入解析Hadoop3.3.6完全分布式搭建过程，帮助读者了解关键步骤，提高搭建效率。

环境准备

1、操作系统：Linux（推荐CentOS 7）

深入解析Hadoop3.3.6完全分布式搭建过程及关键步骤，hadoop完全分布式jps

图片来源于网络，如有侵权联系删除

2、Java环境：JDK 1.8

3、Hadoop版本：Hadoop3.3.6

搭建步骤

1、安装Java环境

（1）下载JDK 1.8安装包

（2）解压安装包到指定目录，/usr/local/java

（3）配置环境变量，编辑~/.bash_profile文件，添加以下内容：

export JAVA_HOME=/usr/local/java
export PATH=$PATH:$JAVA_HOME/bin

（4）使环境变量生效，执行以下命令：

source ~/.bash_profile

2、安装Hadoop

（1）下载Hadoop3.3.6安装包

深入解析Hadoop3.3.6完全分布式搭建过程及关键步骤，hadoop完全分布式jps

图片来源于网络，如有侵权联系删除

（2）解压安装包到指定目录，/usr/local/hadoop

3、配置Hadoop

（1）配置Hadoop核心配置文件hadoop-env.sh，编辑以下内容：

export JAVA_HOME=/usr/local/java

（2）配置Hadoop核心配置文件core-site.xml，编辑以下内容：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:8020</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/data</value>
    </property>
</configuration>

（3）配置HadoopHDFS配置文件hdfs-site.xml，编辑以下内容：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/data/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop/data/hdfs/datanode</value>
    </property>
</configuration>

（4）配置HadoopYARN配置文件yarn-site.xml，编辑以下内容：

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

4、格式化HDFS

在master节点上执行以下命令：