hadoop伪分布式搭建全过程，深入解析Hadoop伪分布式集群搭建全流程

欧气 2024年11月11日 06:08 0 0

本文目录导读：

Hadoop伪分布式集群概述
Hadoop伪分布式集群搭建步骤

Hadoop伪分布式集群概述

Hadoop是一种分布式计算框架，主要用于处理大规模数据集，在Hadoop中，集群分为伪分布式集群、完全分布式集群和单机集群，本文将详细解析Hadoop伪分布式集群的搭建过程。

hadoop伪分布式搭建全过程，深入解析Hadoop伪分布式集群搭建全流程

图片来源于网络，如有侵权联系删除

Hadoop伪分布式集群搭建步骤

1、准备环境

（1）操作系统：Linux操作系统，如CentOS、Ubuntu等。

（2）Java环境：JDK 1.8及以上版本。

（3）Hadoop版本：本文以Hadoop 3.3.1为例。

2、安装Hadoop

（1）下载Hadoop源码包：从Hadoop官网下载对应版本的源码包。

（2）解压源码包：将下载的Hadoop源码包解压到指定目录，如/opt/hadoop。

（3）配置环境变量：在~/.bashrc文件中添加以下内容：

export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

保存并退出编辑，然后运行source ~/.bashrc使配置生效。

hadoop伪分布式搭建全过程，深入解析Hadoop伪分布式集群搭建全流程

图片来源于网络，如有侵权联系删除

3、配置Hadoop

（1）编辑/opt/hadoop/etc/hadoop/core-site.xml文件，配置如下：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

（2）编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件，配置如下：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/opt/hadoop/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/hadoop/hdfs/datanode</value>
    </property>
</configuration>

（3）编辑/opt/hadoop/etc/hadoop/mapred-site.xml文件，配置如下：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

（4）编辑/opt/hadoop/etc/hadoop/yarn-site.xml文件，配置如下：

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

4、格式化NameNode

在Hadoop命令行中执行以下命令：