hadoop伪分布模式安装，hadoop伪分布式集群安装步骤

欧气 2024年09月26日 19:09 4 0

标题：Hadoop 伪分布式集群安装详细步骤

一、引言

Hadoop 是一个开源的分布式计算框架，用于处理大规模数据，Hadoop 伪分布式模式是在单机上模拟分布式环境，方便开发者进行 Hadoop 开发和测试，本文将详细介绍 Hadoop 伪分布式集群的安装步骤。

二、环境准备

1、操作系统：CentOS 7

2、JDK：安装 JDK 1.8 或以上版本

3、下载 Hadoop：从 Hadoop 官方网站下载 Hadoop 2.7.7 版本

三、安装 JDK

1、下载 JDK 安装包：从 Oracle 官方网站下载 JDK 1.8 或以上版本的安装包。

2、安装 JDK：运行安装包，按照安装向导进行安装。

3、配置环境变量：

- 编辑 /etc/profile 文件，添加以下内容：

export JAVA_HOME=/usr/java/jdk1.8.0_251
export PATH=$JAVA_HOME/bin:$PATH

- 使环境变量生效：执行 source /etc/profile 命令。

四、安装 Hadoop

1、解压 Hadoop 安装包：将下载的 Hadoop 2.7.7 版本的安装包解压到 /usr/local/hadoop 目录下。

2、配置 Hadoop：

- 编辑 /usr/local/hadoop/etc/hadoop/hadoop-env.sh 文件，添加以下内容：

export JAVA_HOME=/usr/java/jdk1.8.0_251

- 编辑 /usr/local/hadoop/etc/hadoop/core-site.xml 文件，添加以下内容：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/tmp</value>
    </property>
</configuration>

- 编辑 /usr/local/hadoop/etc/hadoop/hdfs-site.xml 文件，添加以下内容：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

- 编辑 /usr/local/hadoop/etc/hadoop/mapred-site.xml 文件，添加以下内容：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

- 编辑 /usr/local/hadoop/etc/hadoop/yarn-site.xml 文件，添加以下内容：

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

3、格式化 HDFS：在终端中执行以下命令：