hadoop伪分布式安装教程，Hadoop伪分布式集群搭建指南，从安装到配置详解

欧气 2024年10月29日 00:02 0 0

本文目录导读：

环境准备
安装步骤

Hadoop作为一款开源的分布式计算框架，在处理大规模数据集方面具有显著优势，本文将详细讲解Hadoop伪分布式集群的搭建过程，包括安装、配置和优化等步骤，帮助您快速入门Hadoop。

环境准备

1、操作系统：Linux（推荐CentOS 7）

hadoop伪分布式安装教程，Hadoop伪分布式集群搭建指南，从安装到配置详解

图片来源于网络，如有侵权联系删除

2、Java环境：JDK 1.8

3、Hadoop版本：Hadoop 3.x（本文以Hadoop 3.2.1为例）

安装步骤

1、安装JDK

下载JDK 1.8的安装包，并上传至服务器，解压安装包并配置环境变量。

tar -zxvf jdk-8u251-linux-x64.tar.gz -C /usr/local/
vi /etc/profile

在profile文件中添加以下内容：

export JAVA_HOME=/usr/local/jdk1.8.0_251
export PATH=$PATH:$JAVA_HOME/bin

保存并退出，然后执行以下命令使配置生效：

source /etc/profile

2、安装Hadoop

下载Hadoop 3.2.1的安装包，并上传至服务器，解压安装包。

tar -zxvf hadoop-3.2.1.tar.gz -C /usr/local/

3、配置Hadoop

hadoop伪分布式安装教程，Hadoop伪分布式集群搭建指南，从安装到配置详解

图片来源于网络，如有侵权联系删除

进入Hadoop安装目录，修改hadoop配置文件。

cd /usr/local/hadoop-3.2.1
vi etc/hadoop/hadoop-env.sh

在hadoop-env.sh文件中添加以下内容：

export JAVA_HOME=/usr/local/jdk1.8.0_251

修改core-site.xml文件：

vi etc/hadoop/core-site.xml

添加以下内容：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop-3.2.1/tmp</value>
    </property>
</configuration>

修改hdfs-site.xml文件：

vi etc/hadoop/hdfs-site.xml

添加以下内容：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop-3.2.1/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop-3.2.1/hdfs/datanode</value>
    </property>
</configuration>

修改slaves文件：