hadoop分布式集群搭建实验心得，Hadoop分布式集群搭建实验心得，从入门到实战的深度体验

欧气 2024年10月30日 07:08 0 0

本文目录导读：

实验环境
实验步骤
实验心得

随着大数据时代的到来，Hadoop作为一款开源的分布式计算框架，在处理海量数据方面具有极高的性能和稳定性，为了深入了解Hadoop的原理和应用，我进行了一次Hadoop分布式集群搭建实验，以下是我在实验过程中的心得体会。

实验环境

1、操作系统：CentOS 7.4

2、Java版本：1.8

hadoop分布式集群搭建实验心得，Hadoop分布式集群搭建实验心得，从入门到实战的深度体验

图片来源于网络，如有侵权联系删除

3、Hadoop版本：Hadoop 3.2.1

实验步骤

1、准备工作

（1）安装Java环境，由于Hadoop是基于Java开发的，因此需要先安装Java环境，在CentOS系统中，可以使用yum命令安装Java：

sudo yum install java-1.8.0-openjdk -y

（2）配置环境变量，编辑/etc/profile文件，添加以下内容：

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.x86_64
export PATH=$PATH:$JAVA_HOME/bin

使用source /etc/profile命令使配置生效。

2、下载Hadoop

从Hadoop官网下载Hadoop 3.2.1版本安装包，并将其解压到指定目录，例如/opt/hadoop。

3、配置Hadoop

（1）编辑/opt/hadoop/etc/hadoop/hadoop-env.sh文件，配置Java环境：

hadoop分布式集群搭建实验心得，Hadoop分布式集群搭建实验心得，从入门到实战的深度体验

图片来源于网络，如有侵权联系删除

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.x86_64

（2）编辑/opt/hadoop/etc/hadoop/core-site.xml文件，配置Hadoop核心参数：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:8020</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoop/tmp</value>
    </property>
</configuration>

（3）编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件，配置HDFS参数：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/opt/hadoop/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/hadoop/hdfs/datanode</value>
    </property>
</configuration>

4、格式化NameNode

在master节点上，执行以下命令格式化NameNode：