hadoop伪分布式环境搭建实验报告，Hadoop伪分布式环境搭建与实验心得

欧气 2024年10月21日 18:17 0 0

本文目录导读：

图片来源于网络，如有侵权联系删除

实验背景
实验环境
实验步骤
实验心得

实验背景

随着大数据时代的到来，Hadoop作为一款分布式存储和处理框架，在各个领域得到了广泛的应用，为了深入了解Hadoop的原理和应用，我们进行了一次Hadoop伪分布式环境搭建的实验，以下是本次实验的详细过程及心得体会。

实验环境

1、操作系统：CentOS 7

2、Java环境：JDK 1.8

3、Hadoop版本：Hadoop 3.2.1

实验步骤

1、安装Java环境

由于Hadoop是基于Java开发的，首先需要安装Java环境，通过以下命令安装JDK 1.8：

sudo yum install -y java-1.8.0-openjdk java-1.8.0-openjdk-devel

2、下载Hadoop源码

在Hadoop官网下载对应版本的源码包，解压到指定目录。

3、配置Hadoop环境变量

编辑/etc/profile 文件，添加以下内容：

export HADOOP_HOME=/path/to/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存文件并退出，通过以下命令使配置生效：

hadoop伪分布式环境搭建实验报告，Hadoop伪分布式环境搭建与实验心得

图片来源于网络，如有侵权联系删除

source /etc/profile

4、配置Hadoop配置文件

在Hadoop源码目录下，找到etc/hadoop 文件夹，配置以下文件：

core-site.xml：配置Hadoop运行时所需的基本参数，如HDFS的存储路径、Hadoop运行时的默认文件编码等。

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/tmp</value>
    </property>
</configuration>

hdfs-site.xml：配置HDFS的存储参数，如副本因子、存储路径等。

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/hdfs/data</value>
    </property>
</configuration>

mapred-site.xml：配置MapReduce运行时的参数，如MapReduce的运行模式、JobTracker和TaskTracker的地址等。

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobtracker.address</name>
        <value>localhost:9001</value>
    </property>
</configuration>

yarn-site.xml：配置YARN的运行参数，如 ResourceManager和NodeManager的地址等。

<configuration>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>localhost:8032</value>
    </property>
    <property>
        <name>yarn.nodemanager.address</name>
        <value>localhost:8041</value>
    </property>
</configuration>

5、格式化HDFS文件系统

在配置文件完成后，需要格式化HDFS文件系统，通过以下命令格式化：