hadoop伪分布式平台搭建实验目的，深入解析Hadoop伪分布式平台搭建过程及实践心得

欧气 2024年10月28日 21:47 0 0

本文目录导读：

实验目的
实践心得

实验目的

Hadoop作为大数据处理领域的核心技术之一，其稳定、高效、可扩展的特性得到了广泛应用，本次实验旨在通过搭建Hadoop伪分布式平台，让学生深入了解Hadoop的基本架构、组件功能及部署过程，为后续深入学习和实践打下坚实基础。

1、环境准备

（1）操作系统：选择Linux系统，如CentOS 7、Ubuntu等。

（2）Java环境：Hadoop基于Java语言编写，因此需要安装Java环境，建议安装Java 8或以上版本。

hadoop伪分布式平台搭建实验目的，深入解析Hadoop伪分布式平台搭建过程及实践心得

图片来源于网络，如有侵权联系删除

（3）网络环境：确保实验主机能够正常访问互联网，以便下载Hadoop安装包。

2、Hadoop伪分布式平台搭建

（1）下载Hadoop安装包：从Apache官网（https://hadoop.apache.org/releases.html）下载适合自己操作系统的Hadoop版本。

（2）解压安装包：将下载的Hadoop安装包解压到指定目录，home/hadoop/hadoop-3.3.4。

（3）配置环境变量：在.bashrc文件中添加以下内容：

export HADOOP_HOME=/home/hadoop/hadoop-3.3.4
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存并退出文件，然后执行source ~/.bashrc命令使配置生效。

（4）配置Hadoop配置文件：

hadoop伪分布式平台搭建实验目的，深入解析Hadoop伪分布式平台搭建过程及实践心得

图片来源于网络，如有侵权联系删除

① core-site.xml：设置Hadoop运行时的环境变量。

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-3.3.4/tmp</value>
    </property>
</configuration>

② hdfs-site.xml：设置HDFS存储参数。

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/hadoop-3.3.4/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/hadoop-3.3.4/hdfs/data</value>
    </property>
</configuration>

③ mapred-site.xml：设置MapReduce运行参数。

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

④ yarn-site.xml：设置YARN运行参数。

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>localhost</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

（5）格式化NameNode：执行以下命令格式化HDFS文件系统。