标题:Hadoop 分布式集群搭建实验报告
一、实验目的
本次实验的目的是搭建一个 Hadoop 分布式集群,了解 Hadoop 生态系统的基本组成部分,掌握 Hadoop 分布式文件系统(HDFS)和 MapReduce 编程模型的使用方法,为后续学习和应用 Hadoop 技术打下基础。
二、实验环境
1、操作系统:CentOS 7.6
2、JDK:1.8.0_292
3、Hadoop:3.2.2
三、实验步骤
1、安装 JDK
- 下载 JDK 安装包并解压到指定目录。
- 配置环境变量,将 JDK 安装目录添加到系统环境变量中。
- 验证 JDK 是否安装成功,在终端输入java -version
命令,查看 JDK 版本信息。
2、安装 Hadoop
- 下载 Hadoop 安装包并解压到指定目录。
- 配置环境变量,将 Hadoop 安装目录添加到系统环境变量中。
- 配置 Hadoop 环境变量,编辑etc/hadoop/hadoop-env.sh
文件,设置JAVA_HOME
环境变量。
- 配置 Hadoop 核心配置文件,编辑etc/hadoop/core-site.xml
文件,设置 Hadoop 主节点和从节点的名称。
- 配置 Hadoop HDFS 配置文件,编辑etc/hadoop/hdfs-site.xml
文件,设置 HDFS 副本数量和存储目录。
- 配置 Hadoop MapReduce 配置文件,编辑etc/hadoop/mapred-site.xml
文件,设置 MapReduce 工作目录和任务执行器内存。
- 配置 Hadoop YARN 配置文件,编辑etc/hadoop/yarn-site.xml
文件,设置 YARN 资源管理器和节点管理器的内存。
- 格式化 Hadoop 文件系统,在 Hadoop 主节点终端输入hdfs namenode -format
命令。
- 启动 Hadoop 集群,在 Hadoop 主节点终端输入start-dfs.sh
和start-yarn.sh
命令。
- 验证 Hadoop 集群是否启动成功,在 Hadoop 主节点终端输入jps
命令,查看 Hadoop 进程信息。
3、编写 MapReduce 程序
- 创建一个 Java 项目,并导入 Hadoop 相关的依赖包。
- 编写 Map 函数和 Reduce 函数,实现数据的处理逻辑。
- 编写主函数,设置输入路径和输出路径,并提交任务。
4、运行 MapReduce 程序
- 将编写好的 MapReduce 程序打包成 JAR 包,并上传到 Hadoop 集群中。
- 在 Hadoop 主节点终端输入yarn jar hadoop-mapreduce-examples-3.2.2.jar wordcount /input /output
命令,运行 MapReduce 程序。
- 查看 MapReduce 程序的运行结果,在 Hadoop 主节点终端输入hdfs dfs -cat /output/part-r-00000
命令,查看输出结果。
四、实验结果
1、Hadoop 集群搭建成功
- 通过在 Hadoop 主节点终端输入jps
命令,查看 Hadoop 进程信息,发现有 NameNode、DataNode、ResourceManager、NodeManager 等进程正在运行,说明 Hadoop 集群搭建成功。
2、MapReduce 程序运行成功
- 通过在 Hadoop 主节点终端输入yarn jar hadoop-mapreduce-examples-3.2.2.jar wordcount /input /output
命令,运行 MapReduce 程序,查看输出结果,发现程序能够正确地统计出输入文件中单词的出现次数,说明 MapReduce 程序运行成功。
五、实验总结
本次实验成功搭建了一个 Hadoop 分布式集群,并通过编写 MapReduce 程序,实现了数据的处理和分析,通过本次实验,我对 Hadoop 生态系统的基本组成部分有了更深入的了解,掌握了 Hadoop 分布式文件系统(HDFS)和 MapReduce 编程模型的使用方法,为后续学习和应用 Hadoop 技术打下了坚实的基础。
在实验过程中,我遇到了一些问题,如环境变量配置错误、Hadoop 集群启动失败等,通过查阅相关资料和不断尝试,我最终解决了这些问题,通过这次实验,我也深刻体会到了在学习和应用新技术时,遇到问题要善于思考和探索,不断尝试不同的方法,才能找到解决问题的最佳途径。
本次实验是一次非常有意义的实践活动,通过本次实验,我不仅学到了知识,还提高了自己的实践能力和解决问题的能力,我相信,在今后的学习和工作中,我将能够更好地应用 Hadoop 技术,为自己的发展和社会的进步做出贡献。
评论列表