本文目录导读:
Hadoop作为一款分布式计算框架,已成为大数据处理领域的基石,本文将详细讲解Hadoop 3.3.6完全分布式环境的搭建过程,并对JPS命令进行深入解析与应用,以帮助读者更好地掌握Hadoop技术。
二、Hadoop 3.3.6完全分布式环境搭建
图片来源于网络,如有侵权联系删除
1、环境准备
(1)操作系统:CentOS 7.5(推荐)
(2)Java环境:JDK 1.8
(3)Hadoop版本:Hadoop 3.3.6
2、配置文件修改
(1)编辑hadoop-env.sh文件
在$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件中,设置Java环境变量:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.x86_64
(2)编辑core-site.xml文件
在$HADOOP_HOME/etc/hadoop/core-site.xml文件中,设置Hadoop运行的主机名和HDFS的存储路径:
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop-master:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-3.3.6/data/tmp</value>
</property>
(3)编辑hdfs-site.xml文件
在$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件中,设置HDFS的副本数量和存储路径:
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
图片来源于网络,如有侵权联系删除
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop-3.3.6/data/hdfs/data</value>
</property>
(4)编辑mapred-site.xml文件
在$HADOOP_HOME/etc/hadoop/mapred-site.xml文件中,设置MapReduce的运行模式:
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
(5)编辑yarn-site.xml文件
在$HADOOP_HOME/etc/hadoop/yarn-site.xml文件中,设置YARN的运行模式、资源管理器和资源队列等信息:
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop-master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
3、Hadoop集群启动
(1)格式化HDFS
在hadoop-master节点上执行以下命令,格式化HDFS:
hdfs dfs -format
图片来源于网络,如有侵权联系删除
(2)启动Hadoop集群
在hadoop-master节点上执行以下命令,启动Hadoop集群:
start-dfs.sh
start-yarn.sh
JPS命令解析与应用
JPS是Java虚拟机进程状态工具,用于查看JVM中运行的所有Java进程,在Hadoop环境中,JPS命令常用于查看Hadoop集群中各个组件的进程状态。
1、查看Hadoop集群进程
在hadoop-master节点上执行以下命令,查看Hadoop集群进程:
jps
输出结果如下:
3858 NameNode
3874 SecondaryNameNode
3904 ResourceManager
3924 NodeManager
3952 JobHistoryServer
2、查看特定进程
若只想查看特定进程,可以使用grep命令进行筛选,查看NodeManager进程:
jps | grep NodeManager
输出结果如下:
3924 NodeManager
通过JPS命令,我们可以轻松地查看Hadoop集群中各个组件的进程状态,从而方便地监控集群的健康状况。
本文详细介绍了Hadoop 3.3.6完全分布式环境的搭建过程,并对JPS命令进行了深入解析与应用,通过学习本文,读者可以掌握Hadoop集群的搭建方法和JPS命令的使用技巧,为后续的大数据处理工作打下坚实基础。
标签: #hadoop3.3.6完全分布式搭建
评论列表