Hadoop 3.3.6 完全分布式环境搭建与JPS命令应用详解
一、Hadoop 3.3.6 完全分布式环境搭建
Hadoop 3.3.6 完全分布式环境搭建是学习大数据技术的重要步骤,本文将详细介绍Hadoop 3.3.6完全分布式环境的搭建过程,帮助读者快速掌握Hadoop集群部署。
1. 环境准备
(1)操作系统:选择Linux操作系统,如CentOS 7。
图片来源于网络,如有侵权联系删除
(2)Java环境:安装Java 8及以上版本。
(3)SSH无密码登录:在集群所有节点上配置SSH无密码登录。
2. 下载Hadoop 3.3.6
(1)从Hadoop官网下载Hadoop 3.3.6版本。
(2)将下载好的hadoop-3.3.6.tar.gz文件上传到集群的任意节点,如node1。
3. 解压Hadoop
(1)进入hadoop-3.3.6.tar.gz所在的目录。
(2)执行以下命令解压:
tar -zxvf hadoop-3.3.6.tar.gz
4. 配置Hadoop环境变量
(1)在集群所有节点上编辑.bashrc文件。
(2)添加以下内容:
export HADOOP_HOME=/opt/hadoop-3.3.6
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
(3)使配置生效:
source .bashrc
5. 配置Hadoop
(1)进入Hadoop安装目录。
(2)复制配置文件模板:
cp etc/hadoop/hadoop-env.sh etc/hadoop/hadoop-env.sh.bak
cp etc/hadoop/core-site.xml etc/hadoop/core-site.xml.bak
cp etc/hadoop/hdfs-site.xml etc/hadoop/hdfs-site.xml.bak
图片来源于网络,如有侵权联系删除
cp etc/hadoop/yarn-site.xml etc/hadoop/yarn-site.xml.bak
cp etc/hadoop/mapred-site.xml etc/hadoop/mapred-site.xml.bak
(3)编辑core-site.xml:
(4)编辑hdfs-site.xml:
(5)编辑yarn-site.xml:
(6)编辑mapred-site.xml:
6. 配置SSH无密码登录
(1)在集群所有节点上生成SSH密钥对:
ssh-keygen -t rsa -P '' -C 'your_email@example.com'
(2)将公钥复制到所有节点:
ssh-copy-id -i ~/.ssh/id_rsa.pub node1
7. 格式化HDFS
(1)在node1节点上执行以下命令格式化HDFS:
hdfs namenode -format
(2)在node1节点上启动HDFS:
start-dfs.sh
8. 启动YARN
(1)在node1节点上启动YARN:
start-yarn.sh
(2)查看YARN Web UI:
http://node1:8088
至此,Hadoop 3.3.6完全分布式环境搭建完成。
图片来源于网络,如有侵权联系删除
二、JPS命令应用详解
JPS命令用于查看Java进程状态,在Hadoop环境中,JPS命令主要用于查看Hadoop集群中的进程状态。
1. JPS命令语法
jps [options] [args]
2. JPS命令选项
(1)-q:仅显示进程ID。
(2)-m:显示主类名。
(3)-l:显示完整主类名。
3. JPS命令应用实例
(1)查看所有Java进程:
jps
(2)仅显示进程ID:
jps -q
(3)显示主类名:
jps -m
(4)显示完整主类名:
jps -l
通过JPS命令,可以方便地查看Hadoop集群中的进程状态,有助于排查问题。
本文详细介绍了Hadoop 3.3.6完全分布式环境搭建过程以及JPS命令的应用,读者通过学习本文,可以快速搭建Hadoop集群,并熟练使用JPS命令查看Java进程状态。
标签: #hadoop3.3.6完全分布式搭建
评论列表