本文目录导读:
准备工作
在开始安装Hadoop 3之前,我们需要做好以下准备工作:
1、确保虚拟机已安装,且操作系统为Linux系统(如CentOS 7、Ubuntu等)。
2、虚拟机内存至少为4GB,硬盘至少为20GB。
图片来源于网络,如有侵权联系删除
3、下载Hadoop 3安装包,可从Apache Hadoop官网下载。
4、修改主机名和IP地址,方便后续配置。
5、关闭防火墙和SELinux。
安装Hadoop 3
1、解压Hadoop 3安装包
将下载的Hadoop 3安装包解压到指定目录,
tar -zxvf hadoop-3.3.4.tar.gz -C /usr/local/hadoop
2、配置环境变量
在Linux系统中,我们需要将Hadoop的bin和sbin目录添加到环境变量中,以便在任何目录下执行hadoop命令。
编辑bash_profile文件:
vi ~/.bash_profile
添加以下内容:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
保存并退出,然后执行以下命令使配置生效:
图片来源于网络,如有侵权联系删除
source ~/.bash_profile
3、配置Hadoop
进入Hadoop配置目录:
cd /usr/local/hadoop/etc/hadoop
(1)配置主机名和IP地址
修改core-site.xml文件:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://hadoopmaster:8020</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop/tmp</value> </property> </configuration>
hadoopmaster为Hadoop集群的主机名。
(2)配置HDFS
修改hdfs-site.xml文件:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop/hdfs/datanode</value> </property> </configuration>
(3)配置YARN
修改yarn-site.xml文件:
<configuration> <property> <name>yarn.resourcemanager.host</name> <value>hadoopmaster</value> </property> </configuration>
4、格式化HDFS
图片来源于网络,如有侵权联系删除
在Hadoop配置目录下执行以下命令,格式化HDFS:
hadoop namenode -format
5、启动Hadoop服务
启动Hadoop服务,包括NameNode、DataNode和ResourceManager:
start-dfs.sh start-yarn.sh
6、验证Hadoop安装
在浏览器中输入以下地址,查看Hadoop Web界面:
http://hadoopmaster:50070
在浏览器中输入以下地址,查看YARN Web界面:
http://hadoopmaster:8088
至此,Hadoop 3已成功安装并启动。
本文详细介绍了在虚拟机环境中安装Hadoop 3的步骤,通过以上步骤,您可以在Linux系统上快速搭建Hadoop 3集群,并开始使用Hadoop进行大数据处理,在安装过程中,请确保按照步骤操作,避免出现错误。
标签: #虚拟机安装hadoop步骤
评论列表