本文目录导读:
图片来源于网络,如有侵权联系删除
Hadoop是一款开源的分布式计算框架,适用于大规模数据集的处理,随着大数据时代的到来,Hadoop在各个领域都得到了广泛应用,本文将详细解析在虚拟机中安装Hadoop的步骤,帮助读者轻松掌握Hadoop的安装与配置。
环境准备
1、操作系统:Linux操作系统,推荐使用CentOS 7.0。
2、虚拟机软件:VMware Workstation、VirtualBox等。
3、Hadoop版本:本文以Hadoop 3.3.1为例。
4、网络配置:确保虚拟机与宿主机之间的网络互通。
安装步骤
1、下载Hadoop安装包
访问Hadoop官网(https://hadoop.apache.org/)下载适合自己操作系统的Hadoop版本安装包。
2、上传安装包到虚拟机
将下载的Hadoop安装包上传到虚拟机的指定目录,/opt/hadoop。
3、解压安装包
在终端中执行以下命令,解压安装包:
tar -zxvf hadoop-3.3.1.tar.gz
4、配置环境变量
在终端中执行以下命令,打开.bashrc文件:
vi ~/.bashrc
在文件中添加以下内容:
export HADOOP_HOME=/opt/hadoop/hadoop-3.3.1
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
5、使环境变量生效
在终端中执行以下命令,使环境变量生效:
source ~/.bashrc
6、配置Hadoop
(1)配置hadoop-env.sh
在Hadoop安装目录下的etc/hadoop目录中,找到hadoop-env.sh文件,并编辑该文件,配置JAVA_HOME路径:
JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.272.b10-1.el7_8.x86_64
(2)配置core-site.xml
在etc/hadoop目录中,找到core-site.xml文件,并编辑该文件,配置以下内容:
图片来源于网络,如有侵权联系删除
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/hadoop-3.3.1/data/tmp</value>
</property>
(3)配置hdfs-site.xml
在etc/hadoop目录中,找到hdfs-site.xml文件,并编辑该文件,配置以下内容:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/hadoop/hadoop-3.3.1/data/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop/hadoop-3.3.1/data/hdfs/data</value>
</property>
(4)配置yarn-site.xml
在etc/hadoop目录中,找到yarn-site.xml文件,并编辑该文件,配置以下内容:
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
图片来源于网络,如有侵权联系删除
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
7、格式化HDFS
在终端中执行以下命令,格式化HDFS:
hdfs namenode -format
8、启动Hadoop服务
(1)启动NameNode
在终端中执行以下命令,启动NameNode:
start-dfs.sh
(2)启动SecondaryNameNode
在终端中执行以下命令,启动SecondaryNameNode:
start-SecondaryNameNode.sh
(3)启动ResourceManager
在终端中执行以下命令,启动ResourceManager:
start-yarn.sh
测试Hadoop
1、查看Hadoop进程
在终端中执行以下命令,查看Hadoop进程:
jps
2、访问HDFS
在终端中执行以下命令,访问HDFS:
hdfs dfs -ls /
3、查看YARN资源管理器
在终端中执行以下命令,查看YARN资源管理器:
yarn rmadmin -report
本文详细介绍了在虚拟机中安装Hadoop的步骤,包括环境准备、下载安装包、配置环境变量、配置Hadoop、格式化HDFS、启动Hadoop服务以及测试Hadoop,通过本文的解析,读者可以轻松掌握Hadoop的安装与配置,希望本文对您有所帮助!
标签: #虚拟机安装hadoop
评论列表