本文目录导读:
图片来源于网络,如有侵权联系删除
Hadoop是一个开源的分布式计算框架,适用于大数据处理,本文将详细介绍在虚拟机中安装Hadoop的步骤及配置指南,帮助您快速上手Hadoop。
准备工作
1、准备一台虚拟机,推荐操作系统为Linux。
2、下载Hadoop安装包:http://hadoop.apache.org/releases.html
3、准备Hadoop所需的Java环境。
4、配置好网络,确保虚拟机可以访问互联网。
安装步骤
1、解压Hadoop安装包
将下载的Hadoop安装包解压到虚拟机的指定目录,/usr/local/hadoop
2、配置环境变量
打开终端,编辑.bashrc文件:
vi ~/.bashrc
在文件中添加以下内容:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
保存并退出编辑,使环境变量生效:
source ~/.bashrc
3、配置Hadoop
进入Hadoop的配置目录:
图片来源于网络,如有侵权联系删除
cd $HADOOP_HOME/etc/hadoop
(1) 配置hadoop-env.sh
编辑hadoop-env.sh文件,配置Java环境:
vi hadoop-env.sh
添加以下内容:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64
(2) 配置core-site.xml
编辑core-site.xml文件,配置Hadoop运行时的基本参数:
vi core-site.xml
添加以下内容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop/tmp</value> </property> </configuration>
(3) 配置hdfs-site.xml
编辑hdfs-site.xml文件,配置HDFS存储参数:
vi hdfs-site.xml
添加以下内容:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/usr/local/hadoop/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/usr/local/hadoop/hdfs/datanode</value> </property> </configuration>
(4) 配置yarn-site.xml
编辑yarn-site.xml文件,配置YARN运行参数:
vi yarn-site.xml
添加以下内容:
<configuration> <property> <name>yarn.resourcemanager.host</name> <value>localhost</value> </property> </configuration>
4、格式化HDFS
图片来源于网络,如有侵权联系删除
格式化HDFS,为Hadoop集群创建必要的文件:
hadoop namenode -format
5、启动Hadoop集群
(1) 启动HDFS
start-dfs.sh
(2) 启动YARN
start-yarn.sh
验证安装
1、查看HDFS状态
jps
查看终端输出的进程,包括NameNode和DataNode进程。
2、访问Hadoop Web界面
在浏览器中输入:http://localhost:50070,查看HDFS的Web界面。
3、查看YARN Web界面
在浏览器中输入:http://localhost:8088,查看YARN的Web界面。
本文详细介绍了在虚拟机中安装Hadoop的步骤及配置指南,通过以上步骤,您可以快速搭建一个Hadoop集群,并进行大数据处理,祝您学习愉快!
标签: #虚拟机安装hadoop
评论列表