本文目录导读:
环境准备
1、操作系统:选择Linux操作系统,如CentOS 7。
2、虚拟机软件:安装VMware Workstation或VirtualBox等虚拟机软件。
3、Hadoop版本:下载适合Linux系统的Hadoop版本,例如Hadoop 3.3.4。
虚拟机配置
1、创建虚拟机:在虚拟机软件中创建一个新虚拟机,选择Linux操作系统,如CentOS 7。
图片来源于网络,如有侵权联系删除
2、配置虚拟机:根据需求配置虚拟机的内存、CPU、硬盘等硬件资源。
3、安装操作系统:将CentOS 7的ISO镜像文件加载到虚拟机光驱,启动虚拟机并安装操作系统。
安装JDK
1、下载JDK:前往Oracle官网下载适合Linux系统的JDK版本,如JDK 8u231。
2、解压JDK:将下载的JDK文件解压到虚拟机的指定目录,home/hadoop/jdk1.8.0_231。
3、配置环境变量:编辑~/.bash_profile文件,添加以下内容:
export JAVA_HOME=/home/hadoop/jdk1.8.0_231 export PATH=$PATH:$JAVA_HOME/bin
4、使环境变量生效:在终端执行source ~/.bash_profile命令。
安装Hadoop
1、下载Hadoop:前往Apache Hadoop官网下载适合Linux系统的Hadoop版本,如Hadoop 3.3.4。
图片来源于网络,如有侵权联系删除
2、解压Hadoop:将下载的Hadoop文件解压到虚拟机的指定目录,home/hadoop/hadoop-3.3.4。
3、配置Hadoop环境变量:编辑~/.bash_profile文件,添加以下内容:
export HADOOP_HOME=/home/hadoop/hadoop-3.3.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
4、使环境变量生效:在终端执行source ~/.bash_profile命令。
配置Hadoop
1、修改Hadoop配置文件:进入Hadoop配置目录,home/hadoop/hadoop-3.3.4/etc/hadoop。
(1)配置core-site.xml:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://master:9000</value> </property> </configuration>
(2)配置hdfs-site.xml:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
(3)配置mapred-site.xml:
图片来源于网络,如有侵权联系删除
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
(4)配置yarn-site.xml:
<configuration> <property> <name>yarn.resourcemanager.host</name> <value>master</value> </property> </configuration>
2、格式化HDFS:在终端执行以下命令,格式化HDFS:
hadoop namenode -format
3、启动Hadoop服务:在终端执行以下命令,启动Hadoop服务:
start-dfs.sh start-yarn.sh
验证Hadoop安装
1、查看Hadoop进程:在终端执行以下命令,查看Hadoop进程是否正常运行:
jps
2、访问Hadoop Web界面:在浏览器中输入http://master:50070,即可访问Hadoop的Web界面,查看HDFS和YARN的状态。
本文详细介绍了在虚拟机环境下安装和配置Hadoop的步骤,通过以上步骤,您可以在虚拟机中成功搭建Hadoop环境,为后续进行大数据处理和开发打下坚实基础。
标签: #虚拟机安装hadoop安装详细步骤
评论列表