本文目录导读:
随着大数据时代的到来,Hadoop作为一款分布式计算框架,已经在各行各业得到了广泛应用,为了更好地学习和实践Hadoop技术,本文将详细介绍如何基于VMware搭建一个由四台虚拟机组成的Hadoop集群,通过以下步骤,您将能够成功搭建一个稳定、高效的Hadoop环境。
准备工作
1、硬件要求:
- 至少一台具备一定处理能力的计算机,CPU、内存、硬盘等配置需满足以下要求:
- CPU:至少四核
图片来源于网络,如有侵权联系删除
- 内存:至少8GB
- 硬盘:至少500GB
- VMware Workstation或VMware Fusion软件
2、软件要求:
- 操作系统:Linux(推荐CentOS 7)
- Hadoop版本:选择适合自己的版本,本文以Hadoop 3.2.1为例
搭建虚拟机
1、在VMware中创建四台虚拟机,分别为NameNode、Secondary NameNode、DataNode1、DataNode2。
2、配置虚拟机硬件:
- CPU:2核
- 内存:4GB
- 硬盘:20GB(可根据实际需求调整)
3、安装Linux操作系统:
- 下载CentOS 7 ISO镜像文件
- 在VMware中新建虚拟机,选择Linux操作系统,选择CentOS 7镜像文件
- 按照提示完成操作系统安装
配置网络
1、在虚拟机管理器中,为四台虚拟机设置静态IP地址:
- NameNode:192.168.1.100
图片来源于网络,如有侵权联系删除
- Secondary NameNode:192.168.1.101
- DataNode1:192.168.1.102
- DataNode2:192.168.1.103
2、配置虚拟机网络模式为“桥接模式”,确保虚拟机与物理机在同一网络环境下。
安装Hadoop
1、在四台虚拟机上安装JDK:
- 下载JDK 8或以上版本
- 解压JDK安装包
- 设置环境变量:
- 编辑/etc/profile
文件,添加以下内容:
export JAVA_HOME=/usr/local/jdk1.8.0_251 export PATH=$PATH:$JAVA_HOME/bin
- 执行source /etc/profile
使配置生效
2、下载Hadoop 3.2.1安装包:
- 下载Hadoop 3.2.1安装包
- 解压安装包
3、配置Hadoop环境变量:
- 编辑/etc/profile
文件,添加以下内容:
export HADOOP_HOME=/usr/local/hadoop-3.2.1 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
- 执行source /etc/profile
使配置生效
4、配置Hadoop配置文件:
图片来源于网络,如有侵权联系删除
- 复制/usr/local/hadoop-3.2.1/etc/hadoop/core-site.xml
到/etc/hadoop/
目录
- 编辑core-site.xml
文件,添加以下内容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://192.168.1.100:8020</value> </property> </configuration>
- 复制/usr/local/hadoop-3.2.1/etc/hadoop/hdfs-site.xml
到/etc/hadoop/
目录
- 编辑hdfs-site.xml
文件,添加以下内容:
<configuration> <property> <name>dfs.replication</name> <value>2</value> </property> </configuration>
- 复制/usr/local/hadoop-3.2.1/etc/hadoop/yarn-site.xml
到/etc/hadoop/
目录
- 编辑yarn-site.xml
文件,添加以下内容:
<configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>192.168.1.100</value> </property> </configuration>
格式化HDFS
1、在NameNode虚拟机上执行以下命令:
hdfs namenode -format
2、重启NameNode和Secondary NameNode虚拟机。
启动Hadoop集群
1、在NameNode虚拟机上执行以下命令,启动HDFS和YARN:
start-dfs.sh start-yarn.sh
2、查看Hadoop服务状态:
jps
3、访问Hadoop Web界面:
- 在浏览器中输入:http://192.168.1.100:50070
- 查看HDFS状态
- 在浏览器中输入:http://192.168.1.100:8088
- 查看YARN状态
至此,您已经成功基于VMware搭建了一个由四台虚拟机组成的Hadoop集群,您可以根据自己的需求,在Hadoop集群上运行各种大数据应用。
标签: #hadoop集群搭建四台虚拟机
评论列表