虚拟机hadoop集群三个节点，搭建Hadoop集群，三节点虚拟机实践指南

欧气 2024年11月03日 19:16 0 0

本文目录导读：

背景
环境准备
虚拟机配置
Hadoop安装与配置
启动Hadoop集群

背景

随着大数据时代的到来，Hadoop作为一款开源的大数据处理框架，得到了广泛应用，在Hadoop集群中，虚拟机技术可以提供灵活、高效、可扩展的计算环境，本文将详细介绍如何在三台虚拟机上搭建Hadoop集群，以供读者参考。

环境准备

1、虚拟机软件：VMware Workstation、VirtualBox等

虚拟机hadoop集群三个节点，搭建Hadoop集群，三节点虚拟机实践指南

图片来源于网络，如有侵权联系删除

2、操作系统：CentOS 7.4（或其他Linux发行版）

3、Hadoop版本：Hadoop 3.2.1（或其他版本）

4、网络环境：三台虚拟机之间可以相互通信

虚拟机配置

1、创建三台虚拟机，操作系统均为CentOS 7.4，内存至少4GB，硬盘至少100GB。

2、设置虚拟机网络，确保三台虚拟机之间可以相互通信，可以使用NAT模式，将虚拟机连接到同一局域网。

Hadoop安装与配置

1、安装Java环境

在所有虚拟机上安装Java 8或更高版本，并配置环境变量，以下以Java 8为例：

安装Java
sudo yum install -y java-1.8.0-openjdk
配置环境变量
echo 'export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

2、安装Hadoop

在所有虚拟机上下载Hadoop 3.2.1安装包，并解压到指定目录，如/opt/hadoop。

虚拟机hadoop集群三个节点，搭建Hadoop集群，三节点虚拟机实践指南

图片来源于网络，如有侵权联系删除

下载Hadoop
wget https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
解压安装包
tar -zxvf hadoop-3.2.1.tar.gz -C /opt/hadoop

3、配置Hadoop

（1）修改/opt/hadoop/etc/hadoop/hadoop-env.sh文件，设置Hadoop运行时使用的Java环境：

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

（2）修改/opt/hadoop/etc/hadoop/core-site.xml文件，配置Hadoop运行时的文件系统：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:8020</value>
    </property>
</configuration>

（3）修改/opt/hadoop/etc/hadoop/hdfs-site.xml文件，配置HDFS的存储目录：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/opt/hadoop/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/hadoop/hdfs/datanode</value>
    </property>
</configuration>

（4）修改/opt/hadoop/etc/hadoop/yarn-site.xml文件，配置YARN运行时的资源管理器：

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
</configuration>

4、配置SSH免密登录

在三台虚拟机之间配置SSH免密登录，以便后续操作，以下以master节点为例：

生成SSH密钥
ssh-keygen -t rsa -P '' -C 'your_email@example.com'
将公钥复制到其他虚拟机
ssh-copy-id root@slave1
ssh-copy-id root@slave2
在其他虚拟机上执行相同操作
ssh-keygen -t rsa -P '' -C 'your_email@example.com'
ssh-copy-id root@master