搭建hadoop完全分布式集群的过程，深度解析，从零开始搭建Hadoop完全分布式集群

欧气 2024年11月05日 15:23 0 0

本文目录导读：

搭建Hadoop完全分布式集群的具体步骤

随着大数据时代的到来，Hadoop作为一款开源的分布式计算框架，已经成为了处理海量数据的重要工具，本文将详细讲解如何从零开始搭建一个Hadoop完全分布式集群，帮助读者掌握Hadoop集群的搭建与配置。

二、搭建Hadoop完全分布式集群前的准备工作

1、硬件要求

（1）服务器：建议使用配置较高的服务器，如Intel Xeon CPU、16GB内存、1TB硬盘等。

搭建hadoop完全分布式集群的过程，深度解析，从零开始搭建Hadoop完全分布式集群

图片来源于网络，如有侵权联系删除

（2）操作系统：推荐使用Linux系统，如CentOS 7、Ubuntu 18.04等。

2、软件要求

（1）JDK：安装JDK 1.8及以上版本。

（2）Hadoop：下载适合Linux系统的Hadoop版本，如Hadoop 3.2.1。

搭建Hadoop完全分布式集群的具体步骤

1、准备工作

（1）配置网络：确保所有服务器之间的网络通信正常。

（2）同步时间：使用NTP服务同步服务器时间。

2、配置SSH免密登录

（1）在所有服务器上生成SSH密钥对：

ssh-keygen -t rsa -P '' -C 'your_email@example.com'

（2）将公钥复制到其他服务器：

ssh-copy-id -i ~/.ssh/id_rsa.pub root@<其他服务器IP>

3、安装JDK

（1）下载JDK安装包：

wget -c http://download.oracle.com/otn-pub/java/jdk/8u171-b11/2c108c7d336948527a5e4c14403c0f44/jdk-8u171-linux-x64.tar.gz

（2）解压安装包：

搭建hadoop完全分布式集群的过程，深度解析，从零开始搭建Hadoop完全分布式集群

图片来源于网络，如有侵权联系删除

tar -xzf jdk-8u171-linux-x64.tar.gz -C /usr/local/

（3）配置环境变量：

vi /etc/profile

添加以下内容：

export JAVA_HOME=/usr/local/jdk1.8.0_171
export PATH=$PATH:$JAVA_HOME/bin

（4）使配置生效：

source /etc/profile

4、安装Hadoop

（1）下载Hadoop安装包：

wget -c http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

（2）解压安装包：

tar -xzf hadoop-3.2.1.tar.gz -C /usr/local/

（3）配置Hadoop：

（a）配置hadoop-env.sh：

vi /usr/local/hadoop-3.2.1/etc/hadoop/hadoop-env.sh

添加以下内容：

export JAVA_HOME=/usr/local/jdk1.8.0_171

（b）配置core-site.xml：

vi /usr/local/hadoop-3.2.1/etc/hadoop/core-site.xml

添加以下内容：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:8020</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop-3.2.1/tmp</value>
    </property>
</configuration>

（c）配置hdfs-site.xml：

vi /usr/local/hadoop-3.2.1/etc/hadoop/hdfs-site.xml

添加以下内容：

搭建hadoop完全分布式集群的过程，深度解析，从零开始搭建Hadoop完全分布式集群

图片来源于网络，如有侵权联系删除

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop-3.2.1/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop-3.2.1/hdfs/datanode</value>
    </property>
</configuration>

（d）配置yarn-site.xml：

vi /usr/local/hadoop-3.2.1/etc/hadoop/yarn-site.xml

添加以下内容：

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

5、格式化NameNode