黑狐家游戏

hadoop伪分布式集群安装步骤,hadoop安装与伪分布式集群搭建答案,Hadoop伪分布式集群安装与搭建详解

欧气 0 0
本文详细介绍了Hadoop伪分布式集群的安装步骤,包括Hadoop的安装与伪分布式集群搭建过程,旨在帮助读者快速掌握Hadoop伪分布式集群的安装与搭建方法。

本文目录导读:

  1. 环境准备
  2. 安装步骤

Hadoop作为一款分布式存储和计算框架,广泛应用于大数据领域,在搭建Hadoop集群时,伪分布式集群是最简单的部署方式,它只需在一台机器上安装Hadoop,并启动相关服务,本文将详细介绍Hadoop伪分布式集群的安装与搭建过程。

环境准备

1、操作系统:推荐使用CentOS 7或Ubuntu 16.04等Linux发行版。

2、JDK:推荐使用JDK 1.8。

3、Hadoop版本:本文以Hadoop 3.3.4为例。

hadoop伪分布式集群安装步骤,hadoop安装与伪分布式集群搭建答案,Hadoop伪分布式集群安装与搭建详解

图片来源于网络,如有侵权联系删除

安装步骤

1、安装JDK

以CentOS 7为例,使用以下命令安装JDK:

sudo yum install -y java-1.8.0-openjdk java-1.8.0-openjdk-devel

安装完成后,验证JDK版本:

java -version

2、下载Hadoop

从Hadoop官网(https://hadoop.apache.org/releases.html)下载对应版本的Hadoop源码包。

3、解压Hadoop

将下载的Hadoop源码包解压到指定目录,例如/usr/local/hadoop

tar -zxvf hadoop-3.3.4.tar.gz -C /usr/local/hadoop

4、配置Hadoop

hadoop伪分布式集群安装步骤,hadoop安装与伪分布式集群搭建答案,Hadoop伪分布式集群安装与搭建详解

图片来源于网络,如有侵权联系删除

进入Hadoop解压后的目录,编辑etc/hadoop/hadoop-env.sh文件,设置JDK路径:

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292-1.b08.el7_7.x86_64

5、配置集群

(1)编辑etc/hadoop/core-site.xml文件,配置Hadoop运行时的基本参数:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/data/tmp</value>
    </property>
</configuration>

(2)编辑etc/hadoop/hdfs-site.xml文件,配置HDFS存储参数:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/data/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop/data/hdfs/datanode</value>
    </property>
</configuration>

(3)编辑etc/hadoop/mapred-site.xml文件,配置MapReduce运行时的基本参数:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

(4)编辑etc/hadoop/yarn-site.xml文件,配置YARN运行时的基本参数:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>localhost:8032</value>
    </property>
    <property>
        <name>yarn.nodemanager.address</name>
        <value>localhost:12345</value>
    </property>
    <property>
        <name>yarn.nodemanager.local-address</name>
        <value>localhost:12345</value>
    </property>
</configuration>

6、格式化HDFS

在Hadoop根目录下,执行以下命令格式化HDFS:

hadoop伪分布式集群安装步骤,hadoop安装与伪分布式集群搭建答案,Hadoop伪分布式集群安装与搭建详解

图片来源于网络,如有侵权联系删除

bin/hdfs namenode -format

7、启动Hadoop服务

(1)启动HDFS:

bin/start-dfs.sh

(2)启动YARN:

bin/start-yarn.sh

8、验证集群

在浏览器中访问http://localhost:50070,查看HDFS Web UI;在另一个终端中执行以下命令,查看YARN Web UI:

yarn yarnsite

通过以上步骤,成功搭建了Hadoop伪分布式集群,在实际应用中,可以根据需求对集群进行扩展,例如增加节点、优化配置等,希望本文对您有所帮助。

标签: #Hadoop伪分布式搭建

黑狐家游戏
  • 评论列表

留言评论