黑狐家游戏

搭建hadoop伪分布式环境步骤,手把手教你搭建Hadoop伪分布式环境——开启大数据之旅

欧气 0 0

本文目录导读:

  1. 搭建Hadoop伪分布式环境所需软件
  2. 搭建Hadoop伪分布式环境步骤

随着大数据时代的到来,Hadoop作为一款开源的分布式计算框架,已经成为处理海量数据的重要工具,本文将详细讲解如何搭建Hadoop伪分布式环境,帮助您快速入门大数据。

搭建Hadoop伪分布式环境所需软件

1、JDK:Hadoop依赖于Java环境,请确保您的系统中已安装JDK 1.8或更高版本。

搭建hadoop伪分布式环境步骤,手把手教你搭建Hadoop伪分布式环境——开启大数据之旅

图片来源于网络,如有侵权联系删除

2、Hadoop:本文以Hadoop 3.3.1版本为例,您可以从Apache官网下载相应版本。

3、Linux操作系统:本文以CentOS 7为例,其他Linux发行版也可以参考本文进行搭建。

搭建Hadoop伪分布式环境步骤

1、下载并安装JDK

前往Oracle官网下载JDK 1.8或更高版本,下载完成后,将JDK安装包上传到Linux服务器。

执行以下命令,解压JDK安装包:

tar -zxvf jdk-8uXXX-linux-x64.tar.gz

配置JDK环境变量,编辑~/.bash_profile文件,添加以下内容:

export JAVA_HOME=/usr/local/jdk1.8.0_XXX
export PATH=$PATH:$JAVA_HOME/bin

保存并关闭文件,执行以下命令使环境变量生效:

source ~/.bash_profile

2、下载并安装Hadoop

同样,将Hadoop安装包上传到Linux服务器,解压安装包:

tar -zxvf hadoop-3.3.1.tar.gz

3、配置Hadoop环境变量

搭建hadoop伪分布式环境步骤,手把手教你搭建Hadoop伪分布式环境——开启大数据之旅

图片来源于网络,如有侵权联系删除

编辑~/.bash_profile文件,添加以下内容:

export HADOOP_HOME=/usr/local/hadoop-3.3.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存并关闭文件,执行以下命令使环境变量生效:

source ~/.bash_profile

4、配置Hadoop配置文件

进入Hadoop配置目录:

cd $HADOOP_HOME/etc/hadoop

编辑hadoop-env.sh文件,配置JDK路径:

export JAVA_HOME=/usr/local/jdk1.8.0_XXX

编辑core-site.xml文件,配置Hadoop运行时的基本参数:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop-3.3.1/data/tmp</value>
    </property>
</configuration>

编辑hdfs-site.xml文件,配置HDFS参数:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

编辑mapred-site.xml文件,配置MapReduce参数:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

编辑yarn-site.xml文件,配置YARN参数:

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>localhost</value>
    </property>
</configuration>

5、格式化HDFS文件系统

搭建hadoop伪分布式环境步骤,手把手教你搭建Hadoop伪分布式环境——开启大数据之旅

图片来源于网络,如有侵权联系删除

在Hadoop配置目录下,执行以下命令格式化HDFS文件系统:

hdfs namenode -format

6、启动Hadoop服务

在Hadoop的sbin目录下,分别执行以下命令启动HDFS和YARN服务:

start-dfs.sh
start-yarn.sh

7、验证Hadoop伪分布式环境

打开浏览器,访问以下地址,查看HDFS Web界面:

http://localhost:50070

查看YARN Web界面:

http://localhost:8088

至此,Hadoop伪分布式环境搭建完成。

本文详细介绍了如何搭建Hadoop伪分布式环境,通过本教程,您应该已经成功入门大数据,您可以学习Hadoop的其他组件和功能,逐步深入大数据领域,祝您学习愉快!

标签: #第2关:配置开发环境 - hadoop安装与伪分布式集群搭建

黑狐家游戏
  • 评论列表

留言评论