搭建hadoop伪分布式环境步骤，第2关:配置开发环境 - hadoop安装与伪分布式集群搭建

欧气 2024年09月27日 00:28 3 0

标题：Hadoop 伪分布式环境搭建全攻略

一、引言

Hadoop 是一个开源的分布式计算框架，它可以处理大规模数据，在学习 Hadoop 之前，我们需要搭建一个伪分布式环境，以便更好地理解 Hadoop 的工作原理，本文将详细介绍 Hadoop 伪分布式环境的搭建步骤。

二、环境准备

1、操作系统：CentOS 7.6

2、JDK 版本：1.8.0_292

3、Hadoop 版本：3.2.1

三、安装 JDK

1、下载 JDK 安装包

- 访问 Oracle 官方网站，下载 JDK 1.8.0_292 安装包。

- 将下载的安装包上传到服务器的 /usr/local 目录下。

2、安装 JDK

- 进入 /usr/local 目录，执行以下命令解压 JDK 安装包：

```

tar -zxvf jdk-8u292-linux-x64.tar.gz

```

- 解压完成后，进入解压后的目录，执行以下命令创建软链接：

```

ln -s /usr/local/jdk1.8.0_292 /usr/local/java

```

- 配置环境变量

- 打开 /etc/profile 文件，在文件末尾添加以下内容：

```

export JAVA_HOME=/usr/local/java

export PATH=$JAVA_HOME/bin:$PATH

```

- 使环境变量生效

- 执行以下命令使环境变量生效：

```

source /etc/profile

```

- 验证 JDK 是否安装成功

- 打开终端，输入以下命令验证 JDK 是否安装成功：

```

java -version

```

- 输出 JDK 版本信息，表示 JDK 安装成功。

四、安装 Hadoop

1、下载 Hadoop 安装包

- 访问 Hadoop 官方网站，下载 Hadoop 3.2.1 安装包。

- 将下载的安装包上传到服务器的 /usr/local 目录下。

2、安装 Hadoop

- 进入 /usr/local 目录，执行以下命令解压 Hadoop 安装包：

```

tar -zxvf hadoop-3.2.1.tar.gz

```

- 解压完成后，进入解压后的目录，执行以下命令创建软链接：

```

ln -s /usr/local/hadoop-3.2.1 /usr/local/hadoop

```

- 配置环境变量

- 打开 /etc/profile 文件，在文件末尾添加以下内容：

```

export HADOOP_HOME=/usr/local/hadoop

export PATH=$HADOOP_HOME/bin:$PATH

```

- 使环境变量生效

- 执行以下命令使环境变量生效：

```

source /etc/profile

```

- 配置 Hadoop 环境变量

- 打开 /etc/profile 文件，在文件末尾添加以下内容：

```

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

```

- 使环境变量生效

- 执行以下命令使环境变量生效：

```

source /etc/profile

```

- 格式化 Hadoop 分布式文件系统

- 进入 Hadoop 安装目录的 bin 目录，执行以下命令格式化 Hadoop 分布式文件系统：

```

hdfs namenode -format

```

- 启动 Hadoop 集群

- 进入 Hadoop 安装目录的 sbin 目录，执行以下命令启动 Hadoop 集群：

```

start-dfs.sh

start-yarn.sh

```

- 查看 Hadoop 集群状态

- 打开浏览器，输入以下地址查看 Hadoop 集群状态：

```

http://localhost:50070/

http://localhost:8088/

```

- 输出 Hadoop 集群状态信息，表示 Hadoop 集群启动成功。

五、总结

本文详细介绍了 Hadoop 伪分布式环境的搭建步骤，包括环境准备、安装 JDK、安装 Hadoop、配置环境变量和格式化 Hadoop 分布式文件系统等，通过本文的学习，读者可以搭建一个简单的 Hadoop 伪分布式环境，以便更好地学习和理解 Hadoop 的工作原理。

标签： #Hadoop #伪分布式 #开发环境