标题:Hadoop 伪分布式环境搭建全攻略
一、引言
Hadoop 是一个开源的分布式计算框架,它可以处理大规模数据,在学习 Hadoop 之前,我们需要搭建一个伪分布式环境,以便更好地理解 Hadoop 的工作原理,本文将详细介绍 Hadoop 伪分布式环境的搭建步骤。
二、环境准备
1、操作系统:CentOS 7.6
2、JDK 版本:1.8.0_292
3、Hadoop 版本:3.2.1
三、安装 JDK
1、下载 JDK 安装包
- 访问 Oracle 官方网站,下载 JDK 1.8.0_292 安装包。
- 将下载的安装包上传到服务器的 /usr/local 目录下。
2、安装 JDK
- 进入 /usr/local 目录,执行以下命令解压 JDK 安装包:
```
tar -zxvf jdk-8u292-linux-x64.tar.gz
```
- 解压完成后,进入解压后的目录,执行以下命令创建软链接:
```
ln -s /usr/local/jdk1.8.0_292 /usr/local/java
```
- 配置环境变量
- 打开 /etc/profile 文件,在文件末尾添加以下内容:
```
export JAVA_HOME=/usr/local/java
export PATH=$JAVA_HOME/bin:$PATH
```
- 使环境变量生效
- 执行以下命令使环境变量生效:
```
source /etc/profile
```
- 验证 JDK 是否安装成功
- 打开终端,输入以下命令验证 JDK 是否安装成功:
```
java -version
```
- 输出 JDK 版本信息,表示 JDK 安装成功。
四、安装 Hadoop
1、下载 Hadoop 安装包
- 访问 Hadoop 官方网站,下载 Hadoop 3.2.1 安装包。
- 将下载的安装包上传到服务器的 /usr/local 目录下。
2、安装 Hadoop
- 进入 /usr/local 目录,执行以下命令解压 Hadoop 安装包:
```
tar -zxvf hadoop-3.2.1.tar.gz
```
- 解压完成后,进入解压后的目录,执行以下命令创建软链接:
```
ln -s /usr/local/hadoop-3.2.1 /usr/local/hadoop
```
- 配置环境变量
- 打开 /etc/profile 文件,在文件末尾添加以下内容:
```
export HADOOP_HOME=/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$PATH
```
- 使环境变量生效
- 执行以下命令使环境变量生效:
```
source /etc/profile
```
- 配置 Hadoop 环境变量
- 打开 /etc/profile 文件,在文件末尾添加以下内容:
```
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
```
- 使环境变量生效
- 执行以下命令使环境变量生效:
```
source /etc/profile
```
- 格式化 Hadoop 分布式文件系统
- 进入 Hadoop 安装目录的 bin 目录,执行以下命令格式化 Hadoop 分布式文件系统:
```
hdfs namenode -format
```
- 启动 Hadoop 集群
- 进入 Hadoop 安装目录的 sbin 目录,执行以下命令启动 Hadoop 集群:
```
start-dfs.sh
start-yarn.sh
```
- 查看 Hadoop 集群状态
- 打开浏览器,输入以下地址查看 Hadoop 集群状态:
```
http://localhost:50070/
http://localhost:8088/
```
- 输出 Hadoop 集群状态信息,表示 Hadoop 集群启动成功。
五、总结
本文详细介绍了 Hadoop 伪分布式环境的搭建步骤,包括环境准备、安装 JDK、安装 Hadoop、配置环境变量和格式化 Hadoop 分布式文件系统等,通过本文的学习,读者可以搭建一个简单的 Hadoop 伪分布式环境,以便更好地学习和理解 Hadoop 的工作原理。
评论列表