hadoop伪分布式环境搭建步骤，hadoop伪分布式安装搭建步骤，Hadoop伪分布式环境搭建指南，步骤详解与优化技巧

欧气 2024年10月13日 04:04 0 0

本文详细介绍了Hadoop伪分布式环境搭建的步骤，包括安装、配置和优化技巧。通过一步步的详解，帮助读者快速搭建Hadoop伪分布式环境，提高数据处理效率。

本文目录导读：

环境准备
安装JDK
安装Hadoop
启动Hadoop集群
优化技巧

环境准备

1、操作系统：选择Linux操作系统，推荐使用CentOS 7或Ubuntu 18.04。

2、JDK：Hadoop依赖Java运行环境，需安装JDK 1.8版本。

3、网络配置：确保网络畅通，主机名、IP地址、网关等信息配置正确。

hadoop伪分布式环境搭建步骤，hadoop伪分布式安装搭建步骤，Hadoop伪分布式环境搭建指南，步骤详解与优化技巧

图片来源于网络，如有侵权联系删除

4、数据盘：建议使用至少100G的硬盘空间，用于存储Hadoop数据和日志。

安装JDK

1、下载JDK安装包：前往Oracle官网下载JDK 1.8版本，选择Linux版本。

2、解压安装包：使用tar命令解压JDK安装包，tar -xvf jdk-8u231-linux-x64.tar.gz

3、配置环境变量：编辑~/.bash_profile文件，添加以下内容：

export JAVA_HOME=/usr/local/jdk1.8.0_231
export PATH=$PATH:$JAVA_HOME/bin

4、使环境变量生效：执行source ~/.bash_profile命令。

5、验证JDK安装：在终端输入java -version，查看JDK版本信息。

安装Hadoop

1、下载Hadoop安装包：前往Apache Hadoop官网下载Hadoop 3.3.4版本，选择Linux版本。

2、解压安装包：使用tar命令解压Hadoop安装包，tar -xvf hadoop-3.3.4.tar.gz

3、配置Hadoop环境变量：编辑~/.bash_profile文件，添加以下内容：

hadoop伪分布式环境搭建步骤，hadoop伪分布式安装搭建步骤，Hadoop伪分布式环境搭建指南，步骤详解与优化技巧

图片来源于网络，如有侵权联系删除

export HADOOP_HOME=/usr/local/hadoop-3.3.4
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

4、使环境变量生效：执行source ~/.bash_profile命令。

5、配置Hadoop配置文件：

（1）编辑$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件，配置JDK路径：

export JAVA_HOME=/usr/local/jdk1.8.0_231

（2）编辑$HADOOP_HOME/etc/hadoop/core-site.xml文件，配置Hadoop核心参数：

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop-3.3.4/tmp</value>
  </property>
</configuration>

（3）编辑$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件，配置HDFS参数：

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/usr/local/hadoop-3.3.4/hdfs/namenode</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/usr/local/hadoop-3.3.4/hdfs/datanode</value>
  </property>
</configuration>

6、格式化NameNode：在终端执行以下命令，格式化HDFS文件系统：