虚拟机hadoop安装教程

欧气 2024年11月06日 22:11 0 0

虚拟机环境下一站式Hadoop集群安装与配置指南

随着大数据时代的到来，Hadoop作为分布式存储和计算框架，在处理海量数据方面发挥着重要作用，本文将详细阐述在虚拟机环境中搭建Hadoop集群的步骤，帮助您快速上手Hadoop技术。

一、环境准备

1. 操作系统：CentOS 7.x（64位）

2. 虚拟机软件：VMware Workstation

虚拟机hadoop安装教程

图片来源于网络，如有侵权联系删除

3. Hadoop版本：Hadoop 3.3.4

二、虚拟机配置

1. 创建虚拟机：打开VMware Workstation，点击“创建新的虚拟机”，选择“自定义（高级）”，然后依次选择操作系统、版本、虚拟机名称和存储位置。

2. 配置CPU和内存：根据实际情况，为虚拟机分配足够的CPU核心和内存，建议CPU核心数为2-4个，内存为4GB-8GB。

3. 配置网络：选择“桥接模式”，确保虚拟机可以访问外部网络。

4. 创建磁盘：为虚拟机创建至少50GB的磁盘空间。

三、安装JDK

1. 下载JDK：访问Oracle官网，下载适用于CentOS 7的JDK版本。

2. 解压JDK：将下载的JDK压缩包解压到指定目录，/usr/local/java/jdk1.8.0_231。

3. 配置环境变量：编辑~/.bashrc文件，添加以下内容：

```

export JAVA_HOME=/usr/local/java/jdk1.8.0_231

export PATH=$PATH:$JAVA_HOME/bin

```

4. 使配置生效：执行以下命令：

```

source ~/.bashrc

```

四、安装Hadoop

1. 下载Hadoop：访问Apache Hadoop官网，下载适用于CentOS 7的Hadoop版本。

2. 解压Hadoop：将下载的Hadoop压缩包解压到指定目录，/usr/local/hadoop/hadoop-3.3.4。

3. 配置环境变量：编辑~/.bashrc文件，添加以下内容：

```

export HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.4

export PATH=$PATH:$HADOOP_HOME/bin

虚拟机hadoop安装教程

图片来源于网络，如有侵权联系删除

export PATH=$PATH:$HADOOP_HOME/sbin

```

4. 使配置生效：执行以下命令：

```

source ~/.bashrc

```

五、配置Hadoop

1. 配置文件路径：/usr/local/hadoop/hadoop-3.3.4/etc/hadoop

2. 配置核心文件：

- core-site.xml：

```xml

fs.defaultFShdfs://master:8020hadoop.tmp.dir/usr/local/hadoop/hadoop-3.3.4/tmp

```

- hdfs-site.xml：

```xml

dfs.replication2dfs.namenode.name.dir/usr/local/hadoop/hadoop-3.3.4/hdfs/namenodedfs.datanode.data.dir/usr/local/hadoop/hadoop-3.3.4/hdfs/datanode

```

- mapred-site.xml：

```xml

mapreduce.framework.nameyarn

```

- yarn-site.xml：

```xml

yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.addressmaster:8032yarn.nodemanager.aux-services.mapreduce_shuffle.classorg.apache.hadoop.mapred.ShuffleHandler

```

3. 配置slaves文件：在hadoop目录下创建slaves文件，并写入所有从节点的主机名。

六、格式化HDFS

```

hadoop namenode -format

虚拟机hadoop安装教程

图片来源于网络，如有侵权联系删除

```

七、启动Hadoop服务

1. 启动NameNode：

```

start-dfs.sh

```

2. 启动YARN：

```

start-yarn.sh

```

3. 启动HistoryServer：

```

mr-jobhistory-daemon.sh start historyserver

```

八、测试Hadoop集群

1. 访问Web界面：在浏览器中输入http://master:50070/，查看HDFS状态。

2. 运行WordCount示例：

```shell

hadoop jar /usr/local/hadoop/hadoop-3.3.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount /input /output

```

在输出目录中查看结果。

通过以上步骤，您已经成功在虚拟机环境中搭建了一个Hadoop集群，在实际应用中，可以根据需求进行优化和扩展，祝您在Hadoop的世界中畅游！

标签： #虚拟机hadoop集群安装步骤