本文目录导读:
图片来源于网络,如有侵权联系删除
Hadoop作为一款开源的分布式计算框架,在处理大规模数据集方面具有显著优势,本文将详细讲解Hadoop的安装与伪分布式集群搭建过程,旨在帮助读者从入门到精通。
环境准备
1、操作系统:CentOS 7.x
2、Java:Java 1.8.x
3、Hadoop:Hadoop 3.x
Hadoop安装与伪分布式集群搭建
1、安装Java
(1)下载Java 1.8.x版本的安装包,解压到指定目录。
(2)编辑/etc/profile
文件,添加以下内容:
export JAVA_HOME=/usr/local/java export PATH=$PATH:$JAVA_HOME/bin
(3)使配置生效:
source /etc/profile
(4)验证Java安装:
图片来源于网络,如有侵权联系删除
java -version
2、下载Hadoop
(1)从Hadoop官网下载Hadoop 3.x版本的安装包,解压到指定目录。
(2)编辑/etc/profile
文件,添加以下内容:
export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin
(3)使配置生效:
source /etc/profile
3、配置Hadoop
(1)进入Hadoop解压目录,编辑etc/hadoop/hadoop-env.sh
文件,添加以下内容:
export JAVA_HOME=/usr/local/java
(2)编辑etc/hadoop/core-site.xml
文件,添加以下内容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
(3)编辑etc/hadoop/hdfs-site.xml
文件,添加以下内容:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
(4)编辑etc/hadoop/mapred-site.xml
文件,添加以下内容:
图片来源于网络,如有侵权联系删除
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
4、格式化HDFS
hdfs namenode -format
5、启动Hadoop服务
(1)启动NameNode:
start-dfs.sh
(2)启动ResourceManager:
start-yarn.sh
6、验证Hadoop伪分布式集群
(1)打开浏览器,访问http://localhost:50070
,查看HDFS Web界面。
(2)打开浏览器,访问http://localhost:8088
,查看YARN Web界面。
本文详细讲解了Hadoop的安装与伪分布式集群搭建过程,通过本文的学习,读者可以掌握Hadoop的基本操作,在实际应用中,可以根据需求对Hadoop进行优化和扩展。
标签: #hadoop安装与伪分布式集群搭建
评论列表