Hadoop完全分布式启动部署

1 环境准备

1.1 修改IP

1.2 修改主机名及主机名和IP地址的映射

1.3 关闭防火墙

1.4 ssh免密登录

1.5 安装JDK，配置环境变量

2 集群规划

ASP站长网节点名称 NN JJN DN ZKFC ZK RM NM

linux1 NameNode JournalNode DataNode ZKFC Zookeeper NodeManager

linux2 NameNode JournalNode DataNode ZKFC ZooKeeper ResourceManager NodeManager

linux3 JournalNode DataNode ZooKeeper ResourceManager NodeManager

3 安装Zookeeper集群

安装详解参考： Zookeeper集群搭建 https://www.linuxidc.com/Linux/2020-03/162767.htm

4 配置Hadoop

4.1修改 core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/module/hadoop/data/ha/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>linux1:2181,linux2:2181,linux3:2181</value>

</property>

</configuration>

4.2 修改hdfs-site.xml

<name>dfs.replication</name>

</property>

<name>dfs.nameservices</name>

<value>mycluster</value>

</property>

<name>dfs.ha.namenodes.mycluster</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name>

<value>linux1:8020</value>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>

<value>linux2:8020</value>

</property>

<name>dfs.namenode.http-address.mycluster.nn1</name>

<value>linux1:50070</value>

</property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

<value>linux2:50070</value>

</property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

<value>linux2:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://linux1:8485;linux2:8485;linux3:8485/mycluster</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hadoop/.ssh/id_rsa</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/opt/module/hadoop/data/ha/jn</value>

</property>

<name>dfs.permissions.enable</name>

<value>false</value>

</property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

</configuration>

4.3 修改mapred-site.xml

[hadoop@linux1 hadoop]# mv mapred-site.xml.template mapred-site.xml

[hadoop@linux1 hadoop]# vi mapred-site.xml

　　<name>mapreduce.framework.name</name>

　</property>

<name>mapreduce.jobhistory.address</name>

<value>linux1:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>linux1:19888</value>

</property>

<name>mapreduce.jobhistory.joblist.cache.size</name>

</property>

<name>mapreduce.jobhistory.done-dir</name>

<value>${yarn.app.mapreduce.am.staging-dir}/history/done</value>

</property>

<name>mapreduce.jobhistory.intermediate-done-dir</name>

<value>${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate</value>

</property>

<name>yarn.app.mapreduce.am.staging-dir</name>

<value>/tmp/hadoop-yarn/staging</value>

</property>

</configuration>

4.4 修改 slaves

linux1

linux2

linux3

4.5修改yarn-site.xml

[hadoop@linux2 hadoop]$ vi yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

<value>rmCluster</value>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>linux2</value>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>linux3</value>

</property>

<name>yarn.resourcemanager.zk-address</name>

<value>linux1:2181,linux2:2181,linux3:2181</value>

</property>

<name>yarn.resourcemanager.recovery.enabled</name>

</property>

<name>yarn.resourcemanager.store.class</name>

<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

</property>

</configuration>

4.5 拷贝hadoop到其他节点

[hadoop@linux1 module]$ scp -r hadoop/ hadoop@linux2:/opt/module/

[hadoop@linux1 module]$ scp -r hadoop/ hadoop@linux3:/opt/module/

4.6 配置Hadoop环境变量

[hadoop@linux1 module]$ vim /etc/profile

export HADOOP_HOME=/opt/module/hadoop

export PATH=$Java_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

生效

[hadoop@linux1 module]$ source /etc/profile

热点

Hadoop完全分布式启动部署

由 dawei

您错过了

Git实战精髓：构建高效工作流的顶级秘籍

Git版控速成：高效代码管理必备技巧精解

Git版控实战：掌握高效代码管理的核心技巧

编程实战：以设计模式重构，增强代码架构复用性

友情链接

Hadoop完全分布式启动部署

由 dawei

相关文章

服务器系统基础：原理、架构与实践全攻略

服务器系统：未来趋势下的技术创新与融合探索之旅

服务器系统未来：智能化高效化趋势与技术创新展望

您错过了

Git实战精髓：构建高效工作流的顶级秘籍

Git版控速成：高效代码管理必备技巧精解

Git版控实战：掌握高效代码管理的核心技巧

编程实战：以设计模式重构，增强代码架构复用性