手把手教你搭建Hadoop高可用集群

更新時(shí)間:2021年07月26日15時(shí)09分來源:傳智教育瀏覽次數(shù):

掌握了Hadoop集群中的高可用架構(gòu)后，接下來，我們來手把手教大家搭建一個(gè)Hadoop高可用集群，具體步驟如下：

1.部署集群節(jié)點(diǎn)

我們規(guī)劃整個(gè)集群由3臺(tái)虛擬機(jī)組成，這3臺(tái)虛擬機(jī)在高可用集群中的部署規(guī)劃情況如表1所示。

表1 集群節(jié)點(diǎn)分布

服務(wù)器	Name Node	Data Node	Resource Manager	Node Manager	Journal Nodes	Zookeeper	ZKFC
node-01	√	√	√	√	√	√	√
node-02	√	√		√	√	√	√
node-03		√		√	√	√

表1所示的三個(gè)服務(wù)器組成了一個(gè)Zookeeper集群。其中，node-01和node-02作為集群的NameNode，需要運(yùn)行ZKFC來監(jiān)控NameNode的健康狀態(tài)。
2.環(huán)境準(zhǔn)備
首先，搭建普通Hadoop集群。需要注意的是，原有虛擬機(jī)系統(tǒng)主機(jī)名為hadoop01，建議初學(xué)者在搭建Hadoop HA集群時(shí)重新安裝虛擬機(jī)，以此來鞏固前面所學(xué)知識(shí)，并將三臺(tái)虛擬主機(jī)名設(shè)置為node-01、node-02和node-03。

3.配置Hadoop高可用集群

（1）修改core-site.xml文件，在該文件中配置HDFS端口，指定Hadoop臨時(shí)目錄和Zookeeper集群地址，具體參數(shù)如下：

<configuration>

  <!-- 指定hdfs的nameservice為ns1 -->

  <property>

    <name>fs.defaultFS</name>

    <value>hdfs://ns1</value>

  </property>

  <!-- 指定hadoop臨時(shí)目錄 -->

  <property>

    <name>hadoop.tmp.dir</name>

    <value>/export/servers/hadoop-2.7.4/tmp</value>

  </property>

  <!-- 指定zookeeper地址 -->

  <property>

    <name>ha.zookeeper.quorum</name>

    <value>node-01:2181,node-02:2181,node-03:2181</value>

  </property></configuration>

（2）修改hdfs-site.xml文件，配置兩臺(tái)NameNode端口地址和通信方式，并指定NameNode的元數(shù)據(jù)上的存放位置，開啟NameNode失敗自動(dòng)切換以及配置sshfence（通過ssh遠(yuǎn)程登錄到前一個(gè)Active NameNode并將其結(jié)束進(jìn)程），具體參數(shù)如下：

<configuration>

  <!-- 設(shè)置副本個(gè)數(shù) -->

  <property>

    <name>dfs.replication</name>

    <value>2</value>

  </property>

  <!-- 設(shè)置namenode.name目錄 -->

  <property>  

    <name>dfs.namenode.name.dir</name>

    <value>file:/export/data/hadoop/name</value>  

  </property> 

  <!-- 設(shè)置namenode.data目錄 -->

  <property>  

    <name>dfs.datanode.data.dir</name>  

    <value>file:/export/data/hadoop/data</value>  

  </property> 

  <!-- 開啟webHDFS -->

  <property>

    <name>dfs.webhdfs.enabled</name> 

    <value>true</value> 

  <!-- 在NN和DN上開啟WebHDFS (REST API)功能,不是必須 --> 

  </property>

  <!--指定hdfs的nameservice為ns1，需要和core-site.xml中的保持一致 -->

  <property>

    <name>dfs.nameservices</name>

    <value>ns1</value>

  </property>

  <!-- ns1下面有兩個(gè)NameNode，分別是nn1，nn2 -->

  <property>

    <name>dfs.ha.namenodes.ns1</name>

    <value>nn1,nn2</value>

  </property>

  <!-- nn1的RPC通信地址 -->

  <property>

    <name>dfs.namenode.rpc-address.ns1.nn1</name>

    <value>node-01:9000</value>

  </property>

  <!-- nn1的http通信地址 -->

  <property>

    <name>dfs.namenode.http-address.ns1.nn1</name>

    <value>node-01:50070</value>

  </property>

  <!-- nn2的RPC通信地址 -->

  <property>

    <name>dfs.namenode.rpc-address.ns1.nn2</name>

    <value>node-02:9000</value>

  </property>

  <!-- nn2的http通信地址 -->

  <property>

    <name>dfs.namenode.http-address.ns1.nn2</name>

    <value>node-02:50070</value>

  </property>

  <!-- 指定NameNode的元數(shù)據(jù)在JournalNode上的存放位置 -->

  <property>

    <name>dfs.namenode.shared.edits.dir</name>

    <value>qjournal://node-01:8485;node-02:8485;node-03:8485/ns1    </value>

  </property>

  <!-- 指定JournalNode在本地磁盤存放數(shù)據(jù)的位置 -->

  <property>

    <name>dfs.journalnode.edits.dir</name>

    <value>/export/data/hadoop/journaldata</value>

  </property>

  <!-- 開啟NameNode失敗自動(dòng)切換 -->

  <property>

    <name>dfs.ha.automatic-failover.enabled</name>

    <value>true</value>

  </property>

  <!-- 配置失敗自動(dòng)切換實(shí)現(xiàn)方式 -->

  <property>

    <name>dfs.client.failover.proxy.provider.ns1</name>

    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider    </value>

  </property>

  <!-- 配置隔離機(jī)制方法，多個(gè)機(jī)制用換行分割，即每個(gè)機(jī)制暫用一行-->

  <property>

    <name>dfs.ha.fencing.methods</name>

    <value>

      sshfence

      shell(/bin/true)    </value>

  </property>

  <!-- 使用sshfence隔離機(jī)制時(shí)需要ssh免登陸 -->

  <property>

    <name>dfs.ha.fencing.ssh.private-key-files</name>

    <value>/root/.ssh/id_rsa</value>

  </property>

  <!-- 配置sshfence隔離機(jī)制超時(shí)時(shí)間 -->

  <property>

    <name>dfs.ha.fencing.ssh.connect-timeout</name>

    <value>30000</value>

  </property></configuration>

（3）修改mapred-site.xml文件，配置MapReduce計(jì)算框架為yarn方式，具體參數(shù)如下：

<configuration>

  <!-- 指定mapreduce框架為yarn方式 -->

  <property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

  </property>

</configuration>

（4）修改yarn-site.xml文件，開啟ResourceManager高可用，指定ResourceManager的端口名稱地址，并配置Zookeeper集群地址，具體參數(shù)如下：

<configuration>

  <property>

    <name>yarn.nodemanager.resource.memory-mb</name>

    <value>2048</value>

  </property>

  <property>

    <name>yarn.scheduler.maximum-allocation-mb</name>

    <value>2048</value>

  </property>

  <property>

    <name>yarn.nodemanager.resource.cpu-vcores</name>

    <value>1</value>

  </property>

  <!-- 開啟RM高可用 -->

  <property>

    <name>yarn.resourcemanager.ha.enabled</name>

    <value>true</value>

  </property>

  <!-- 指定RM的cluster id -->

  <property>

    <name>yarn.resourcemanager.cluster-id</name>

    <value>yrc</value>

  </property>

  <!-- 指定RM的名字 -->

  <property>

    <name>yarn.resourcemanager.ha.rm-ids</name>

    <value>rm1,rm2</value>

  </property>

  <!-- 分別指定RM的地址 -->

  <property>

    <name>yarn.resourcemanager.hostname.rm1</name>

    <value>node-01</value>

  </property>

  <property>

    <name>yarn.resourcemanager.hostname.rm2</name>

    <value>node-02</value>

  </property>

  <!-- 指定zk集群地址 -->

  <property>

    <name>yarn.resourcemanager.zk-address</name>

    <value>node-01:2181,node-02:2181,node-03:2181</value>

  </property>

  <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

  </property>

</configuration>

（5）修改slaves，配置集群主機(jī)名稱，具體代碼如下：

node-01
node-02
node-03

（6）修改hadoop-env.sh，配置JDK環(huán)境變量，具體代碼如下：

export JAVA_HOME=/export/servers/jdk1.8.0_161

將配置好的文件分發(fā)傳送給node-02，node-03機(jī)器中，讀者可以根據(jù)需求自定義配置/etc/profile的環(huán)境變量，分發(fā)后需要重新加載該文件。

4.啟動(dòng)Hadoop高可用集群

（1）啟動(dòng)集群各個(gè)節(jié)點(diǎn)的Zookeeper服務(wù)，命令如下：

$ cd /export/servers/zookeeper-3.4.10/bin

$ ./zkServer.sh start

（2）啟動(dòng)集群各個(gè)節(jié)點(diǎn)監(jiān)控NameNode的管理日志的JournalNode，命令如下：

$ hadoop-daemon.sh start journalnode

（3）在node-01節(jié)點(diǎn)格式化NameNode，并將格式化后的目錄拷貝到node-02中，具體命令如下：

$ hadoop namenode –format
$ scp -r /export/data/hadoop node-02:/export/data/

（4）在node-01節(jié)點(diǎn)上格式化ZKFC，命令如下：

$ hdfs zkfc -formatZK

（5）在node-01節(jié)點(diǎn)上啟動(dòng)HDFS，命令如下：

$ start-dfs.sh

（6）在node-01節(jié)點(diǎn)上啟動(dòng)YARN，命令如下：

$ start-yarn.sh

猜你喜歡：

大數(shù)據(jù)培訓(xùn):hadoop中常見問題以及解決方案

Hadoop集群有幾種部署模式？各種模式有什么特點(diǎn)？

HDFS的高可用架構(gòu)是怎樣工作的?

傳智教育python+大數(shù)據(jù)開發(fā)高手班

上一篇：Zookeeper數(shù)據(jù)發(fā)布與訂閱主要應(yīng)用場(chǎng)景有哪些？ 下一篇： Sqoop有哪些指令？Sqoop指令介紹

全國校區(qū)

熱門課程

手把手教你搭建Hadoop高可用集群

最新資訊

相關(guān)閱讀

熱門課程推薦