教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢/投訴熱線:400-618-4000

Spark有幾種部署方式?

更新時(shí)間:2022年04月22日15時(shí)50分 來源:傳智教育 瀏覽次數(shù):

Spark部署模式分為L(zhǎng)ocal模式(本地單機(jī)模式)和集群模式,在Local模式下,常用于本地開發(fā)程序與測(cè)試,而集群模式又分為Standalone模式(集群?jiǎn)螜C(jī)模式)、Yarn模式和Mesos模式,關(guān)于這三種集群模式的相關(guān)介紹具體如下:

1.Standalone模式

Standalone模式被稱為集群?jiǎn)螜C(jī)模式。Spark框架與Hadoop1.0版本框架類似,本身都自帶了完整的資源調(diào)度管理服務(wù),可以獨(dú)立部署到一個(gè)集群中,無需依賴任何其他的資源管理系統(tǒng),在該模式下,Spark集群架構(gòu)為主從模式,即一臺(tái)Master節(jié)點(diǎn)與多臺(tái)Slave節(jié)點(diǎn),Slave節(jié)點(diǎn)啟動(dòng)的進(jìn)程名稱為Worker,此時(shí)集群會(huì)存在單點(diǎn)故障問題,后續(xù)將在Spark HA集群部署小節(jié)講解利用Zookeeper解決單點(diǎn)問題的方案。

2.Yarn模式

Yarn模式被稱為Spark on Yarn模式,即把Spark作為一個(gè)客戶端,將作業(yè)提交給Yarn服務(wù),由于在生產(chǎn)環(huán)境中,很多時(shí)候都要與Hadoop使用同一個(gè)集群,因此采用Yarn來管理資源調(diào)度,可以有效提高資源利用率,Yarn模式又分為Yarn Cluster模式和Yarn Client模式,具體介紹如下:

lYarn Cluster:用于生產(chǎn)環(huán)境,所有的資源調(diào)度和計(jì)算都在集群上運(yùn)行。

lYarn Client:用于交互、調(diào)試環(huán)境。

3.Mesos模式

Mesos模式被稱為Spark on Mesos模式,Mesos與Yarn同樣是一款資源調(diào)度管理系統(tǒng),可以為Spark提供服務(wù),由于Spark與Mesos存在密切的關(guān)系,因此在設(shè)計(jì)Spark框架時(shí)充分考慮到了對(duì)Mesos的集成,但如果你同時(shí)運(yùn)行Hadoop和Spark,從 兼 容 性 的 角 度 來 看 ,Spark on Yarn是更好的選擇。

上述三種分布式部署方案各有利弊,通常需要根據(jù)實(shí)際情況決定采用哪種方案。由于學(xué)習(xí)階段我們是在虛擬機(jī)環(huán)境下模擬小規(guī)模集群,因此可以考慮選擇Standalone模式。

猜你喜歡:

怎樣使用Spark方法完成RDD的創(chuàng)建?

怎樣使用Spark Shell來讀取HDFS文件?

Spark的應(yīng)用場(chǎng)景有哪些?

Spark的框架模塊和運(yùn)行模式是什么?

傳智教育pthon+大數(shù)據(jù)開發(fā)工程師培訓(xùn)課程

0 分享到:
和我們?cè)诰€交談!