掌握了Hadoop集群中的高可用架構(gòu)后,接下來(lái),我們來(lái)手把手教大家搭建一個(gè)Hadoop高可用集群,具體步驟如下: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-26 |傳智教育 |高可用集群,高可用架構(gòu),Hadoop
數(shù)據(jù)發(fā)布與訂閱模型,即所謂的全局配置中心,顧名思義就是發(fā)布者將需要全局統(tǒng)一管理的數(shù)據(jù)發(fā)布到Zookeeper節(jié)點(diǎn)上,供訂閱者動(dòng)態(tài)獲取數(shù)據(jù),實(shí)現(xiàn)配置信息的集中式管理和動(dòng)態(tài)更新。例如全局的配置信息,服務(wù)式服務(wù)框架的服務(wù)地址列表等就非常適合使用。接下來(lái),我們介紹一些數(shù)據(jù)發(fā)布與訂閱的主要應(yīng)用場(chǎng)景。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-26 |傳智教育 |數(shù)據(jù)發(fā)布與訂閱的應(yīng)用場(chǎng)景,zookeeper,
大多數(shù)情況下,我們完成的數(shù)據(jù)體系卻是依賴復(fù)雜、層級(jí)混亂的,因此,我們需要一套行之有效的數(shù)據(jù)組織和管理方法來(lái)讓我們的數(shù)據(jù)體系更有序,這就是談到的數(shù)據(jù)分層。數(shù)據(jù)分層并不能解決所有的數(shù)據(jù)問(wèn)題,但是,數(shù)據(jù)分層卻可以給我們帶來(lái)如下的好處: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-23 |傳智教育 |Hive數(shù)據(jù)倉(cāng)庫(kù),Hive安裝
線程由線程ID、當(dāng)前指令指針(PC)、寄存器集合和堆棧組成,它不能獨(dú)立擁有系統(tǒng)資源,但它可與同屬一個(gè)進(jìn)程的其它線程共享該進(jìn)程所擁有的全部資源。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-20 |傳智教育 |什么是線程,線程的分類
map階段處理的數(shù)據(jù)如何傳遞給reduce階段,是MapReduce框架中關(guān)鍵的一個(gè)流程,這個(gè)流程就叫shuffle。本章節(jié)內(nèi)容來(lái)看一下shuffle的工作流程和工作機(jī)制。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-20 |傳智教育 |Shuffle的工作機(jī)制
combiner其實(shí)屬于優(yōu)化方案,由于帶寬限制,應(yīng)該盡量map和reduce之間的數(shù)據(jù)傳輸數(shù)量。它在Map 端把同一個(gè)key的鍵值對(duì)合并在一起并計(jì)算,計(jì)算規(guī)則與reduce一致,所以combiner也可以看作特殊的Reducer。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-20 |傳智教育 |Combiner的作用,partition的作用
在Unix/Linux操作系統(tǒng)中,通過(guò)Python的os模塊中封裝的fork()函數(shù)可以輕松地創(chuàng)建一個(gè)進(jìn)程。fork()函數(shù)的聲明如下: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-20 |傳智教育 |python創(chuàng)建進(jìn)程
?在Scala中,不能用類名直接訪問(wèn)類中的方法和字段,而是創(chuàng)建類的實(shí)例對(duì)象去訪問(wèn)類中的方法和字段。Scala中提供了object這個(gè)關(guān)鍵字用來(lái)實(shí)現(xiàn)單例模式,若單例對(duì)象名與類名相同,則把這個(gè)單例對(duì)象稱作伴生對(duì)象,下面具通過(guò)體用代碼演示單例對(duì)象和伴生對(duì)象的創(chuàng)建方法。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2021-07-16 |傳智教育 |創(chuàng)建單例和半生對(duì)象
北京校區(qū)