首頁(yè)大數(shù)據(jù)技術(shù)文章正文

hadoop 2.x分布式安裝

更新時(shí)間:2018年08月06日15時(shí)37分來(lái)源:傳智播客瀏覽次數(shù):

　　這個(gè)安裝過(guò)程經(jīng)歷曲折，遇到了許多坑。

　　環(huán)境：Windows 7 Vm

　　我用了三臺(tái)虛擬機(jī) centos

　　192.168.188.128 hadoop1(作為主服務(wù)器)

　　192.168.188.129 hadoop2

　　192.168.188.130 hadoop3

　　如果你們的安裝環(huán)境好了，接下來(lái)我們就開(kāi)始安裝hadoop之旅吧!

　　1.配置jdk

　　jdk的配置這里不做講解，百度太多了。

　　2.下載hadoop

　　官網(wǎng)下載hadoop，我用的是3.0.3的版本。

　　3.我的hadoop 安裝目錄是 /home/user/hadoop

　　解壓出來(lái)。

　　4.修改hosts

　　vi /etc/hosts

　　輸入

　　192.168.188.128 hadoop1

　　192.168.188.129 hadoop2

　　192.168.188.130 hadoop3

　　保存退出

　　三臺(tái)機(jī)器都需要。

　　配置好了之后可以試試 ping hadoop2 試試 ping hadoop3 。各個(gè)機(jī)器都可以試試是否配置好了。

　　5.配置ssh免密登錄。

　　以上都是準(zhǔn)備工作，準(zhǔn)備工作做好了之后。

　　分別在三臺(tái)機(jī)器上運(yùn)行以下

　　ssh-keygen -t rsa

　　一路回車(chē)(ENTER)到底

　　然后在主服務(wù)器上生成的id_rsa.pub 發(fā)送到從服務(wù)器

　　ssh-copy-id -i ~/.ssh/id_rsa.pub root@IP(換成你對(duì)應(yīng)的IP) -p (端口)

　　兩臺(tái)從服務(wù)器都要.如果遇到了需要輸入密碼，輸入密碼即可。

　　完成后，

　　在主服務(wù)器上試試 ssh hadoop2 ssh hadoop3，如果不需要密碼就能登錄說(shuō)明配置成功.

　　注意：配置ssh我遇到的坑：出現(xiàn)了 WARING:REMOTE HOST IDENFIATE HAS CHANGED

　　這是因?yàn)槲抑芭渲玫臅r(shí)候將公鑰已經(jīng)添加到了ssh.pub里面。在ssh.pub里面找到出錯(cuò)對(duì)應(yīng)的IP，將ip和公鑰一并刪除。然后在運(yùn)行ssh-copy-id -i ~/.ssh/id_rsa.pub root@IP(換成你對(duì)應(yīng)的IP) -p (端口) 就好了。

　　6.配置各種文件

　　進(jìn)入到 hadoop里面的etc文件夾下會(huì)看到一個(gè)hadoop的文件。然后進(jìn)去

　　(1)配置core-site.xml

　　fs.defaultFS

　　hdfs://hadoop1:9000

　　hadoop.tmp.dir

　　/home/usr/hadoop/hadoopwork

　　下面的那個(gè)tmp.dir是臨時(shí)工作目錄，建議最好自己設(shè)定。如果是系統(tǒng)默認(rèn)的，linux會(huì)在每次開(kāi)機(jī)之前清空。

　　所以最好自己設(shè)定一個(gè)。

　　(2)配置hdfs-site.xml

　　dfs.replication

　　dfs.namenode.secondary.http-address