更新時(shí)間:2020年12月29日18時(shí)21分 來(lái)源:傳智教育 瀏覽次數(shù):
Hadoop是Apache基金會(huì)面向全球開(kāi)源的產(chǎn)品之一,任何用戶(hù)都可以從Apache Hadoop 官網(wǎng):https://archive.apache.org/dist/hadoop/common下載使用。本書(shū)將以編寫(xiě)時(shí)較為穩(wěn)定的Hadoop2.7.4版本為例,詳細(xì)講解Hadoop的安裝。
先將下載的hadoop-2.7.4.tar.gz安裝包上傳到主節(jié)點(diǎn)hadoop01的/export/software/目錄下,然后將文件解壓到/export/servers/目錄,具體指令如下。
$ tar -zxvf hadoop-2.7.4.tar.gz -C /export/servers/
執(zhí)行完上述指令后,同樣通過(guò)“vi /etc/profile”指令打開(kāi)profile文件,在文件底部進(jìn)一步添加如下內(nèi)容類(lèi)配置Hadoop環(huán)境變量。
# 配置Hadoop系統(tǒng)環(huán)境變量 export HADOOP_HOME=/export/servers/hadoop-2.7.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
在/etc/profile文件中配置完上述Hadoop環(huán)境變量后(注意HADOOP_HOME路徑),保存退出即可。然后,還需要執(zhí)行“source /etc/profile”指令使可使配置文件生效。
安裝完Hadoop并配置好環(huán)境變量后,可以在當(dāng)前主機(jī)任意目錄下查看安裝的Hadoop版本號(hào),具體指令如下。
$ hadoop version
執(zhí)行完上述指令后,效果如圖1所示。
圖1 Hadoop版本號(hào)
從圖1可以看出,當(dāng)前Haddoop版本就是指定的2.7.4,說(shuō)明Hadoop安裝成功。
接下來(lái),可以在Hadoop解壓目錄下通過(guò)ll指令查看Hadoop目錄結(jié)構(gòu),如圖2所示。
圖2 Hadoop安裝目錄結(jié)構(gòu)
從圖2可以看出,Hadoop安裝目錄包括有bin、etc、include、lib、libexec、sbin、share和src共8個(gè)目錄以及其他一些文件,下面簡(jiǎn)單介紹下各目錄內(nèi)容及作用。
bin:存放操作Hadoop相關(guān)服務(wù)(HDFS、Yarn)的腳本,但是通常使用sbin目錄下的腳本。
etc:存放Hadoop配置文件,主要包含core-site.xml、hdfs-site.xml、mapred-site.xml等從Hadoop1.0繼承而來(lái)的配置文件和yarn-site.xml等Hadoop2.0新增的配置文件。
include:對(duì)外提供的編程庫(kù)頭文件(具體動(dòng)態(tài)庫(kù)和靜態(tài)庫(kù)在lib目錄中),這些頭文件均是用C++定義的,通常用于C++程序訪(fǎng)問(wèn)HDFS或者編寫(xiě)MapReduce程序。
lib:該目錄包含了Hadoop對(duì)外提供的編程動(dòng)態(tài)庫(kù)和靜態(tài)庫(kù),與include目錄中的頭文件結(jié)合使用。
libexec:各個(gè)服務(wù)對(duì)用的shell配置文件所在的目錄,可用于配置日志輸出、啟動(dòng)參數(shù)(比如JVM參數(shù))等基本信息。
sbin:該目錄存放Hadoop管理腳本,主要包含HDFS和YARN中各類(lèi)服務(wù)的啟動(dòng)/關(guān)閉腳本。
share:Hadoop各個(gè)模塊編譯后的jar包所在的目錄。
src:Hadoop的源碼包。
Hadoop從何而來(lái),Hadoop發(fā)展歷程簡(jiǎn)介
如何遠(yuǎn)程登錄Hadoop虛擬機(jī)和開(kāi)啟SSH服務(wù)
如何遠(yuǎn)程登錄Hadoop虛擬機(jī)和開(kāi)啟SSH服務(wù)?
2020-12-22如何使用HBase分布式數(shù)據(jù)庫(kù)?常見(jiàn)的Java API類(lèi)型有幾種?
2020-12-22RDD是如何操作數(shù)據(jù)轉(zhuǎn)換的?RDD轉(zhuǎn)換算子API示例
2020-12-21Scala語(yǔ)言是什么?有什么特點(diǎn)?如何安裝?
2020-12-21怎樣使用Spark Shell來(lái)讀取HDFS文件?
2020-12-21Scala的控制結(jié)構(gòu)語(yǔ)句有幾種?各語(yǔ)句的語(yǔ)法格式是什么?
2020-12-17北京校區(qū)