更新時間:2020年12月17日10時40分 來源:傳智教育 瀏覽次數(shù):
HBase分布式數(shù)據(jù)庫最重要的就是存儲數(shù)據(jù),下面,從四個方面詳細(xì)介紹HBase的物理存儲。
1.HBase表的數(shù)據(jù)按照行鍵RowKey的字典序進(jìn)行排列,并且切分多個HRegion存儲,存儲方式如圖1所示。
? 圖1 Region在行方向上的存儲
2.每個Region存儲的數(shù)據(jù)是有限的,如果當(dāng)Region增大到一個閥值(128)時,會被等分切成兩個新的Region,切分方式如圖2所示。
? 圖2 HRegion的切分
3.一個HRegion Server上可以存儲多個Region,但是每個Region只能被分布到一個HRegion Server上,分布方式如圖3所示。
圖3 HRegion的分布
4.MemStore中存儲的是用戶寫入的數(shù)據(jù),一旦MemStore存儲達(dá)到閾值時,里面存儲的數(shù)據(jù)就會被刷新到新生成的StoreFile中(底層是HFile),該文件是以HFile的格式存儲到HDFS上,具體如圖4所示。
? 圖4 HBase表的存儲
猜你喜歡: