更新時(shí)間:2021年05月18日17時(shí)39分 來源:傳智教育 瀏覽次數(shù):
數(shù)據(jù)倉庫的結(jié)構(gòu)包含了4部分,分別是數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)及管理、OLAP服務(wù)器和前端工具。接下來,通過一張圖來描述,具體下圖所示。
下面根據(jù)圖中的各個(gè)部分進(jìn)行介紹。
1.數(shù)據(jù)源
數(shù)據(jù)源是數(shù)據(jù)倉庫的基礎(chǔ),即系統(tǒng)的數(shù)據(jù)來源,通常包含企業(yè)的各種內(nèi)部信息和外部信息。內(nèi)部信息,例如存在操作數(shù)據(jù)庫中的各種業(yè)務(wù)數(shù)據(jù)和自動(dòng)化系統(tǒng)中包含的各類文檔數(shù)據(jù);外部信息,例如各類法律法規(guī),市場(chǎng)信息、競(jìng)爭對(duì)手的信息以及外部統(tǒng)計(jì)數(shù)據(jù)和其他相關(guān)文檔等。
2.數(shù)據(jù)存儲(chǔ)及管理
數(shù)據(jù)存儲(chǔ)及管理是整個(gè)數(shù)據(jù)倉庫的核心。數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時(shí)也決定了對(duì)外部數(shù)據(jù)的表現(xiàn)形式。針對(duì)系統(tǒng)現(xiàn)有的數(shù)據(jù),進(jìn)行抽取、清理并有效集成,按照主題進(jìn)行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以劃分為企業(yè)級(jí)數(shù)據(jù)倉庫和部門級(jí)數(shù)據(jù)倉庫,也就是所謂的數(shù)據(jù)集市。數(shù)據(jù)集市可以理解為是一個(gè)小型的部門或者工作組級(jí)別的數(shù)據(jù)倉庫。
3.OLAP服務(wù)器
OLAP服務(wù)器對(duì)需要分析的數(shù)據(jù)按照多維數(shù)據(jù)模型進(jìn)行重組,以支持用戶隨時(shí)進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)數(shù)據(jù)規(guī)律和趨勢(shì)。
4.前端工具
前端工具主要包含各種數(shù)據(jù)分析工具、報(bào)表工具、查詢工具數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市開發(fā)的應(yīng)用。
猜你喜歡:
Spark SQL如何實(shí)現(xiàn)Hive數(shù)據(jù)倉庫的操作?
北京校區(qū)