數據解讀是數據分析師的基本功,如果不能充分理解數據分析中出現的各類指標及術語,數據分析工作將很難展開。對于數據分析師來說,了解常用的分析指標和術語是做好數據解讀的前提。本節(jié)將對數據分析常用指標及術語進行講解。 查看全文>>
Python+大數據技術文章2022-03-29 |傳智教育 |數據分析師,數據分析常用的術語和指標
Spark是基于內存計算的大數據并行計算框架,比MapReduce計算框架具有更高的實時性,同時具有高效容錯性和可伸縮性,在學習Spark操作之前,首先介紹Spark運行架構和基本運行流程... 查看全文>>
Python+大數據技術文章2022-03-29 |傳智教育 |Spark集群的運行架構和基本原理
使用Hadoop進行大數據運算,當數據量極其大時,那么對MapReduce性能的調優(yōu)重要性不言而喻,尤其是Shuffle過程中的參數配置對作業(yè)的總執(zhí)行時間影響特別大。下面總結一些和MapReduce相關的性能調優(yōu)方法,主要從五個方面考慮:數據輸入、Map階段、Reduce階段、Shuffle階段和其他調優(yōu)屬性。 查看全文>>
Python+大數據技術文章2022-03-28 |傳智教育 |MapReduce性能調優(yōu)方法
matplotlib內置了眾多預定義的顏色映射表,使用這些顏色映射表可以為用戶提供更多的顏色建議,為用戶節(jié)省大量的開發(fā)時間。pyplot模塊中提供了colormaps()函數用于查看所有可用的顏色映射表,示例代碼及運行結果如下。 查看全文>>
Python+大數據技術文章2022-03-28 |傳智教育 |matplotlib,顏色映射表
執(zhí)行查詢操作時,集合中的文檔存在適當的索引,MongoDB就可以使用該索引限制必須檢查的文檔數量。MongoDB的索引可以分為六種,即單字段索引、復合索引、多鍵索引、地理空間索引、全文本索引以及哈希索引,六種索引的詳細介紹,具體如下: 查看全文>>
Python+大數據技術文章2022-03-25 |傳智教育 |索引,MongoDB中有幾種索引
高爾基說:“書籍是人類進步的階梯?!睋y(tǒng)計韓國人年均閱讀量為7本,日本人年均閱讀量為40本。相比較而言,中國人的閱讀量還有進步空間。已知地區(qū)1和地區(qū)2對各類圖書的采購情況如表4-3所示。 查看全文>>
Python+大數據技術文章2022-03-25 |傳智教育 |Python培訓,圖書采購堆積圖
matplotlib通過靈活地修改配置項來改變圖表的樣式,而不必拘泥于系統(tǒng)默認的配置。圖表的樣式可以通過兩種方式進行修改:局部修改和全局修改。下面介紹一下局部修改的方式。局部修改的方式是指通過代碼動態(tài)地修改matplotlib配置項,此方式用于滿足程序局部定制的需求。 查看全文>>
Python+大數據技術文章2022-03-24 |傳智教育 |matplotlib,圖表樣式修改
美好的一天從早餐開始,果醬面包是常見的早餐且深受大家喜愛,無論是大人還是小孩都很愛吃。已知某果醬面包需要準備的配料如表3-4所示。根據表3-4的數據,將“配料名稱”一列的數據作為圖例項,將“重量”一列的數據與總重量的比例作為數據 查看全文>>
Python+大數據技術文章2022-03-24 |傳智教育 |Python培訓,繪制果醬面包配料比例