更新時間:2022年09月09日10時22分 來源:傳智教育 瀏覽次數(shù):
在這個信息大爆炸的時代,掌握海量數(shù)據(jù)也很難發(fā)揮出令人滿意的使用價值,而數(shù)據(jù)可視化將技術(shù)與藝術(shù)進行完美地融合,借助圖形化的操作手段,將海量的數(shù)據(jù)信息形象地展示出來。數(shù)據(jù)可視化的應(yīng)用可以說十分廣泛,幾乎應(yīng)用于金融、商業(yè)、通信等各個領(lǐng)域。接下來,我們來認識一些基于Python語言的可視化庫,常見的有如下幾種:
Matplotlib是一個Python2D繪圖庫,作圖風格接近Matlab,它已經(jīng)成為Python中公認的數(shù)據(jù)可視化工具,適用于各種平臺上(包括Python腳本、Python和IPython shell、Jupyter Notebook等),能夠以各種硬拷貝格式和交互式環(huán)境生成出版品質(zhì)圖形。
Matplotlib具有以下特點:
(1)使用極其簡單??梢暂p松地畫一些簡單或復(fù)雜的圖形,僅僅用幾行代碼就能生成直方圖、折線圖、散點圖等。
(2)以漸進、交互的方式實現(xiàn)數(shù)據(jù)可視化。
(3)對圖形元素控制能力更強。
(4)可輸出PNG、PDF等多種格式。
Seaborn是基于Matplotlib的可視化庫,專攻于統(tǒng)計可視化,使數(shù)據(jù)可視化更加賞心悅目。此外,Seaborn可以和Pandas進行無縫鏈接,讓初學者更容易上手。
Seaborn具有以下特點:
(1)多個內(nèi)置主題及主題顏色。
(2)單變量和雙變量用于比較數(shù)據(jù)集中各變量的分布情況。
(3)對獨立變量和相關(guān)變量進行回歸擬合和可視化更加便捷。
(4)對矩陣數(shù)據(jù)可視化,通過聚類算法探究矩陣間的結(jié)構(gòu)。
(5)基于網(wǎng)格繪制出更加復(fù)雜的圖像集合。
Boken是交互式可視化的繪圖庫,支持Web瀏覽器展示(圖表可輸出為JSON對象、HTML文檔或可交互的網(wǎng)絡(luò)應(yīng)用),它提供了風格簡潔、漂亮的D3.js的圖形化樣式,并且將此功能擴展到高性能交互的數(shù)據(jù)集上。
Bokeh能與Numpy、Pandas等大部分數(shù)組或表格樣式的數(shù)據(jù)結(jié)構(gòu)進行完美結(jié)合,從而快速便捷地創(chuàng)建交互式繪圖、儀表板等。
Bokeh具有以下特點:
(1)使用簡單的指令可以快速創(chuàng)建復(fù)雜的統(tǒng)計圖。
(2)提供如HTML、Notebook文檔和服務(wù)器的輸出。
(3)可以處理大量的數(shù)據(jù)流。
(4)支持Python、Scala、R、Julia等多種語言。
(5)可以轉(zhuǎn)換使用其他庫(如Matplotlib)編寫的可視化程序。
(6)能夠靈活地將交互式應(yīng)用、布局和不同樣式選擇用于可視化。
除了上述這三個庫以外,Python還提供了很多用于可視化的庫,它們的使用都大同小異,這里就不再一一列舉了。