更新時(shí)間:2023年03月22日18時(shí)52分 來源:傳智教育 瀏覽次數(shù):
我們通常所說的數(shù)據(jù)可視化是指狹義的數(shù)據(jù)可視化,即將數(shù)據(jù)以圖表的方式進(jìn)行呈現(xiàn),常見于PPT、報(bào)表、新聞等場(chǎng)景。圖表是數(shù)據(jù)可視化最基礎(chǔ)的應(yīng)用,它代表圖形化的數(shù)據(jù),通常以所用的圖形符號(hào)命名,例如使用圓形符號(hào)的餅圖、使用線條符號(hào)的折線圖等。下面介紹一些常見的圖表,并結(jié)合一些應(yīng)用場(chǎng)景給出圖表示例。
折線圖是將數(shù)據(jù)標(biāo)注成點(diǎn),并通過直線將這些點(diǎn)按某種順序連接而成的圖表,它以折線的方式形象地反映事物沿某個(gè)維度的變化趨勢(shì),能夠清晰地展示數(shù)據(jù)增減的趨勢(shì)、速率、規(guī)律及峰值等特征。折線圖一般將時(shí)間序列作為x軸的數(shù)據(jù),將時(shí)間序列對(duì)應(yīng)的數(shù)值作為y軸的數(shù)據(jù),適用于反映具有固定時(shí)間間隔的數(shù)據(jù)的變化趨勢(shì)的場(chǎng)景,例如股票分析、天氣預(yù)報(bào)等。例如,海口市4月23-29日的最高氣溫和最低氣溫的變化情況如圖1-4所示。
圖1 ??谑?月23-29日的最高氣虛和最低氣溫的變化情況
柱形圖是由一系列寬度相等的縱向矩形條組成的圖表,它利用矩形條的高度表示數(shù)值,以此反映不同分類數(shù)據(jù)之間的差異。械形圖一般將分類作為x軸的數(shù)據(jù),將各分類對(duì)應(yīng)的值作為y軸的數(shù)據(jù),適用于中小規(guī)模數(shù)掘集的各分類之間比較的場(chǎng)景。例如,2015-2018年阿里巴巴公司的營(yíng)業(yè)收入情況如圖2所示。
圖2 2015一2018年阿里巴巴公司的營(yíng)業(yè)收入情況
條形圖是橫置的柱形圖,由一系列高度相等、長(zhǎng)短不一的橫向矩形條組成。與柱形圖相比,條形圖更適用于矩形條數(shù)量較多的場(chǎng)合,但一般建議矩形條的數(shù)量不超過30個(gè)。例如,2019年上半年快手用戶對(duì)各類商品廣告的關(guān)注率如圖3所示。
圖3 2019年上半年快手用戶對(duì)各類商品戶告的關(guān)注率
堆積圖分為堆積面積圖、堆積柱形圖和堆積條形圖。其中堆積面積圖是由若干折線與折線或水平坐標(biāo)軸之間的填充區(qū)域組成的圖表,它的最大區(qū)域是一個(gè)代表所有數(shù)據(jù)總和的整體,堆積的各區(qū)域代表各組數(shù)據(jù),用于反映整體與部分的關(guān)系:堆積柱形圖和堆積條形圖是由若干個(gè)以顏色或線條填充、高度不一的縱向矩形條或橫向矩形條堆疊而成的圖表,用于反映每個(gè)構(gòu)成部分在總體中的比重。例如,2017年全球及各地區(qū)一次性能源的消費(fèi)結(jié)構(gòu)如圖4所示。
圖4 2017年全球及各地區(qū)一次性能源的消費(fèi)結(jié)構(gòu)
直方圖又稱質(zhì)量分布圖,是由一系列高低不等的縱向矩形條或線段組成的圖表,用于反映數(shù)據(jù)的分布和波動(dòng)情況。直方圖通常將連續(xù)型數(shù)據(jù)分割成若干個(gè)不重疊的值范圍分段,以此作為x軸的數(shù)據(jù),將每個(gè)范圍分段中統(tǒng)計(jì)的值頻率作為y軸的數(shù)據(jù),適用于了解產(chǎn)品質(zhì)量的分布規(guī)律、估算施工過程中的不合格率等工程領(lǐng)域,或者識(shí)別人臉特征的人工智能領(lǐng)域。例如,某廠商對(duì)100個(gè)抽樣產(chǎn)品的質(zhì)量級(jí)別評(píng)定情況如圖5所示。
圖5 某廠商對(duì)100個(gè)抽樣產(chǎn)品的質(zhì)量級(jí)別評(píng)定
注意:
柱形圖與直方圖展示的效果非常相似,但兩者又所不同,主要區(qū)別為:
(1)柱形圖用于展示離散型數(shù)據(jù)(記錄不同類別的數(shù)據(jù))的分布,而直方圖用于展示連續(xù)型數(shù)據(jù)(一定區(qū)間內(nèi)連續(xù)數(shù)值所組成的數(shù)提)的分布;
(2)柱形圖的各矩形條之間具有固定的間驚,而直方圖的各矩形條之間沒有任何間隙。
箱形圖又稱盒須圖、箱線圖,是令種利用數(shù)據(jù)中的5個(gè)統(tǒng)計(jì)量(最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)和最大值錨述數(shù)據(jù)的圖表,主要用于反映一組或多組數(shù)據(jù)的對(duì)稱性、分布程度等信息,因形狀如箱子而得名。箱形圖能夠識(shí)別異常值、判斷偏態(tài)與尾重、比較數(shù)據(jù)形狀,適用于品質(zhì)管理的場(chǎng)景。例如,不同廠家所產(chǎn)地毯的耐用性比較如圖6所示。
圖6 不同廠家所產(chǎn)地毯的耐用性
圖6中4個(gè)圖形從左到右依次代表廠家1、廠家2、廠家3和廠家4所產(chǎn)的地毯。由圖6可知,每個(gè)圖形的結(jié)構(gòu)相同,包括一個(gè)矩形箱體、上下兩條豎線、上下兩條橫線,其中箱體代表數(shù)據(jù)的集中范圍,上下兩條豎線分別代表數(shù)據(jù)向上和向下的延伸范圍,上下兩條橫線分別代表最大值和最小值。若數(shù)據(jù)中存在異常值(也稱為離群值),則會(huì)以圓圈的形式顯示到圖中橫線上方或下方。為了便于理解,下面通過圖7來描述箱形的結(jié)構(gòu)及異常值。
圖7 箱形的結(jié)構(gòu)及異常值
餅圖是由若干個(gè)面積大小不一、以條形或顏色填的扇形組成的圓形圖表,它使用圓表示數(shù)據(jù)的總量,組成圓的每個(gè)扇形表示數(shù)據(jù)中各項(xiàng)占總量的比例大小,主要用于顯示數(shù)據(jù)中各項(xiàng)大小與各項(xiàng)總和的比例。餅圖中的圓與扇形分別代表整體與部分,可以形象地展示數(shù)據(jù)整體與各項(xiàng)數(shù)據(jù)的關(guān)系,適用于快速了解整體數(shù)據(jù)中各項(xiàng)數(shù)據(jù)分配情況的場(chǎng)景。例如,2018年全國(guó)居民的人均消費(fèi)支出情況如圖11新示。
圖8 2018年全國(guó)居民的人均消費(fèi)支出情況
值得一提的是,圓環(huán)圖也能顯示各項(xiàng)與整體之間的關(guān)系,它使用圓環(huán)表示整體,組成圓環(huán)的每個(gè)楔形表示各項(xiàng)的占比,外形像空心的圓餅。與餅圖相比,圓環(huán)圖可以展示多組數(shù)據(jù)的比例,但并不容易被人們理解,很多時(shí)候可以用堆積柱形圖或堆積條形圖替代。
散點(diǎn)圖又稱X-Y圖,是由若干個(gè)數(shù)據(jù)點(diǎn)組成的圖表,主要用于判斷兩變量之間是否存在某種關(guān)聯(lián),或者總結(jié)數(shù)據(jù)點(diǎn)的分布模式。散點(diǎn)圖中數(shù)據(jù)點(diǎn)的分布情況可以體現(xiàn)變量之間的相關(guān)性:若所有的數(shù)據(jù)點(diǎn)在一條直線附近呈波動(dòng)趨勢(shì),說明變量之間是線性相關(guān)的;若數(shù)據(jù)點(diǎn)在曲線附近呈波動(dòng)趨勢(shì),說明變量之間是非線性相關(guān)的:若數(shù)據(jù)點(diǎn)沒有顯示任何關(guān)系,說明變量之間是不相關(guān)的,常見于分析兩變量相關(guān)性的場(chǎng)景。例如,股票回報(bào)率與基金回報(bào)率的投資分析情限如圖8所示。
圖9 股票回報(bào)率與基金回報(bào)半的投資分析情況
氣泡圖是散點(diǎn)圖的變形,它是一和能夠展示多變量關(guān)系的圖表。氣泡圖一般使用兩個(gè)變量標(biāo)注氣泡在坐標(biāo)系中的位置,使用3個(gè)變量標(biāo)注氣泡的面積,適用于分類數(shù)據(jù)對(duì)比、多變量相關(guān)性等情況,常見于財(cái)數(shù)據(jù)分析中。例如,第1梯隊(duì)和第2梯隊(duì)主流App用戶量與上線時(shí)間的分布情況如圖10所示。
圖10 第1梯隊(duì)和第2梯隊(duì)主流App用戶量與上線時(shí)間的分布情況
值得一提的是,氣泡圖中過多的氣泡會(huì)增加圖表的閱讀難度,因此氣泡的數(shù)量不宜過多。為了能在有限的氣泡中展示更多的信息,可以給氣泡圖中的氣泡加入交互功能,單擊該氣泡圖1-13第1梯隊(duì)和第2梯隊(duì)主流App用戶量與上線時(shí)間的分布情況
值得一提的是,氣泡圖中過多的氣泡會(huì)增加圖表的閱讀難度,因此氣泡的數(shù)量不宜過多。為了能在有限的氣泡中展示更多的信息,可以給氣泡圖中的氣泡加入交互功能,單擊該氣泡即可查看其隱藏的信息。
誤差棒圖是使用誤差棒注明被測(cè)量數(shù)據(jù)的不確定度大小的圖表,用于表示測(cè)量數(shù)據(jù)中客觀存在的測(cè)量偏差(標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)誤差)。誤差棒圖中誤差棒是以被測(cè)量數(shù)據(jù)的平均值為中點(diǎn),在表示測(cè)量值大小的方向上畫出的一條線段,線段長(zhǎng)度的一半為不確定度。例如,某城市上年降雨量的統(tǒng)計(jì)分析如圖11所示。
圖11 某城市年降雨量的統(tǒng)計(jì)分析
區(qū)圖,由一組坐標(biāo)軸和多個(gè)等距同心圓或多邊形組成,雷達(dá)圖又稱蜘蛛網(wǎng)圖、星狀圖、是一種表現(xiàn)多維(4維以上)數(shù)據(jù)的圖表。雷達(dá)圖中的坐標(biāo)軸起始于同一個(gè)圓心點(diǎn),結(jié)束于最外圍圓周邊緣,每個(gè)坐標(biāo)軸代表一個(gè)指標(biāo),其上面會(huì)將多個(gè)維度的數(shù)據(jù)映射成點(diǎn),連接數(shù)據(jù)點(diǎn)圍成一個(gè)多邊形,適用于對(duì)多指標(biāo)對(duì)象做出全局性、整體性評(píng)價(jià)的場(chǎng)景,常見于企業(yè)經(jīng)菲狀況的評(píng)價(jià)和財(cái)務(wù)分析。例如,某人通過霍蘭德職業(yè)興趣測(cè)試的結(jié)果如圖11所示。
圖12 某人通過霍蘭德職業(yè)興趣測(cè)試的結(jié)果
統(tǒng)計(jì)地圖是一種以地圖為背景,使用各種線紋、色彩、幾何圖形或?qū)嵨镄蜗髽?biāo)注指標(biāo)數(shù)值及其在不同地理位置的分布狀況的圖表。統(tǒng)計(jì)地圖主要用于說明某些現(xiàn)象在地域上的分布,適用于比較人口、資源、產(chǎn)量等在各地區(qū)的分布情況。例如,某平臺(tái)朔州市用戶的地域分布情況如圖12所示。
圖13 2021年2月1日中國(guó)新型冠狀病毒肺炎疫情地圖
3D圖表是一類在三維坐標(biāo)系中呈現(xiàn)數(shù)據(jù)的圖表。常用的3D圖表包括3D散點(diǎn)圖、3D折線圖、3D曲面圖、3D直方圖、3D柱形圖等。與2Q 相比,3D圖表的效果更為酷炫,其在視覺上的表現(xiàn)力更強(qiáng),且可仿真很多場(chǎng)景,適用于金融、氣象、地理、建筑、交通等場(chǎng)景。例如,豆粕期權(quán)隱含波動(dòng)率如圖14所示。
圖14 豆粕期權(quán)隱含波動(dòng)率
北京校區(qū)