更新時間:2022年03月29日10時37分 來源:傳智教育 瀏覽次數(shù):
數(shù)據(jù)解讀是數(shù)據(jù)分析師的基本功,如果不能充分理解數(shù)據(jù)分析中出現(xiàn)的各類指標及術語,數(shù)據(jù)分析工作將很難展開。對于數(shù)據(jù)分析師來說,了解常用的分析指標和術語是做好數(shù)據(jù)解讀的前提。本節(jié)將對數(shù)據(jù)分析常用指標及術語進行講解。
平均數(shù)是統(tǒng)計學中最常用的統(tǒng)計量,包括算數(shù)平均數(shù)、幾何平均數(shù)、調和平均數(shù)、加權平均數(shù)、指數(shù)平均數(shù)等。通常我們在生活中所說的平均數(shù)就是指算數(shù)平均數(shù)。
算數(shù)平均數(shù)是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個數(shù),它是反映數(shù)據(jù)集中趨勢的一項指標。下面以計算叮叮網(wǎng)的日均UV為例進行說明,如例1-4所示。
例1-4計算叮叮網(wǎng)的日均UV
假設叮叮網(wǎng)本周的UV數(shù)據(jù)如圖1-10所示,那么叮叮網(wǎng)本周的日均UV為:
(10002+9265+10016+10038+12065+9986+9564)/7=10048
在例1-4中,已經給出了叮叮網(wǎng)本周每天的UV數(shù),按照算數(shù)平均數(shù)的算法將7天的UV數(shù)相加再除以7即可算出叮叮網(wǎng)本周的日均UV為10048。
案例中出現(xiàn)的UV(Unique visitor)即網(wǎng)站獨立訪客,是指通過互聯(lián)網(wǎng)訪問、瀏覽這個網(wǎng)頁的自然人,在后面的章節(jié)中還會對UV進行詳細講解。
絕對數(shù)也是數(shù)據(jù)分析中常用指標。統(tǒng)計中常用的總量指標就是絕對數(shù),它是反映客觀現(xiàn)象總體在一定時間、地點條件下的總規(guī)模、總水平的綜合指標。例如一定范圍內糧食總產量、工農業(yè)總產值、企業(yè)單位數(shù)等。
相對數(shù)又稱為相對指標,是通過對兩個有聯(lián)系的指標計算得到的比值,它可以從數(shù)量上反映兩個相互聯(lián)系的現(xiàn)象之間的對比關系。相對數(shù)的基本計算公式為:
在上面的公式中,基礎數(shù)值是被用作對比標準的指標數(shù)值,簡稱基數(shù);比較數(shù)值是用作與基數(shù)對比的指標數(shù)值,簡稱比數(shù)。相對數(shù)一般是以倍數(shù)、百分數(shù)等來表示,反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。
在使用相對數(shù)時需要注意指標之間的可比性,同時要跟總量指標(絕對數(shù))結合使用。
百分比是一種表達比例、比率或分數(shù)數(shù)值的方法。它是相對數(shù)中的一種,也稱為百分率或百分數(shù)。通常不會寫成分數(shù)的形式,而是采用符號“%”來表示,如5%、40%、80%。因為百分比的分母都是100,所以都已1%作為度量單位。
百分點則是指不同時期以百分數(shù)的形式表示的相對指標(比如指數(shù)、速度、構成等)的變動幅度。
在實際使用中一定要注意區(qū)分百分比與百分點,比如本月某商品的轉化率為10%,而上月的轉化率是8%,那么可以說本月該商品的轉化率比上個月提升了兩個百分點,而非百分之二或2%。
比例是一個總體中各個部分的數(shù)量占總體部分的比重,用于反映總體的構成或結構。例如A公司共有500名員工,男員工260名,女員工240名,那么男員工的比例為260:500,女員工比例為240:500。
比率是指樣本或總體中各不同類別數(shù)據(jù)之間的比值,因為比率不是部分與整體之間的對比關系,所以比率可能大于1。就像前面所說的例子,A公司有男員工260人,女員工240人,那么男員工與女員工的比率為260:240。
頻數(shù)也稱“次數(shù)”,指變量值中代表某種特征的數(shù)(標志值)出現(xiàn)的次數(shù),頻數(shù)可以用表或圖形來表示。比如A公司有500名員工,其中有260名男員工,240名女員工,那么男員工的頻數(shù)為260,女員工的頻數(shù)為240。
頻率是指每組中類別次數(shù)與總次數(shù)的比值,它表示某個類別在總體中出現(xiàn)的頻繁程度。頻率一般用百分數(shù)來表示,把所有組的頻率相加等于100%。還是以A公司的員工為例,260名男員工在500名員工中出現(xiàn)的頻率是52%,即(260÷500)×100%;而240名女員工在500名員工中出現(xiàn)的頻率為48%,即(240÷500)×100%。
倍數(shù)是指一個數(shù)除以另一個數(shù)所得的商,比如A÷B=C,就可以說A是B的C倍。倍數(shù)一般用來表示數(shù)量的增長或者上升幅度,不適合用來表示數(shù)量的減少或者下降。
番數(shù)則是指原來數(shù)量的2的n次方,比如說公司今年的利潤比去年翻了一番,意思就是今年的利潤是去年的兩倍(2的1次方),今年的利潤比去年翻兩番,意思就是今年的利潤是去年的4倍(2的2次方)。
同比指的是與歷史同時期數(shù)據(jù)相比較而獲得的比值,主要是反映事物發(fā)展的相對性。例如A公司Q1銷售額同比增長35%,意思就是今年第一季度的銷售額比去年第一季度的銷售額增加了35%,這就是同比。
環(huán)比是指與上一個統(tǒng)計時期的數(shù)據(jù)進行對比獲得的值,主要是用來反映事物逐期發(fā)展的情況。例如A公司Q2銷售額環(huán)比增長20%,表示該公司Q2的銷售額比Q1的銷售額增長了20%。
數(shù)據(jù)分析師的職業(yè)前景怎么樣?需要掌握哪些技能?
MySQL數(shù)據(jù)庫怎樣分區(qū)和分表?【數(shù)據(jù)分析面試題】
如何做數(shù)據(jù)分析,數(shù)據(jù)分析流程是什么?