教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

大數(shù)據有哪些特征?

更新時間:2021年02月01日14時45分 來源:傳智教育 瀏覽次數(shù):

大數(shù)據的特征有哪些?

一般認為,大數(shù)據主要具有以下4個方面的典型特征,即大量(Volume)、多樣(Variety)、高速(Velocity)和價值(Value),即所謂的4V,接下來,通過一張圖來具休描述。

大數(shù)據的特征

1. Volume(大量)

大數(shù)據的特征首先就是數(shù)據規(guī)模大。隨著互聯(lián)網、物聯(lián)網、移動互聯(lián)技術的發(fā)展,人和事物的所有軌跡都可以被記錄下來,數(shù)據呈現(xiàn)出爆發(fā)性增長。數(shù)據相關計量單位的換算關系如下表所示。

單位 換算格式
Byte 1Byte=1024bit
KB 1KB= 1024Byte
MB 1MB= 1024KB
GB 1GB= 1024MB
TB 1TB= 1024GB
PB 1PB= 1024TB
EB 1EB= 1024PB
ZB 1ZB= 1024EB

2. Variety(多樣)

數(shù)據來源的廣泛性,決定了數(shù)據形式的多樣性。大數(shù)據可以分為三類,一是結構化數(shù)據,如財務系統(tǒng)數(shù)據、信息管理系統(tǒng)數(shù)據、醫(yī)療系統(tǒng)數(shù)據等,其特點是數(shù)據間因果關系強;一是非結構化的數(shù)據,如視頻、圖片、音頻等,其特點是數(shù)據間沒有因果關系;三是半結構化數(shù)據,如HTML文檔、郵件、網頁等,其特點是數(shù)據間的因果關系弱。有統(tǒng)計顯示,目前結構化數(shù)據占據整個互聯(lián)網數(shù)據量的75%以上,而產生價值的大數(shù)據,往往是這些非結構化數(shù)據。

3.Velocity(高速)

數(shù)據的增長速度和處理速度是大數(shù)據高速性的重要體現(xiàn)。與以往的報紙、書信等傳統(tǒng)數(shù)據載體生產傳播方式不同,在大數(shù)據時代,大數(shù)據的交換和傳播主要是通過互聯(lián)網和云計算等方式實現(xiàn)的,其生產和傳播數(shù)據的速度是非常迅速的。另外,大數(shù)據還要求處理數(shù)據的響應速度要快,例如,上億條數(shù)據的分析必須在幾秒內完成。數(shù)據的輸人、處理與丟棄必須立刻見效,幾乎無延遲。

4.Value(價值)

大數(shù)據的核心特征是價值,其實價值密度的高低和數(shù)據總量的大小是成反比的,即數(shù)據價值密度越高數(shù)據總量越小,數(shù)據價值密度越低數(shù)據總量越大。任何有價值的信息的提取依托的就是海量的基礎數(shù)據。當然目前大數(shù)據背景下有個未解決的問題,如何通過強大的機器算法更迅速地在海量數(shù)據中完成數(shù)據的價值提純。



猜你喜歡:

大數(shù)據離散流是什么?

大數(shù)據的兩種計算框架優(yōu)劣對比,哪個更適合開發(fā)?

大數(shù)據能干什么?淺談大數(shù)據的應用場景

傳智教育大數(shù)據工程師培訓課程

0 分享到:
和我們在線交談!