教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

什么是Neo4j?如何通過Neo4j構(gòu)建《人民的名義》的關(guān)系圖譜?

更新時間:2020年04月03日10時49分 來源:傳智播客 瀏覽次數(shù):

一、數(shù)據(jù)庫的分類

1. 關(guān)系型數(shù)據(jù)庫

關(guān)系型數(shù)據(jù)庫,是指采用了關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫,其以行和列的形式存儲數(shù)據(jù),以便于用戶理解,關(guān)系型數(shù)據(jù)庫這一系列的行和列被稱為表,一組表組成了數(shù)據(jù)庫。用戶通過查詢來檢索數(shù)據(jù)庫中的數(shù)據(jù),而查詢是一個用于限定數(shù)據(jù)庫中某些區(qū)域的執(zhí)行代碼。關(guān)系模型可以簡單理解為二維表格模型,而一個關(guān)系型數(shù)據(jù)庫就是由二維表及其之間的關(guān)系組成的一個數(shù)據(jù)組織。主流的關(guān)系型數(shù)據(jù)庫有Oracle、DB2、MySQL、SQL Server等。推薦了解java中級程序員學(xué)習線路圖

2. 非關(guān)系型數(shù)據(jù)庫

非關(guān)系型數(shù)據(jù)庫,也稱為NoSQL,泛指非關(guān)系型的數(shù)據(jù)庫。隨著互聯(lián)網(wǎng)web2.0網(wǎng)站的興起,傳統(tǒng)的關(guān)系數(shù)據(jù)庫在處理web2.0網(wǎng)站,特別是超大規(guī)模和高并發(fā)的SNS類型的web2.0純動態(tài)網(wǎng)站已經(jīng)顯得力不從心,出現(xiàn)了很多難以克服的問題,而非關(guān)系型的數(shù)據(jù)庫則由于其本身的特點得到了非常迅速的發(fā)展。NoSQL數(shù)據(jù)庫的產(chǎn)生就是為了解決大規(guī)模數(shù)據(jù)集合多重數(shù)據(jù)種類帶來的挑戰(zhàn),尤其是大數(shù)據(jù)應(yīng)用難題。常見的非關(guān)系型數(shù)據(jù)庫按照分類有:

鍵值(Key-Value): Redis、Memcached、Oracle BDB

列存儲數(shù)據(jù)庫:Cassandra、HBase、 Riak

文檔型數(shù)據(jù)庫:MongoDB、SequoiaDB

圖形數(shù)據(jù)庫:Neo4J、JanusGraph、TigerGraph

二、 Neo4j

2.1 什么是Neo4j

Neo4j是一個高性能的NOSQL圖形數(shù)據(jù)庫,它將結(jié)構(gòu)化數(shù)據(jù)存儲在網(wǎng)絡(luò)上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全的事務(wù)特性的Java持久化引擎,但是它將結(jié)構(gòu)化數(shù)據(jù)存儲在網(wǎng)絡(luò)(從數(shù)學(xué)角度叫做圖)上而不是表中。Neo4j也可以被看作是一個高性能的圖引擎,該引擎具有成熟數(shù)據(jù)庫的所有特性。簡單來說Neo4j是一個開源的基于Java開發(fā),運行于JVM之上。

2.2 Neo4j的數(shù)據(jù)結(jié)構(gòu)

在一個圖中包含兩種基本的數(shù)據(jù)類型:Nodes**(節(jié)點)** 和 Relationships**(關(guān)系)。Nodes** 和 Relationships 包含key/value形式的屬性。Nodes通過Relationships所定義的關(guān)系相連起來,形成關(guān)系型網(wǎng)絡(luò)結(jié)構(gòu)。

Neo4j01


2.3 社區(qū)版和企業(yè)版區(qū)別

1)社區(qū)版限制

節(jié)點:320 億

關(guān)系:320 億

屬性:640 億

2)企業(yè)版與社區(qū)版都有的功能

·Property Graph Model(屬性圖模型)

·Native Graph Processing & Storage(本地圖形處理和存儲)

·ACID(事務(wù)管理)

·Cypher – Graph Query Language(支持Cypher圖查詢語句)

·REST API(Restful風格的api)

·High-Performance Native API(本機高性能api)

·HTTPS

3)企業(yè)版獨有的功能

·集群(水平伸縮/高可用)

社區(qū)版不支持集群等高可用配置,只有單機。

·基于用戶和角色的訪問控制

社區(qū)版在安全管理方面相比企業(yè)版而言,功能較弱,僅提供用戶和密碼管理,沒有涉及角色、權(quán)限控制等企業(yè)必需的安全管理功能。

·熱備份

社區(qū)版不支持熱備份(neo4j-backup),只有企業(yè)版才有這個工具。

·日志功能

社區(qū)版本沒有安全日志功能,Neo4j提供安全日志和查詢?nèi)罩緝煞N,用于記錄數(shù)據(jù)庫的查詢和發(fā)生的安全事件,但僅在企業(yè)版才支持。

·查詢管理

可以設(shè)置事務(wù)超時時間,以及列出運行的查詢,可以選擇性終止一個或多個查詢。

·診斷及調(diào)優(yōu)工具

JMX日志和監(jiān)控,包含Graphite JMX客戶端

·垂直伸縮(超過4核)

支持超過4個以上的CPU核心,對于超過4核的CPU提供高度優(yōu)化的并行圖算法執(zhí)行過程。

·鎖管理

對于超過4核的CPU系統(tǒng)提供更加高效的寫入鎖機制以增加并發(fā)處理能力

·Cypher查詢追蹤

對正在運行的查詢進行狀態(tài)跟蹤和管理(例如強制結(jié)束查詢的運行)

·企業(yè)級監(jiān)控

更全面的監(jiān)控插件以及日志輸出,社區(qū)版本僅有http日志,企業(yè)版包含了GC、Security日志。

·世界級支持

有錢啥都好說......

4)企業(yè)版報價

套餐(服務(wù)器 x 內(nèi)核) 價格(萬美元/年)

3 x 8 = 19.9(萬美元/年)

3 x 4 = 9.9(萬美元/年)

2 x 4 = 6.8(萬美元/年)

1 x 4 = 3.6(萬美元/年)

這里需要注意neo4j的企業(yè)報價不僅和機器數(shù)量有關(guān)還與CPU核數(shù)掛鉤。

2.4 Neo4j 使用

1)環(huán)境

Java:jdk1.8

Neo4j: neo4j3.5.7

2)安裝

資料包:https://pan.baidu.com/s/1cA49NnqzQp0Z9QQdCX9GGw

·jdk安裝

·neo4j安裝

下載地址:https://neo4j.com/download-center/#releases

·簡單使用

通過瀏覽器訪問圖庫,默認賬密: neo4j/neo4j,會提示你修改密碼

Neo4j02

Neo4j03


正確的打開姿勢

Neo4j04

查詢圖庫并限制返回個數(shù)

MATCH (n) RETURN n LIMIT 25

Neo4j05

如果這時候張寶寶想要找亮平辦點兒事情應(yīng)該怎么托關(guān)系呢?我們通過關(guān)系圖譜可以看到有n個方法可以實現(xiàn),那么為了追求效率肯定是“求最少的人辦最多的事兒”,這個時候就要用到我們的最短路徑算法了,放心圖庫中已經(jīng)自帶了。

Neo4j06

match p=shortestpath((u1:User{name:'張寶寶'})-[*]-(u2:User{name:'侯亮平'})) return p

Neo4j08


2.5 Neo4j應(yīng)用場景

·金融行業(yè)應(yīng)用

反欺詐已經(jīng)是金融行業(yè)一個核心應(yīng)用,通過圖數(shù)據(jù)庫可以對不同的個體、團體做關(guān)聯(lián)分析,從人物在指定時間內(nèi)的行為,例如去過地方的IP地址、曾經(jīng)使用過的MAC地址(包括手機端、PC端、WIFI等)、社交網(wǎng)絡(luò)的關(guān)聯(lián)度分析,同一時間點是否曾經(jīng)在同一地理位置附近出現(xiàn)過,銀行賬號之間是否有歷史交易信息等。

Neo4j07

·社交網(wǎng)絡(luò)圖譜

在社交網(wǎng)絡(luò)中,公司、員工、技能的信息,這些都是節(jié)點,它們之間的關(guān)系和朋友之間的關(guān)系都是邊,在這里面圖數(shù)據(jù)庫可以做一些非常復(fù)雜的公司之間關(guān)系的查詢。比如說公司到員工、員工到其他公司,從中找類似的公司、相似的公司,都可以在這個系統(tǒng)內(nèi)完成。

·企業(yè)關(guān)系圖譜

圖數(shù)據(jù)庫可以對各種企業(yè)進行信息圖譜的建立,包括最基本的工商信息,包括何時注冊、誰注冊、注冊資本、在何處辦公、經(jīng)營范圍、高管架構(gòu)。圍繞企業(yè)的經(jīng)營范圍,繼續(xù)細化去查詢企業(yè)究竟有哪些產(chǎn)品或服務(wù),例如通過企業(yè)名稱查詢到企業(yè)的自媒體,從而給予其更多關(guān)注和了解。另外也包括對企業(yè)的產(chǎn)品和服務(wù)的數(shù)據(jù)關(guān)聯(lián),查看該企業(yè)有沒有令人信服的自主知識產(chǎn)權(quán)和相關(guān)資質(zhì)來支撐業(yè)務(wù)的開展。

企業(yè)在日常經(jīng)營中,與客戶、合作伙伴、渠道方、投資者都會打交道,這也決定了企業(yè)對社會各個領(lǐng)域都廣有涉獵,呈現(xiàn)面錯綜復(fù)雜,因此可以通過企業(yè)數(shù)據(jù)圖譜來查詢,層層挖掘信息?;趫D數(shù)據(jù)的企業(yè)信息查詢可以真正了解企業(yè)的方方面面,而不再是傳統(tǒng)單一的工商信息查詢。

2.6 思考

以上只是neo4j圖數(shù)據(jù)庫的基本安裝、簡單使用以及應(yīng)用場景,那么我們該如果用好圖數(shù)據(jù)庫,如何去定義自己的圖模型、編寫圖庫語句以及圖庫如何用我們的java代碼來操作了?請關(guān)注下期出品。


猜你喜歡:

傳智播客Java實戰(zhàn)項目紀實:java實戰(zhàn)項目過程再現(xiàn)

0 分享到:
和我們在線交談!