爬蟲適合使用Mysql還是Mongdb？

更新時(shí)間:2020年12月11日14時(shí)00分來源:傳智教育瀏覽次數(shù):

好口碑IT培訓(xùn)

python爬蟲用什么數(shù)據(jù)庫好？爬蟲適合使用Mysql還是Mongdb？我們從Mysql、Mongdb各自特點(diǎn)和關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫的特點(diǎn)來分析。

MySQL屬于關(guān)系型數(shù)據(jù)庫，它具有以下特點(diǎn)

·在不同的引擎上有不同的存儲方式。

·查詢語句是使用傳統(tǒng)的sql語句，擁有較為成熟的體系，成熟度很高。

·開源數(shù)據(jù)庫的份額在不斷增加，MySQL的份額也在持續(xù)增長。

·處理海量數(shù)據(jù)的效率會顯著變慢。

Mongodb屬于非關(guān)系型數(shù)據(jù)庫，它具有以下特點(diǎn)：

·數(shù)據(jù)結(jié)構(gòu)由鍵值對組成。

·存儲方式：虛擬內(nèi)存+持久化。

·查詢語句是獨(dú)特的Mongodb的查詢方式。

·可以通過副本集、分片來實(shí)現(xiàn)高可用。

·數(shù)據(jù)是存儲在硬盤上的，只不過需要經(jīng)常讀取的數(shù)據(jù)會被加載到內(nèi)存中，將數(shù)據(jù)存儲在物理內(nèi)存中，從而達(dá)到高速讀寫。

·新興數(shù)據(jù)庫，成熟度較低。

關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫特點(diǎn)

關(guān)系型數(shù)據(jù)庫可以理解為依賴一個模型來創(chuàng)建的數(shù)據(jù)庫，比如我們使用的MySQL中的表是由橫列和縱列組成的一個二維表格。關(guān)系型數(shù)據(jù)庫可以通過關(guān)系模型使多個表的數(shù)據(jù)關(guān)聯(lián)起來，比如我們平時(shí)說的一對一、一對多、多對一。由于是建立在數(shù)據(jù)模型的基礎(chǔ)上，所以我們可以通過SQL語句很方便的在多個表之間做復(fù)雜的查詢操作。關(guān)系型數(shù)據(jù)庫相對安全，因?yàn)橹苯哟鎯υ谟脖P中所以突然的宕機(jī)、停電等意外不會導(dǎo)致數(shù)據(jù)丟失。MySQL的存儲方式是由自身的引擎決定的，常用的引擎有Innodb和MyISAM。他們主要的區(qū)別就是MyISAM 不支持事務(wù)，強(qiáng)調(diào)的是性能，執(zhí)行速度比Innodb要快，Innodb提供支持事務(wù)等高級數(shù)據(jù)庫功能。

非關(guān)系型數(shù)據(jù)庫即我們常說的NoSQL數(shù)據(jù)庫，部署起來都比較簡單，沒有關(guān)系型數(shù)據(jù)庫那么復(fù)雜。Mongo的存儲方式為虛擬內(nèi)存+持久化存儲，Mongo將數(shù)據(jù)寫入內(nèi)存中，再由虛擬內(nèi)存管理器將其持久化到硬盤中，因此寫操作會比關(guān)系型數(shù)據(jù)庫快很多。NOSQL的存儲格式是key-value形式，可以像關(guān)系型數(shù)據(jù)庫那樣存儲基礎(chǔ)數(shù)據(jù)類型的數(shù)據(jù)，也可以存儲集合、對象等等。NoSQL雖然性能比較高，但是并不支持事物，也不能進(jìn)行聯(lián)表查詢，一般用于較大規(guī)模數(shù)據(jù)的存儲。

爬蟲適合使用Mysql還是Mongdb？
建議用MongoDB，理由是：因?yàn)槟阌门老x，不光是要把網(wǎng)頁抓下來，重要的是，要把抓取的網(wǎng)頁中的信息提取出來，保存到數(shù)據(jù)庫中。而如果未來的字段會發(fā)生變化(增加、刪除、修改)，那么用MongoDB這種鍵值數(shù)據(jù)庫是再合適不過了，因?yàn)?，你插入到?shù)據(jù)庫中的每條記錄中都同時(shí)包含著數(shù)據(jù)的的“鍵”和“值”，新數(shù)據(jù)使用新的格式保存，而舊數(shù)據(jù)使用舊的格式保存，你不需要做任何的操作就可以保持?jǐn)?shù)據(jù)格式的一致性。反之，如果你用SQL類數(shù)據(jù)庫的話，你就必須修改數(shù)據(jù)庫的格式，還要保證舊數(shù)據(jù)在新格式下的可用性，而這往往是非常麻煩的。

MySQL數(shù)據(jù)庫的高效檢索如何實(shí)現(xiàn)?

常見的數(shù)據(jù)庫有哪幾種?

Pyhton+數(shù)據(jù)分析培訓(xùn)課程

上一篇：Zope2框架有什么特點(diǎn)？ 下一篇：Selenium和PhantomJS如何結(jié)合使用？