教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢/投訴熱線:400-618-4000

大型PHP網(wǎng)站性能和并發(fā)訪問(wèn)優(yōu)化方案(完整篇)

更新時(shí)間:2017年11月20日14時(shí)26分 來(lái)源:傳智播客 瀏覽次數(shù):

網(wǎng)站性能優(yōu)化對(duì)于大型網(wǎng)站來(lái)說(shuō)非常重要,一個(gè)網(wǎng)站的訪問(wèn)打開(kāi)速度影響著用戶體驗(yàn)度,網(wǎng)站訪問(wèn)速度慢會(huì)造成高跳出率,小網(wǎng)站很好解決,那對(duì)于大型網(wǎng)站由于欄目多,圖片和圖像都比較龐大,那該怎么進(jìn)行整體性能優(yōu)化呢?


一、大型網(wǎng)站性能提高策略


1、HTML靜態(tài)化


其實(shí)大家都知道,效率最高、消耗最小的就是純靜態(tài)化的html頁(yè)面,所以我們盡可能使我們的網(wǎng)站上的頁(yè)面采用靜態(tài)頁(yè)面來(lái)實(shí)現(xiàn),這個(gè)最簡(jiǎn)單的方法其實(shí)也是最有效的方法。


2、圖片服務(wù)器分離


大家知道,對(duì)于Web服務(wù)器來(lái)說(shuō),不管是Apache、IIS還是其他容器,圖片是最消耗資源的,于是我們有必要將圖片與頁(yè)面進(jìn)行分離,這是基本上大型網(wǎng)站都會(huì)采用的策略,他們都有獨(dú)立的、甚至很多臺(tái)的圖片服務(wù)器。這樣的架構(gòu)可以降低提供頁(yè)面訪問(wèn)請(qǐng)求的服務(wù)器系統(tǒng)壓力,并且可以保證系統(tǒng)不會(huì)因?yàn)閳D片問(wèn)題而崩潰。在應(yīng)用服務(wù)器和圖片服務(wù)器上,可以進(jìn)行不同的配置優(yōu)化,比如apache在配置ContentType的時(shí)候可以盡量少支持、盡可能少的LoadModule,保證更高的系統(tǒng)消耗和執(zhí)行效率。


3、數(shù)據(jù)庫(kù)集群、庫(kù)表散列


大型網(wǎng)站都有復(fù)雜的應(yīng)用,這些應(yīng)用必須使用數(shù)據(jù)庫(kù),那么在面對(duì)大量訪問(wèn)的時(shí)候,數(shù)據(jù)庫(kù)的瓶頸很快就能顯現(xiàn)出來(lái),這時(shí)一臺(tái)數(shù)據(jù)庫(kù)將很快無(wú)法滿足應(yīng)用,于是我們需要使用數(shù)據(jù)庫(kù)集群或者庫(kù)表散列。


在數(shù)據(jù)庫(kù)集群方面,很多數(shù)據(jù)庫(kù)都有自己的解決方案,常用的MySQL提供的Master/Slave也是類(lèi)似的方案。


集群通常會(huì)使用CDN與GSBL與DNS負(fù)載均衡技術(shù),每個(gè)地區(qū)一組前臺(tái)服務(wù)器群,例如:網(wǎng)易,百度使用了DNS負(fù)載均衡技術(shù),每個(gè)頻道一組前臺(tái)服務(wù)器,一搜使用了DNS負(fù)載技術(shù),所有頻道共用一組前臺(tái)服務(wù)器集群。


庫(kù)表散列是常用并且最有效的解決方案。


我們?cè)趹?yīng)用程序中安裝業(yè)務(wù)和應(yīng)用或者功能模塊將數(shù)據(jù)庫(kù)進(jìn)行分離,不同的模塊對(duì)應(yīng)不同的數(shù)據(jù)庫(kù)或者表,再按照一定的策略對(duì)某個(gè)頁(yè)面或者功能進(jìn)行更小的數(shù)據(jù)庫(kù)散列,比如用戶表,按照用戶ID進(jìn)行表散列,這樣就能夠低成本的提升系統(tǒng)的性能并且有很好的擴(kuò)展性。


sohu的論壇就是采用了這樣的架構(gòu),將論壇的用戶、設(shè)置、帖子等信息進(jìn)行數(shù)據(jù)庫(kù)分離,然后對(duì)帖子、用戶按照板塊和ID進(jìn)行散列數(shù)據(jù)庫(kù)和表,最終可以在配置文件中進(jìn)行簡(jiǎn)單的配置便能讓系統(tǒng)隨時(shí)增加一臺(tái)低成本的數(shù)據(jù)庫(kù)進(jìn)來(lái)補(bǔ)充系統(tǒng)性能。


4、緩存


緩存一詞搞技術(shù)的都接觸過(guò),很多地方用到緩存。網(wǎng)站架構(gòu)和網(wǎng)站開(kāi)發(fā)中的緩存也是非常重要。這里先講述最基本的兩種緩存。高級(jí)和分布式的緩存在后面講述。架構(gòu)方面的緩存,對(duì)Apache比較熟悉的人都能知道Apache提供了自己的緩存模塊,也可以使用外加的Squid模塊進(jìn)行緩存,這兩種方式均可以有效的提高Apache的訪問(wèn)響應(yīng)能力。


網(wǎng)站程序開(kāi)發(fā)方面的緩存,Linux上提供的Memory Cache是常用的緩存接口,可以在web開(kāi)發(fā)中使用,比如用Java開(kāi)發(fā)的時(shí)候就可以調(diào)用MemoryCache對(duì)一些數(shù)據(jù)進(jìn)行緩存和通訊共享,一些大型社區(qū)使用了這樣的架構(gòu)。另外,在使用web語(yǔ)言開(kāi)發(fā)的時(shí)候,各種語(yǔ)言基本都有自己的緩存模塊和方法,PHP有Pear的Cache模塊,Java就更多了,.net不是很熟悉,相信也肯定有。


5、鏡像


鏡像是大型網(wǎng)站常采用的提高性能和數(shù)據(jù)安全性的方式,鏡像的技術(shù)可以解決不同網(wǎng)絡(luò)接入商和地域帶來(lái)的用戶訪問(wèn)速度差異,比如ChinaNet和EduNet之間的差異就促使了很多網(wǎng)站在教育網(wǎng)內(nèi)搭建鏡像站點(diǎn),數(shù)據(jù)進(jìn)行定時(shí)更新或者實(shí)時(shí)更新。


6、負(fù)載均衡


負(fù)載均衡將是大型網(wǎng)站解決高負(fù)荷訪問(wèn)和大量并發(fā)請(qǐng)求采用的高端解決辦法。負(fù)載均衡技術(shù)發(fā)展了多年,有很多專(zhuān)業(yè)的服務(wù)提供商和產(chǎn)品可以選擇。


二、PHP代碼編寫(xiě)優(yōu)化:


1. echo比print要快很多。


兩個(gè)方法都會(huì)在頁(yè)面上打印東西,不過(guò)echo不返回任何值,print會(huì)在成功或失敗的時(shí)候返回0或1。


2. include_once比include更加耗時(shí)。


因?yàn)樗枰z查你要包含的class是否已經(jīng)被包含進(jìn)來(lái)。


3. 對(duì)于長(zhǎng)段落的字符串一定要使用單引號(hào),而不是雙引號(hào)。


因?yàn)殡p引號(hào)會(huì)去搜索字符串中的變量。比如:echo ‘This is long string’.$name就比echo “This is long string $name”要快很多。


4. 不要再循環(huán)中嵌套使用for循環(huán)


5. 如果能將函數(shù)定義為靜態(tài)的,那么就不要定義成為成員函數(shù),靜態(tài)函數(shù)比成員函數(shù)快33%。


6. 如果你可以不通過(guò)正則表達(dá)式就能解決問(wèn)題,那么就別用正則。


正則表達(dá)式比PHP原生的函數(shù)要慢一些。例如使用str_replace取代preg_replae。


7. 盡量不要使用相對(duì)路徑來(lái)包含文件


在相對(duì)路徑中查找文件,會(huì)現(xiàn)在當(dāng)前目錄中查找,然后依次再查找。這樣查找文件就很 慢。最好是先定義WEB_ROOT這樣的常量,然后使用這個(gè)常量來(lái)包含文件。


8. 全等符號(hào)===比相等==要快


而且if(1 == ’1′)會(huì)返回true,if(0 == ”)也會(huì)返回true,而當(dāng)你使用全等符號(hào)的時(shí)候if(1 ===’1′)和if(0===”)都會(huì)返回false。所以當(dāng)你在程序中需要檢測(cè)一些布爾變量 的時(shí)候最好使用全等符號(hào)。


三、針對(duì)thinkphp 有以下幾種方式


1. 關(guān)閉調(diào)試模式


由于關(guān)閉調(diào)試模式之后,系統(tǒng)會(huì)自動(dòng)生成項(xiàng)目編譯緩存以及關(guān)閉日志寫(xiě) 入,這樣可以減少很多的IO加載和日志寫(xiě)入的開(kāi)銷(xiāo)。


2. 開(kāi)啟頁(yè)面壓縮輸出


3.1版本開(kāi)始,增加了OUTPUT_ENCODE配置參數(shù),用于控制頁(yè)面壓縮輸出。


3. 開(kāi)啟緩存


在網(wǎng)站部署環(huán)境安裝APC或者Xcache緩存能夠有效提升網(wǎng)站運(yùn)行性能和內(nèi)存占用,XCache 是一個(gè)開(kāi)源的 opcode 緩存器/優(yōu)化器, 這意味著他能夠提高您服務(wù)器上 的 PHP 性能. 他通過(guò)把編譯 PHP后的數(shù)據(jù)緩沖到共享內(nèi)存從而避免重復(fù)的編譯 過(guò)程, 能夠直接使用緩沖區(qū)已編譯的代碼從而提高速度. 通常能夠提高您的頁(yè)面生 成速率 2 到5 倍, 降低服務(wù)器負(fù)載.Alternative PHP Cache (APC)是一種對(duì)PHP有效的開(kāi)放源高速緩沖儲(chǔ)存器工具,它能夠緩存opcode的php中間碼。


4. 字段緩存


默認(rèn)情況下,字段緩存是自動(dòng)生成的,在開(kāi)發(fā)完成之后,基本上數(shù)據(jù)庫(kù)的變動(dòng)變得 比較少,因此可以考慮合并字段緩存到對(duì)應(yīng)的模型類(lèi),這樣能夠減少每次讀取字段 緩存的IO開(kāi)銷(xiāo)。合并的方法是在Runtime/Data/_fields下面找到對(duì)應(yīng)的字段緩存文件


四、 數(shù)據(jù)庫(kù)優(yōu)化


1、選擇正確的存儲(chǔ)引擎


以 MySQL為例,包括有兩個(gè)存儲(chǔ)引擎 MyISAM 和 InnoDB,每個(gè)引擎都有利有弊。MyISAM 適合于一些需要大量查詢的應(yīng)用。InnoDB 的趨勢(shì)會(huì)是一個(gè)非常復(fù)雜的存儲(chǔ)引擎,對(duì)于一些小的應(yīng)用,它會(huì)比 MyISAM 還慢。但是它支持“行鎖” ,支持事務(wù)。


2、優(yōu)化字段的數(shù)據(jù)類(lèi)型


記住一個(gè)原則,越小的列會(huì)越快。對(duì)于大多數(shù)的數(shù)據(jù)庫(kù)引擎來(lái)說(shuō),硬盤(pán)操作可能是最重大的瓶頸。所以,把你的數(shù)據(jù)變得緊湊會(huì)對(duì)這種情況非常有幫助,因?yàn)檫@減少了對(duì)硬盤(pán)的訪問(wèn)。如果一個(gè)表只會(huì)有幾列罷了(比如說(shuō)字典表,配置表),那么,我們就沒(méi)有理由使用 INT 來(lái)做主鍵,使用MEDIUMINT, SMALLINT 或是更小的 TINYINT 會(huì)更經(jīng)濟(jì)一些。如果你不需要記錄時(shí)間,使用 DATE 要比DATETIME 好得多。當(dāng)然,你也需要留夠足夠的擴(kuò)展空間。


3、為搜索字段添加索引


索引并不一定就是給主鍵或是唯一的字段。如果在你的表中,有某個(gè)字段你總要會(huì)經(jīng)常用來(lái)做搜索,那么最好是為其建立索引,除非你要搜索的字段是大的文本字段,那應(yīng)該建立全文索引。


4、避免使用Select *從數(shù)據(jù)庫(kù)里讀出越多的數(shù)據(jù),那么查詢就會(huì)變得越慢。


并且,如果你的數(shù)據(jù)庫(kù)服務(wù)器和WEB服務(wù)器是兩臺(tái)獨(dú)立的服務(wù)器的話,這還會(huì)增加網(wǎng)絡(luò)傳輸?shù)呢?fù)載。即使你要查詢數(shù)據(jù)表的所有字段,也盡量不要用*通配符,善用內(nèi)置提供的字段排除定義也許能給帶來(lái)更多的便利。


5、使用 ENUM 而不是 VARCHAR


ENUM 類(lèi)型是非常快和緊湊的。在實(shí)際上,其保存的是 TINYINT,但其外表上顯示為字符串。這樣一來(lái),用這個(gè)字段來(lái)做一些選項(xiàng)列表變得相當(dāng)?shù)耐昝?。例如,性別、民族、部門(mén)和狀態(tài)之類(lèi)的這些字段的取值是有限而且固定的,那么,你應(yīng)該使用 ENUM 而不是 VARCHAR。


6、盡可能的使用 NOT NULL


除非你有一個(gè)很特別的原因去使用 NULL 值,你應(yīng)該總是讓你的字段保持 NOT NULL。 NULL其實(shí)需要額外的空間,并且,在你進(jìn)行比較的時(shí)候,你的程序會(huì)更復(fù)雜。 當(dāng)然,這里并不是說(shuō)你就不能使用NULL了,現(xiàn)實(shí)情況是很復(fù)雜的,依然會(huì)有些情況下,你需要使用NULL值。


7、固定長(zhǎng)度的表會(huì)更快


如果表中的所有字段都是“固定長(zhǎng)度”的,整個(gè)表會(huì)被認(rèn)為是 “static” 或 “fixed-length”。 例如,表中沒(méi)有如下類(lèi)型的字段: VARCHAR,TEXT,BLOB。只要你包括了其中一個(gè)這些字段,那么這個(gè)表就不是“固定長(zhǎng)度靜態(tài)表”了,這樣,MySQL 引擎會(huì)用另一種方法來(lái)處理。


固定長(zhǎng)度的表會(huì)提高性能,因?yàn)镸ySQL搜尋得會(huì)更快一些,因?yàn)檫@些固定的長(zhǎng)度是很容易計(jì)算下一個(gè)數(shù)據(jù)的偏移量的,所以讀取的自然也會(huì)很快。而如果字段不是定長(zhǎng)的,那么,每一次要找下一條的話,需要程序找到主鍵。


并且,固定長(zhǎng)度的表也更容易被緩存和重建。不過(guò),唯一的副作用是,固定長(zhǎng)度的字段會(huì)浪費(fèi)一些空間,因?yàn)槎ㄩL(zhǎng)的字段無(wú)論你用不用,他都是要分配那么多的空間。


8、使用“垂直分割”技術(shù)


你可以分割你的表成為兩個(gè)一個(gè)是定長(zhǎng)的,一個(gè)則是不定長(zhǎng)的。垂直分割 “垂直分割”是一種把數(shù)據(jù)庫(kù)中的表按列變成幾張表的方法,這樣可以降低表的復(fù)雜度和字段的數(shù)目,從而達(dá)到優(yōu)化的目的。例如:在User表中有一個(gè)字段是家庭地址,這個(gè)字段是可選字段,相比起,而且你在數(shù)據(jù)庫(kù)操作的時(shí)候除了個(gè)人信息外,你并不需要經(jīng)常讀取或是改寫(xiě)這個(gè)字段。那么,為什么不把他放到另外一張表中呢? 這樣會(huì)讓你的表有更好的性能,大家想想是不是,大量的時(shí)候,我對(duì)于用戶表來(lái)說(shuō),只有用戶ID,用戶名,口令,用戶角色等會(huì)被經(jīng)常使用。小一點(diǎn)的表總是會(huì)有好的性能。另外,你需要注意的是,這些被分出去的字段所形成的表,你不會(huì)經(jīng)常性地去Join他們,不然的話,這樣的性能會(huì)比不分割時(shí)還要差,而且,會(huì)是極數(shù)級(jí)的下降。


9、EXPLAIN 你的 SELECT 查詢


使用 EXPLAIN 關(guān)鍵字可以讓你知道MySQL是如何處理你的SQL語(yǔ)句的。這可以幫你分析你的查詢語(yǔ)句或是表結(jié)構(gòu)的性能瓶頸。EXPLAIN 的查詢結(jié)果還會(huì)告訴你你的索引主鍵被如何利用的,你的數(shù)據(jù)表是如何被搜索和排序的……等等,等等。通常我們可以對(duì)比較復(fù)雜的尤其是涉及到多表的SELECT語(yǔ)句,把關(guān)鍵字EXPLAIN加到前面。你可以使用phpmyadmin來(lái)做這個(gè)事。


五、前端優(yōu)化


優(yōu)化完后端和數(shù)據(jù)庫(kù)之后,我們緊接著要做的就是針對(duì)輸出的頁(yè)面優(yōu)化你的前端頁(yè)面和資源文件,主要包括對(duì)圖片、JS和樣式文件的優(yōu)化。建議采用下列網(wǎng)頁(yè)性能測(cè)試工具進(jìn)行檢測(cè)和分析,會(huì)給出相關(guān)的優(yōu)化建議:


PageSpeed 谷歌開(kāi)發(fā)的工具


開(kāi)發(fā)人員可以使用PageSpeed來(lái)評(píng)估他們網(wǎng)頁(yè)的性能,并獲得有關(guān)如何改進(jìn)性能的建議。


yslow YSlow


可以對(duì)網(wǎng)站的頁(yè)面進(jìn)行分析,并告訴你為了提高網(wǎng)站性能,如何基于某些規(guī)則而進(jìn)行優(yōu)化。


本文版權(quán)歸傳智播客PHP學(xué)院所有,歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明作者出處。謝謝!

作者:傳智播客PHP培訓(xùn)學(xué)院

首發(fā):http://www.xamj520.com/php/

0 分享到:
和我們?cè)诰€交談!