更新時(shí)間:2017年12月21日15時(shí)35分 來(lái)源:傳智播客 瀏覽次數(shù):
Python是一門(mén)優(yōu)秀的語(yǔ)言,它能讓你在短時(shí)間內(nèi)通過(guò)極少量代碼就能完成許多操作。不僅如此,它還輕松支持多任務(wù)處理,比如多進(jìn)程。
不喜歡Python的人經(jīng)常會(huì)吐嘈Python運(yùn)行太慢。但是,事實(shí)并非如此
作為程序猿就是希望如何優(yōu)化代碼,精簡(jiǎn)代碼。今天傳智播客專(zhuān)家就為大家精選6條python代碼優(yōu)化建議。
因?yàn)镚IL的存在,Python很難充分利用多核CPU的優(yōu)勢(shì)。但是,可以通過(guò)內(nèi)置的模塊multiprocessing實(shí)現(xiàn)下面幾種并行模式:
1、 多進(jìn)程并行編程:對(duì)于CPU密集型的程序,可以使用multiprocessing的Process,Pool等封裝好的類(lèi),通過(guò)多進(jìn)程的方式實(shí)現(xiàn)并行計(jì)算。但是因?yàn)檫M(jìn)程中的通信成本比較大,對(duì)于進(jìn)程之間需要大量數(shù)據(jù)交互的程序效率未必有大的提高。
2、 多線(xiàn)程并行編程:對(duì)于IO密集型的程序,multiprocessing.dummy模塊使用multiprocessing的接口封裝threading,使得多線(xiàn)程編程也變得非常輕松(比如可以使用Pool的map接口,簡(jiǎn)潔高效)。 分布式:multiprocessing中的Managers類(lèi)提供了可以在不同進(jìn)程之共享數(shù)據(jù)的方式,可以在此基礎(chǔ)上開(kāi)發(fā)出分布式的程序。 不同的業(yè)務(wù)場(chǎng)景可以選擇其中的一種或幾種的組合實(shí)現(xiàn)程序性能的優(yōu)化。
3、 優(yōu)化算法時(shí)間
算法的時(shí)間復(fù)雜度對(duì)程序的執(zhí)行效率影響最大,在Python中可以通過(guò)選擇合適的數(shù)據(jù)結(jié)構(gòu)來(lái)優(yōu)化時(shí)間復(fù)雜度,如list和set查找某一個(gè)元素的時(shí)間復(fù)雜度分別是O(n)和O(1)。不同的場(chǎng)景有不同的優(yōu)化方式,總得來(lái)說(shuō),一般有分治,分支界限,貪心,動(dòng)態(tài)規(guī)劃等思想。
例如:set的用法
set的union,intersection,difference操作要比list的迭代要快。因此如果涉及到求list交集,并集或者差的問(wèn)題可以轉(zhuǎn)換為set來(lái)操作。
4、 針對(duì)循環(huán)的優(yōu)化
每種編程語(yǔ)言都會(huì)強(qiáng)調(diào)需要優(yōu)化循環(huán)。當(dāng)使用Python的時(shí)候,你可以依靠大量的技巧使得循環(huán)運(yùn)行得更快。然而,開(kāi)發(fā)者經(jīng)常漏掉的一個(gè)方法是:避免在一個(gè)循環(huán)中使用點(diǎn)操作。例如,考慮下面的代碼:
每一次你調(diào)用方法str.upper,Python都會(huì)求該方法的值。然而,如果你用一個(gè)變量代替求得的值,值就變成了已知的,Python就可以更快地執(zhí)行任務(wù)。優(yōu)化循環(huán)的關(guān)鍵,是要減少Python在循環(huán)內(nèi)部執(zhí)行的工作量,因?yàn)镻ython原生的解釋器在那種情況下,真的會(huì)減緩執(zhí)行的速度。
5、 函數(shù)選擇
在循環(huán)的時(shí)候使用xrange而不是range;使用xrange可以節(jié)省大量的系統(tǒng)內(nèi)存,因?yàn)閤range()在序列中每次調(diào)用只產(chǎn)生一個(gè)整數(shù)元素。而range()將直接返回完整的元素列表,用于循環(huán)時(shí)會(huì)有不必要的開(kāi)銷(xiāo)。在python3中xrange不再存在,里面range提供一個(gè)可以遍歷任意長(zhǎng)度的范圍的iterator。
6、 使用性能分析工具
除了上面在ipython使用到的timeit模塊,還有cProfile。cProfile的使用方式也非常簡(jiǎn)單:python –m cProfile filename.py,filename.py是要運(yùn)行程序的文件名,可以在標(biāo)準(zhǔn)輸出中看到每一個(gè)函數(shù)被調(diào)用的次數(shù)和運(yùn)行的時(shí)間,從而找到程序的性能瓶頸,然后可以有針對(duì)性地優(yōu)化。
北京校區(qū)