
20個(gè)小招數(shù)教你如果快速完成Python 性能優(yōu)化升級(jí)
使用python時(shí),你是不是需要性能優(yōu)化?今天C君給大家?guī)?lái)python性能優(yōu)化的20條招數(shù),建議收藏~
1.優(yōu)化算法時(shí)間復(fù)雜度
算法的時(shí)間復(fù)雜度對(duì)程序的執(zhí)行效率影響最大,在 Python 中可以通過(guò)選擇合適的數(shù)據(jù)結(jié)構(gòu)來(lái)優(yōu)化時(shí)間復(fù)雜度,如 list 和 set 查找某一個(gè)元素的時(shí)間復(fù)雜度分別是O(n)和O(1)。不同的場(chǎng)景有不同的優(yōu)化方式,總得來(lái)說(shuō),一般有分治,分支界限,貪心,動(dòng)態(tài)規(guī)劃等思想。
2.減少冗余數(shù)據(jù)
如用上三角或下三角的方式去保存一個(gè)大的對(duì)稱(chēng)矩陣。在0元素占大多數(shù)的矩陣?yán)锸褂孟∈杈仃嚤硎尽?br />
3.合理使用 copy 與 deepcopy
對(duì)于 dict 和 list 等數(shù)據(jù)結(jié)構(gòu)的對(duì)象,直接賦值使用的是引用的方式。而有些情況下需要復(fù)制整個(gè)對(duì)象,這時(shí)可以使用 copy 包里的 copy 和 deepcopy,這兩個(gè)函數(shù)的不同之處在于后者是遞歸復(fù)制的。效率也不一樣:(以下程序在 ipython 中運(yùn)行)
1import copy
2a = range(100000)
3%timeit -n 10 copy.copy(a) # 運(yùn)行10次 copy.copy(a)
4%timeit -n 10 copy.deepcopy(a)
510 loops, best of 3: 1.55 ms per loop
610 loops, best of 3: 151 ms per loop
timeit 后面的-n表示運(yùn)行的次數(shù),后兩行對(duì)應(yīng)的是兩個(gè) timeit 的輸出,下同。由此可見(jiàn)后者慢一個(gè)數(shù)量級(jí)。
4.使用 dict 或 set 查找元素
python dict 和 set 都是使用 hash 表來(lái)實(shí)現(xiàn)(類(lèi)似c++11標(biāo)準(zhǔn)庫(kù)中unordered_map),查找元素的時(shí)間復(fù)雜度是O(1)
1a = range(1000)
2s = set(a)
3d = dict((i,1) for i in a)
4%timeit -n 10000 100 in d
5%timeit -n 10000 100 in s10000 loops, best of 3: 43.5 ns per loop10000 loops, best of 3: 49.6 ns per loop
dict 的效率略高(占用的空間也多一些)。
5.合理使用生成器(generator)和 yield
1%timeit -n 100 a = (i for i in range(100000))
2%timeit -n 100 b = [i for i in range(100000)]100 loops, best of 3: 1.54 ms per loop100 loops, best of 3: 4.56 ms per loop
使用()得到的是一個(gè) generator 對(duì)象,所需要的內(nèi)存空間與列表的大小無(wú)關(guān),所以效率會(huì)高一些。在具體應(yīng)用上,比如 set(i for i in range(100000))會(huì)比 set([i for i in range(100000)])快。
但是對(duì)于需要循環(huán)遍歷的情況:
1%timeit -n 10 for x in (i for i in range(100000)): pass
2%timeit -n 10 for x in [i for i in range(100000)]: pass10 loops, best of 3: 6.51 ms per loop10 loops, best of 3: 5.54 ms per loop
后者的效率反而更高,但是如果循環(huán)里有 break,用 generator 的好處是顯而易見(jiàn)的。yield 也是用于創(chuàng)建 generator:
1def yield_func(ls):
2 for i in ls:
3 yield i+1
4def not_yield_func(ls):
5 return [i+1 for i in ls]
6ls = range(1000000)
7%timeit -n 10 for i in yield_func(ls):pass
8%timeit -n 10 for i in not_yield_func(ls):pass
910 loops, best of 3: 63.8 ms per loop
1010 loops, best of 3: 62.9 ms per loop
對(duì)于內(nèi)存不是非常大的 list,可以直接返回一個(gè) list,但是可讀性 yield 更佳(人個(gè)喜好)。
python2.x 內(nèi)置 generator 功能的有 xrange 函數(shù)、itertools 包等。
6.優(yōu)化循環(huán)
循環(huán)之外能做的事不要放在循環(huán)內(nèi),比如下面的優(yōu)化可以快一倍:
1a = range(10000)
2size_a = len(a)
3%timeit -n 1000 for i in a: k = len(a)
4%timeit -n 1000 for i in a: k = size_a
51000 loops, best of 3: 569 μs per loop
61000 loops, best of 3: 256 μs per loop
7.優(yōu)化包含多個(gè)判斷表達(dá)式的順序
對(duì)于 and,應(yīng)該把滿(mǎn)足條件少的放在前面,對(duì)于 or,把滿(mǎn)足條件多的放在前面。如:
1a = range(2000)
2%timeit -n 100 [i for i in a if 10 < i < 20 or 1000 < i < 2000]
3%timeit -n 100 [i for i in a if 1000 < i < 2000 or 100 < i < 20]
4%timeit -n 100 [i for i in a if i % 2 == 0 and i > 1900]
5%timeit -n 100 [i for i in a if i > 1900 and i % 2 == 0]
6100 loops, best of 3: 287 μs per loop
7100 loops, best of 3: 214 μs per loop
8100 loops, best of 3: 128 μs per loop
9100 loops, best of 3: 56.1 μs per loop
8.使用 join 合并迭代器中的字符串
1In [1]: %%timeit
2 ...: s = ''
3 ...: for i in a:
4 ...: s += i
5 ...:10000 loops, best of 3: 59.8 μs per loopIn [2]: %%timeit
6s = ''.join(a)
7 ...:100000 loops, best of 3: 11.8 μs per loop
join 對(duì)于累加的方式,有大約5倍的提升。
9.選擇合適的格式化字符方式
1s1, s2 = 'ax', 'bx'
2%timeit -n 100000 'abc%s%s' % (s1, s2)
3%timeit -n 100000 'abc{0}{1}'.format(s1, s2)
4%timeit -n 100000 'abc' + s1 + s2
5100000 loops, best of 3: 183 ns per loop
6100000 loops, best of 3: 169 ns per loop
7100000 loops, best of 3: 103 ns per loop
三種情況中,%的方式是最慢的,但是三者的差距并不大(都非常快)。
10.不借助中間變量交換兩個(gè)變量的值
1In [3]: %%timeit -n 10000
2 a,b=1,2
3 ....: c=a;a=b;b=c;
4 ....:10000 loops, best of 3: 172 ns per loop
5In [4]: %%timeit -n 10000
6a,b=1,2
7a,b=b,a
8 ....:
910000 loops, best of 3: 86 ns per loop
使用a,b=b,a而不是c=a;a=b;b=c;來(lái)交換a,b的值,可以快1倍以上。
11.使用 if is
1a = range(10000)
2%timeit -n 100 [i for i in a if i == True]
3%timeit -n 100 [i for i in a if i is True]
4100 loops, best of 3: 531 μs per loop
5100 loops, best of 3: 362 μs per loop
使用 if is True 比 if == True 將近快一倍。
12使用級(jí)聯(lián)比較x < y < z
1x, y, z = 1,2,3
2%timeit -n 1000000 if x < y < z:pass
3%timeit -n 1000000 if x < y and y < z:pass
41000000 loops, best of 3: 101 ns per loop
51000000 loops, best of 3: 121 ns per loop
x < y < z效率略高,而且可讀性更好。
13.while 1 比 while True 更快
1def while_1():
2 n = 100000
3 while 1:
4 n -= 1
5 if n <= 0: break
6def while_true():
7 n = 100000
8 while True:
9 n -= 1
10 if n <= 0: break
11m, n = 1000000, 1000000
12%timeit -n 100 while_1()
13%timeit -n 100 while_true()
14100 loops, best of 3: 3.69 ms per loop
15100 loops, best of 3: 5.61 ms per loop
while 1 比 while true 快很多,原因是在 python2.x 中,True 是一個(gè)全局變量,而非關(guān)鍵字。
14.使用**而不是 pow
1%timeit -n 10000 c = pow(2,20)
2%timeit -n 10000 c = 2**2010000 loops, best of 3: 284 ns per loop10000 loops, best of 3: 16.9 ns per loop
**就是快10倍以上!
15.使用 cProfile, cStringIO 和 cPickle 等用c實(shí)現(xiàn)相同功能(分別對(duì)應(yīng)profile, StringIO, pickle)的包
1import cPickle
2import pickle
3a = range(10000)
4%timeit -n 100 x = cPickle.dumps(a)
5%timeit -n 100 x = pickle.dumps(a)
6100 loops, best of 3: 1.58 ms per loop
7100 loops, best of 3: 17 ms per loop
由c實(shí)現(xiàn)的包,速度快10倍以上!
16.使用最佳的反序列化方式
下面比較了 eval, cPickle, json 方式三種對(duì)相應(yīng)字符串反序列化的效率:
1import json
2import cPickle
3a = range(10000)
4s1 = str(a)
5s2 = cPickle.dumps(a)
6s3 = json.dumps(a)
7%timeit -n 100 x = eval(s1)
8%timeit -n 100 x = cPickle.loads(s2)
9%timeit -n 100 x = json.loads(s3)
10100 loops, best of 3: 16.8 ms per loop
11100 loops, best of 3: 2.02 ms per loop
12100 loops, best of 3: 798 μs per loop
可見(jiàn) json 比 cPickle 快近3倍,比 eval 快20多倍。
17.使用C擴(kuò)展(Extension)
目前主要有 CPython(python最常見(jiàn)的實(shí)現(xiàn)的方式)原生API, ctypes,Cython,cffi三種方式,它們的作用是使得 Python 程序可以調(diào)用由C編譯成的動(dòng)態(tài)鏈接庫(kù),其特點(diǎn)分別是:
CPython 原生 API: 通過(guò)引入 Python.h 頭文件,對(duì)應(yīng)的C程序中可以直接使用Python 的數(shù)據(jù)結(jié)構(gòu)。實(shí)現(xiàn)過(guò)程相對(duì)繁瑣,但是有比較大的適用范圍。
ctypes: 通常用于封裝(wrap)C程序,讓純 Python 程序調(diào)用動(dòng)態(tài)鏈接庫(kù)(Windows 中的 dll 或 Unix 中的 so 文件)中的函數(shù)。如果想要在 python 中使用已經(jīng)有C類(lèi)庫(kù),使用 ctypes 是很好的選擇,有一些基準(zhǔn)測(cè)試下,python2+ctypes 是性能最好的方式。
Cython: Cython 是 CPython 的超集,用于簡(jiǎn)化編寫(xiě)C擴(kuò)展的過(guò)程。Cython 的優(yōu)點(diǎn)是語(yǔ)法簡(jiǎn)潔,可以很好地兼容 numpy 等包含大量C擴(kuò)展的庫(kù)。Cython 的使得場(chǎng)景一般是針對(duì)項(xiàng)目中某個(gè)算法或過(guò)程的優(yōu)化。在某些測(cè)試中,可以有幾百倍的性能提升。
cffi: cffi 的就是 ctypes 在 pypy(詳見(jiàn)下文)中的實(shí)現(xiàn),同進(jìn)也兼容 CPython。cffi提供了在 python 使用C類(lèi)庫(kù)的方式,可以直接在 python 代碼中編寫(xiě)C代碼,同時(shí)支持鏈接到已有的C類(lèi)庫(kù)。
使用這些優(yōu)化方式一般是針對(duì)已有項(xiàng)目性能瓶頸模塊的優(yōu)化,可以在少量改動(dòng)原有項(xiàng)目的情況下大幅度地提高整個(gè)程序的運(yùn)行效率。
18.并行編程
因?yàn)?GIL 的存在,Python 很難充分利用多核 CPU 的優(yōu)勢(shì)。但是,可以通過(guò)內(nèi)置的模塊 multiprocessing 實(shí)現(xiàn)下面幾種并行模式:
多進(jìn)程:對(duì)于 CPU 密集型的程序,可以使用 multiprocessing 的 Process,Pool 等封裝好的類(lèi),通過(guò)多進(jìn)程的方式實(shí)現(xiàn)并行計(jì)算。但是因?yàn)檫M(jìn)程中的通信成本比較大,對(duì)于進(jìn)程之間需要大量數(shù)據(jù)交互的程序效率未必有大的提高。
多線程:對(duì)于 IO 密集型的程序,multiprocessing.dummy 模塊使用 multiprocessing 的接口封裝 threading,使得多線程編程也變得非常輕松(比如可以使用 Pool 的 map 接口,簡(jiǎn)潔高效)。
分布式:multiprocessing 中的 Managers 類(lèi)提供了可以在不同進(jìn)程之共享數(shù)據(jù)的方式,可以在此基礎(chǔ)上開(kāi)發(fā)出分布式的程序。
不同的業(yè)務(wù)場(chǎng)景可以選擇其中的一種或幾種的組合實(shí)現(xiàn)程序性能的優(yōu)化。
19.終級(jí)大殺器:PyPy
PyPy 是用 RPython(CPython 的子集)實(shí)現(xiàn)的 Python,根據(jù)官網(wǎng)的基準(zhǔn)測(cè)試數(shù)據(jù),它比 CPython 實(shí)現(xiàn)的 Python 要快6倍以上??斓脑蚴鞘褂昧?Just-in-Time(JIT)編譯器,即動(dòng)態(tài)編譯器,與靜態(tài)編譯器(如gcc,javac等)不同,它是利用程序運(yùn)行的過(guò)程的數(shù)據(jù)進(jìn)行優(yōu)化。由于歷史原因,目前 pypy 中還保留著 GIL,不過(guò)正在進(jìn)行的 STM 項(xiàng)目試圖將 PyPy 變成沒(méi)有 GIL 的 Python。
如果 python 程序中含有C擴(kuò)展(非cffi的方式),JIT 的優(yōu)化效果會(huì)大打折扣,甚至比 CPython 慢(比 Numpy)。所以在 PyPy 中最好用純 Python 或使用 cffi 擴(kuò)展。
隨著 STM,Numpy 等項(xiàng)目的完善,相信 PyPy 將會(huì)替代 CPython。
20.使用性能分析工具
除了上面在 ipython 使用到的 timeit 模塊,還有 cProfile。cProfile 的使用方式也非常簡(jiǎn)單: python -m cProfile filename.py,filename.py 是要運(yùn)行程序的文件名,可以在標(biāo)準(zhǔn)輸出中看到每一個(gè)函數(shù)被調(diào)用的次數(shù)和運(yùn)行的時(shí)間,從而找到程序的性能瓶頸,然后可以有針對(duì)性地優(yōu)化。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03