
1. 使用Python3
溫馨提示:官方宣布自2020年1月一日起將不再支持Python2。這份指南里的大多數(shù)例子也只在Python3中適用。如果您還在使用Python2.7,趕快更新吧。如果您使用的是蘋果電腦,可以使用Homebrew輕松升級(jí)。
2. 檢查Python的最低要求版本
您可以直接使用代碼來(lái)查看Python版本,確保將來(lái)不會(huì)出現(xiàn)腳本和Python版本不兼容的情況發(fā)生。請(qǐng)看示例:
ifnot sys.version_info > (2, 7): # berate your user for running a 10 year # python versionelifnot sys.version_info >= (3, 5): # Kindly tell your user (s)he needs to upgrade # because you're using 3.5 features
viewrawcheck_python_version.py hosted with ? by GitHub
3. 使用IPython
實(shí)際上,IPython是一個(gè)增強(qiáng)的shell。自動(dòng)完成功能已足以令人驚嘆,但它還有更多功能。我非常喜歡內(nèi)置的魔術(shù)命令。以下是一些例子:·%cd -用于更改當(dāng)前工作目錄·編輯-打開(kāi)編輯器,并執(zhí)行您在關(guān)閉編輯器后鍵入的代碼· %env — 展示當(dāng)前環(huán)境變量· %pip install [pkgs] — 在交互環(huán)境下安裝包· %time 和 %timeit — 計(jì)算Python代碼的執(zhí)行時(shí)間另一個(gè)有用的功能是引用前一個(gè)命令的輸出。In和Out是實(shí)際的對(duì)象。您可以通過(guò)使用Out[3]來(lái)進(jìn)行第三個(gè)命令的輸出。下載Python命令安裝Ipython:
pip3install ipython
4. 列表推導(dǎo)
列表推導(dǎo)可以替換丑陋的用于填充列表的for循環(huán)。列表推導(dǎo)的基本語(yǔ)法是:
[expression for item in list if conditional ]
這是一個(gè)最基本的例子,使用數(shù)字序列填充列表:
mylist = [i for i inrange(10)]print(mylist)# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
viewrawlist_comprehensions_1.py hostedwith ? by GitHub
同時(shí)你還可以用這種表達(dá)進(jìn)行數(shù)學(xué)運(yùn)算:
squares = [x**2for x inrange(10)]print(squares)# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
viewrawlist_comprehensions_2.py hostedwith ? by GitHub
甚至額外創(chuàng)建一個(gè)新函數(shù):
defsome_function(a): return (a +5) /2my_formula = [some_function(i) for i inrange(10)]print(my_formula)# [2, 3, 3, 4, 4, 5, 5, 6, 6, 7]
viewrawlist_comprehensions_3.py hostedwith ? by GitHub
最終,你可以使用“if”來(lái)過(guò)濾列表。在這個(gè)例子中,只保留了能被2整除的值
filtered = [i for i inrange(20) if i%2==0]print(filtered)# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
viewrawlist_comprehensions_4.py hosted with ? by GitHub
5.檢查對(duì)象的內(nèi)存使用
使用 sys.getsizeof(),可以檢查對(duì)象的記憶內(nèi)存:
import sysmylist =range(0, 10000)print(sys.getsizeof(mylist))# 48
viewrawcheck_memory_usage_1.py hostedwith ? by GitHub
為什么這樣一個(gè)巨大的列表僅占48字節(jié)內(nèi)存?這是因?yàn)閞ange函數(shù)返回的類只表現(xiàn)為一個(gè)列表。范圍比使用實(shí)際的數(shù)字列表更節(jié)省內(nèi)存。你可以自己使用列表推導(dǎo)創(chuàng)建同一范圍內(nèi)的實(shí)際數(shù)字列表:
import sysmyreallist = [x for x inrange(0, 10000)]print(sys.getsizeof(myreallist))# 87632
viewrawcheck_memory_usage_2.py hosted with ? by GitHub
6. 返回多個(gè)值
Python中的函數(shù)可以返回多個(gè)變量,而無(wú)需字典、列表或類。它的工作原理如下:
defget_user(id): # fetch user from database # .... return name, birthdatename, birthdate = get_user(4)
viewrawreturn_multiple_variables.py hosted with ? by GitHub
對(duì)于有限數(shù)量的返回值,這是可以的。但是任何超過(guò)3個(gè)值的內(nèi)容都應(yīng)該放到一個(gè)(data)類中。
7. 使用數(shù)據(jù)類
從3.7版開(kāi)始,Python提供了數(shù)據(jù)類。與常規(guī)類或其他替代方法(如返回多個(gè)值或字典)相比,有幾個(gè)優(yōu)點(diǎn):· 一個(gè)數(shù)據(jù)類需要最少的代碼· 可以比較數(shù)據(jù)類,因?yàn)橐呀?jīng)實(shí)現(xiàn)了_eq__· 您以輕易打印一個(gè)數(shù)據(jù)類進(jìn)行調(diào)試,因?yàn)橐矊?shí)現(xiàn)了_repr__· 數(shù)據(jù)類需要類型提示,減少了出錯(cuò)幾率下面是一個(gè)數(shù)據(jù)類的例子
from dataclasses import dataclass@dataclassclassCard: rank: str suit: strcard = Card("Q", "hearts")print(card == card)# Trueprint(card.rank)# 'Q'print(card)Card(rank='Q', suit='hearts'
viewrawdataclass.py hosted with ? by GitHub
點(diǎn)擊這里查看高階指南 。
8. 變量交換
一個(gè)小技巧就可以省略數(shù)行代碼。
a =1b =2a, b = b, aprint (a)# 2print (b)# 1
viewrawin_place_variable_swapping.py hosted with ? by GitHub
9. 合并字典(Python3.5+)
自Python3.5 以來(lái),合并字典更為簡(jiǎn)便
dict1 = { 'a': 1, 'b': 2 }dict2 = { 'b': 3, 'c': 4 }merged = { **dict1, **dict2 }print (merged)# {'a': 1, 'b': 3, 'c': 4}
viewrawmerging_dicts.py hostedwith ? by GitHub
如果有重疊的值,來(lái)自第一個(gè)字典的值將被覆蓋。10. 標(biāo)題大小寫這只是其中一種有趣的玩法:
mystring ="10 awesome python tricks"print(mystring.title())'10 Awesome Python Tricks'
viewrawstring_to_titlecase.py hosted with ? by GitHub
11. 切割字符串至列表
可以將字符串拆分為字符串列表。在下例中,根據(jù)空格切割
mystring ="The quick brown fox"mylist = mystring.split(' ')print(mylist)# ['The', 'quick', 'brown', 'fox']
viewrawstring_to_list.py hosted with ? by GitHub
12. 從字符串列表中創(chuàng)建一個(gè)字符串
與上一個(gè)技巧正好相反,在本例中,從字符串列表中創(chuàng)建一個(gè)字符串,并在單詞間輸入空格:
mylist = ['The', 'quick', 'brown', 'fox']mystring =" ".join(mylist)print(mystring)# 'The quick brown fox'
viewrawlist_to_string.py hostedwith ? by GitHub
你或許在想為什么不用mylist.join(" ") ,好問(wèn)題!歸根結(jié)底,String.join()函數(shù)不僅可以連接列表,還可以連接任何可迭代的列表。將它放在String中會(huì)阻止在多個(gè)位置實(shí)現(xiàn)相同的功能
13. 表情
表情要么是歡喜,要么是討厭,這依表情而定。更重要的是,這在分析社交媒體數(shù)據(jù)時(shí)尤其有用。首先,下載表情模塊
pip3install emoji
下載完之后,就可以按如下操作:
import emojiresult = emoji.emojize('Python is :thumbs_up:')print(result)# 'Python is 'br/># You can also reverse this:br/>result = emoji.demojize('Python is x27;)br/>print(result)br/># 'Python is :thumbs_up:'
viewrawemoji.py hosted with ? by GitHub
訪問(wèn)表情包頁(yè)面查看更多描述和示例
14. 制作列表切片
列表切片的句法:
a[start:stop:step]
Start, stop 和 step 都是可選項(xiàng). 如果未設(shè)置,默認(rèn)值會(huì)是· Start值為0· End為字符串末尾· step值為1以下是一個(gè)例子:
# We can easily create a new list from# the first two elements of a list:first_two = [1, 2, 3, 4, 5][0:2]print(first_two)# [1, 2]# And if we use a step value of 2,# we can skip over every second number# like this:steps = [1, 2, 3, 4, 5][0:5:2]print(steps)# [1, 3, 5]# This works on strings too. In Python,# you can treat a string like a list of# letters:mystring ="abcdefdn nimt"[::2]print(mystring)# 'aced it'
viewrawlist_slicing.py hosted with ? by GitHub
15. 反轉(zhuǎn)字符串和列表
使用上面的切片符號(hào)來(lái)反轉(zhuǎn)字符串或列表。通過(guò)使用負(fù)的步進(jìn)值-1,從而反轉(zhuǎn)元素:
revstring ="abcdefg"[::-1]print(revstring)# 'gfedcba'revarray = [1, 2, 3, 4, 5][::-1]print(revarray)# [5, 4, 3, 2, 1]
viewrawreversing_stuff.py hosted with ? by GitHub
16. 展示小貓
首先,安裝Pillow(Python圖像庫(kù)的一個(gè)分支):
pip3install Pillow
下載這張圖片,并把它命名為kittens.jpg:
圖源 TheDigitalArtist Pixabay可以使用以下代碼來(lái)顯示Python代碼中的圖像:或者直接使用IPython:
fromPILimport Imageim = Image.open("kittens.jpg")im.show()print(im.format, im.size, im.mode)# JPEG (1920, 1357) RGB
viewrawpillow.py hosted with ? by GitHub
除了顯示圖像,Pillow還可以分析、調(diào)整大小、過(guò)濾、增強(qiáng)、變形等等。有關(guān)它的所有特性,請(qǐng)參閱文檔。
17. 使用map()
Python的一個(gè)內(nèi)置函數(shù)是map()。map()的語(yǔ)法是: map(function, something_iterable)給定一個(gè)要執(zhí)行的函數(shù),和一些要運(yùn)行的變量。它可以是任何可迭代的元素。在下面的例子中,我將使用一個(gè)列表。
defupper(s): return s.upper()mylist =list(map(upper, ['sentence', 'fragment']))print(mylist)# ['SENTENCE', 'FRAGMENT']# Convert a string representation of# a number into a list of ints.list_of_ints =list(map(int, "1234567")))print(list_of_ints)# [1, 2, 3, 4, 5, 6, 7]
viewrawmap.py hostedwith ? by GitHub
看看自己的代碼,看看是否可以在某處使用map()而不是循環(huán)!
18. 從列表和字符串中提取獨(dú)特元素
通過(guò)使用set()函數(shù)創(chuàng)建一個(gè)集合,可以從一個(gè)列表或類似列表的對(duì)象中獲得所有獨(dú)特的元素:
mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]print (set(mylist))# {1, 2, 3, 4, 5, 6}# And since a string can be treated like a# list of letters, you can also get the# unique letters from a string this way:print (set("aaabbbcccdddeeefff"))# {'a', 'b', 'c', 'd', 'e', 'f'}
viewrawset.py hosted with ? by GitHub
19. 找到頻率出現(xiàn)最高的值
查找列表或字符串中最常出現(xiàn)的值:
test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]print(max(set(test), key= test.count))# 4
viewrawmost_frequent.py hostedwith ? by GitHub
你明白為什么會(huì)這樣嗎?在繼續(xù)閱讀之前,試著自己找出答案。還沒(méi)嘗試嗎?我要告訴你答案了。
· max()將返回列表中的最大值。key參數(shù)接受單個(gè)參數(shù)函數(shù)來(lái)定制排序順序,在本例中,它是test.count。該函數(shù)應(yīng)用于iterable上的每個(gè)項(xiàng)目。
· 測(cè)試。count是一個(gè)內(nèi)置的列表函數(shù)。它接受一個(gè)參數(shù),并將計(jì)算該參數(shù)的出現(xiàn)次數(shù)。因此test.count(1)將返回2,而test.count(4)將返回4。
· set(test)返回test中所有的唯一值,因此{(lán)1,2,3,4}因此,我們?cè)谶@一行代碼中所做的就是獲取test的所有唯一值,即{1,2,3,4}。接下來(lái),max將應(yīng)用list.count 函數(shù),并返回最大值。
20. 創(chuàng)建一個(gè)進(jìn)度條
創(chuàng)建自己的進(jìn)度條,這很有趣。但是使用進(jìn)度包更快:
pip3install progress
現(xiàn)在可以花費(fèi)更少的時(shí)間創(chuàng)建進(jìn)度條
from progress.bar import Barbar = Bar('Processing', max=20)for i inrange(20):# Do some work bar.next()bar.finish()
viewrawprogress_bar.py hostedwith ? by GitHub
21. 在交互式窗口中使用_
可以用下劃線運(yùn)算符得到最后一個(gè)表達(dá)式的結(jié)果,例如,在IPython中,如下所示:
In [1]:3 * 3Out[1]: 9In [2]: _ + 3Out[2]: 12
這也適用于Pythonshell。此外,IPython shell允許使用Out[n]來(lái)獲取[n]中的表達(dá)式的值。例如,Out[1]會(huì)給出數(shù)字9。
22. 快速創(chuàng)建一個(gè)web服務(wù)器
快速啟動(dòng)web服務(wù)器,提供當(dāng)前目錄的內(nèi)容:
python3-m http.server
如果您想與同事共享一些內(nèi)容,或者想測(cè)試一個(gè)簡(jiǎn)單的HTML站點(diǎn),這是非常有用的。
23. 多行字符串
盡管可以在代碼中使用三引號(hào)將多行字符串包括在內(nèi),但這并不理想。放在三引號(hào)之間的所有內(nèi)容都將成為字符串,包括格式,如下所示。
我更喜歡第二種方法,該方法將多行連接在一起,使您可以很好地格式化代碼。唯一的缺點(diǎn)是您需要顯式添加換行符。
s1 ="""Multi line strings can be put between triple quotes. It's not ideal when formatting your code though"""print (s1)# Multi line strings can be put# between triple quotes. It's not ideal# when formatting your code thoughs2 = ("You can also concatenate multiple\n"+ "strings this way, but you'll have to\n" "explicitly put in the newlines")print(s2)# You can also concatenate multiple# strings this way, but you'll have to# explicitly put in the newlines
viewrawmultiline_strings.py hosted with ? by GitHub
24.三元運(yùn)算符,用于條件賦值
這是使代碼兼具簡(jiǎn)潔性與可讀性的另一種方法:[on_true] if [expression] else[on_false]例子:
x = "Success!" if (y== 2) else "Failed!"
25. 計(jì)算頻率
使用集合庫(kù)中的Counter來(lái)獲取包含列表中所有唯一元素計(jì)數(shù)的字典:
from collections import Countermylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]c = Counter(mylist)print(c)# Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})# And it works on strings too:print(Counter("aaaaabbbbbccccc"))# Counter({'a': 5, 'b': 5, 'c': 5})
viewrawcounter.py hosted with ? by GitHub
26. 鏈接比較運(yùn)算符
在Python中鏈接比較運(yùn)算符,以創(chuàng)建更易讀和簡(jiǎn)潔的代碼:
x =10# Instead of:if x >5and x <15: print("Yes")# yes# You can also write:if5< x <15: print("Yes")# Yes
viewrawchaining_comparisons.py hosted with ? by GitHub
27. 添加一些顏色
使用Colorama,在終端添加點(diǎn)顏色.
from colorama import Fore, Back, Styleprint(Fore.RED+'some red text')print(Back.GREEN+'and with a green background')print(Style.DIM+'and in dim text')print(Style.RESET_ALL)print('back to normal now')
viewrawcolorama.py hosted with ? by GitHub
28. 添加日期
python-dateutil模塊提供了對(duì)標(biāo)準(zhǔn)datetime模塊的強(qiáng)大擴(kuò)展。通過(guò)以下方式安裝:
pip3 install python-dateutil
您可以使用此庫(kù)做很多很棒的事情。我只會(huì)重點(diǎn)介紹對(duì)我來(lái)說(shuō)特別有用的例子:如模糊分析日志文件中的日期等。
from dateutil.parser import parselogline ='INFO 2020-01-01T00:00:01 Happy new year, human.'timestamp = parse(log_line, fuzzy=True)print(timestamp)# 2020-01-01 00:00:01
viewrawdateutil.py hosted with ? by GitHub
只需記?。撼R?guī)的Python日期時(shí)間功能不奏效時(shí),python-dateutil就派上用場(chǎng)了!
29. 整數(shù)除法
在Python 2中,除法運(yùn)算符(/)默認(rèn)為整數(shù)除法,除非操作數(shù)之一是浮點(diǎn)數(shù)。因此,有以下操作:
# Python 25 / 2 = 25 / 2.0 = 2.5
在Python 3中,除法運(yùn)算符默認(rèn)為浮點(diǎn)除法,并且//運(yùn)算符已成為整數(shù)除法。這樣我們得到:
Python 35 / 2 = 2.55 // 2 = 2
30. 使用chardet進(jìn)行字符集檢測(cè)
使用chardet模塊來(lái)檢測(cè)文件的字符集。在分析大量隨機(jī)文本時(shí),這很有用。
安裝方式:
pip install chardet
現(xiàn)在,有了一個(gè)名為chardetect的額外命令行工具,可以像這樣使用:
chardetect somefile.txtsomefile.txt: ascii with confidence 1.0
以上就是2020年30條最佳的代碼技巧。我希望您能像享受創(chuàng)建列表一樣,享受這些內(nèi)容。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03