
Python標(biāo)準(zhǔn)庫—走馬觀花
Python有一套很有用的標(biāo)準(zhǔn)庫(standard library)。標(biāo)準(zhǔn)庫會(huì)隨著Python解釋器,一起安裝在你的電腦中的。它是Python的一個(gè)組成部分。這些標(biāo)準(zhǔn)庫是Python為你準(zhǔn)備好的利器,可以讓編程事半功倍。
我將根據(jù)我個(gè)人的使用經(jīng)驗(yàn)中,挑選出標(biāo)準(zhǔn)庫三個(gè)方面的包(package)介紹:
Python增強(qiáng)
系統(tǒng)互動(dòng)
網(wǎng)絡(luò)
第一類:Python增強(qiáng)
Python自身的已有的一些功能可以隨著標(biāo)準(zhǔn)庫的使用而得到增強(qiáng)。
1) 文字處理
Python的string類提供了對(duì)字符串進(jìn)行處理的方法。更進(jìn)一步,通過標(biāo)準(zhǔn)庫中的re包,Python可以用正則表達(dá)式(regular expression)來處理字符串。
正則表達(dá)式是一個(gè)字符串模板。Python可以從字符中搜查符合該模板的部分,或者對(duì)這一部分替換成其它內(nèi)容。比如你可以搜索一個(gè)文本中所有的數(shù)字。正則表達(dá)式的關(guān)鍵在于根據(jù)自己的需要構(gòu)成模板。
此外,Python標(biāo)準(zhǔn)庫還為字符串的輸出提供更加豐富的格式, 比如: string包,textwrap包。
2) 數(shù)據(jù)對(duì)象
不同的數(shù)據(jù)對(duì)象,適用于不同場(chǎng)合的對(duì)數(shù)據(jù)的組織和管理。Python的標(biāo)準(zhǔn)庫定義了表和詞典之外的數(shù)據(jù)對(duì)象,比如說數(shù)組(array),隊(duì)列(Queue)。一個(gè)熟悉數(shù)據(jù)結(jié)構(gòu)(data structure)的Python用戶可以在這些包中找到自己需要的數(shù)據(jù)結(jié)構(gòu)。
此外,我們也會(huì)經(jīng)常使用copy包,以復(fù)制對(duì)象。
3) 日期和時(shí)間
日期和時(shí)間的管理并不復(fù)雜,但容易犯錯(cuò)。Python的標(biāo)準(zhǔn)庫中對(duì)日期和時(shí)間的管理頗為完善(利用time包管理時(shí)間,利用datetime包管理日期和時(shí)間),你不僅可以進(jìn)行日期時(shí)間的查詢和變換(比如:2012年7月18日對(duì)應(yīng)的是星期幾),還可以對(duì)日期時(shí)間進(jìn)行運(yùn)算(比如2000.1.1 13:00的378小時(shí)之后是什么日期,什么時(shí)間)。通過這些標(biāo)準(zhǔn)庫,還可以根據(jù)需要控制日期時(shí)間輸出的文本格式(比如:輸出’2012-7-18‘還是'18 Jul 2012')
4) 數(shù)學(xué)運(yùn)算
標(biāo)準(zhǔn)庫中,Python定義了一些新的數(shù)字類型(decimal包, fractions包), 以彌補(bǔ)之前的數(shù)字類型(integer, float)可能的不足。標(biāo)準(zhǔn)庫還包含了random包,用于處理隨機(jī)數(shù)相關(guān)的功能(產(chǎn)生隨機(jī)數(shù),隨機(jī)取樣等)。math包補(bǔ)充了一些重要的數(shù)學(xué)常數(shù)和數(shù)學(xué)函數(shù),比如pi,三角函數(shù)等等。
(盡管numpy并不是標(biāo)準(zhǔn)庫中的包,但它的數(shù)組運(yùn)算的良好支持,讓它在基于Python的科研和計(jì)算方面得到相當(dāng)廣泛的應(yīng)用,可以適當(dāng)關(guān)注。)
5) 存儲(chǔ)
之前我們的快速教程中,只提及了文本的輸入和輸出。實(shí)際上,Python可以輸入或輸出任意的對(duì)象。這些對(duì)象可以通過標(biāo)準(zhǔn)庫中的pickle包轉(zhuǎn)換成為二進(jìn)制格式(binary),然后存儲(chǔ)于文件之中,也可以反向從二進(jìn)制文件中讀取對(duì)象。
此外,標(biāo)準(zhǔn)庫中還支持基本的數(shù)據(jù)庫功能(sqlite3包)。XML和csv格式的文件也有相應(yīng)的處理包。
第二類:系統(tǒng)互動(dòng)
系統(tǒng)互動(dòng),主要指Python和操作系統(tǒng)(operate system)、文件系統(tǒng)(file system)的互動(dòng)。Python可以實(shí)現(xiàn)一個(gè)操作系統(tǒng)的許多功能。它能夠像bash腳本那樣管理操作系統(tǒng),這也是Python有時(shí)被成為腳本語言的原因。
1) Python運(yùn)行控制
sys包被用于管理Python自身的運(yùn)行環(huán)境。Python是一個(gè)解釋器(interpreter), 也是一個(gè)運(yùn)行在操作系統(tǒng)上的程序。我們可以用sys包來控制這一程序運(yùn)行的許多參數(shù),比如說Python運(yùn)行所能占據(jù)的內(nèi)存和CPU, Python所要掃描的路徑等。另一個(gè)重要功能是和Python自己的命令行互動(dòng),從命令行讀取命令和參數(shù)。
2) 操作系統(tǒng)
如果說Python構(gòu)成了一個(gè)小的世界,那么操作系統(tǒng)就是包圍這個(gè)小世界的大世界。Python與操作系統(tǒng)的互動(dòng)可以讓Python在自己的小世界里管理整個(gè)大世界。
os包是Python與操作系統(tǒng)的接口。我們可以用os包來實(shí)現(xiàn)操作系統(tǒng)的許多功能,比如管理系統(tǒng)進(jìn)程,改變當(dāng)前路徑(相當(dāng)于’cd‘),改變文件權(quán)限等,建立。但要注意,os包是建立在操作系統(tǒng)的平臺(tái)上的,許多功能在Windows系統(tǒng)上是無法實(shí)現(xiàn)的。另外,在使用os包中,要注意其中的有些功能已經(jīng)被其他的包取代。
我們通過文件系統(tǒng)來管理磁盤上儲(chǔ)存的文件。查找、刪除,復(fù)制文件,以及列出文件列表等都是常見的文件操作。這些功能經(jīng)常可以在操作系統(tǒng)中看到(比如ls, mv, cp等Linux命令),但現(xiàn)在可以通過Python標(biāo)準(zhǔn)庫中的glob包、shutil包、os.path包、以及os包的一些函數(shù)等,在Python內(nèi)部實(shí)現(xiàn)。
subprocess包被用于執(zhí)行外部命令,其功能相當(dāng)于我們?cè)诓僮飨到y(tǒng)的命令行中輸入命令以執(zhí)行,比如常見的系統(tǒng)命令'ls'或者'cd',還可以是任意可以在命令行中執(zhí)行的程序。
4) 線程與進(jìn)程
Python支持多線程(threading包)運(yùn)行和多進(jìn)程(multiprocessing包)運(yùn)行。通過多線程和多進(jìn)程,可以提高系統(tǒng)資源的利用率,提高計(jì)算機(jī)的處理速度。Python在這些包中,附帶有相關(guān)的通信和內(nèi)存管理工具。此外,Python還支持類似于UNIX的signal系統(tǒng),以實(shí)現(xiàn)進(jìn)程之間的粗糙的信號(hào)通信。
第三類:網(wǎng)絡(luò)
現(xiàn)在,網(wǎng)絡(luò)功能的強(qiáng)弱很大程度上決定了一個(gè)語言的成功與否。從Ruby, JavaScript, php身上都可以感受到這一點(diǎn)。Python的標(biāo)準(zhǔn)庫對(duì)互聯(lián)網(wǎng)開發(fā)的支持并不充分,這也是Django等基于Python的項(xiàng)目的出發(fā)點(diǎn): 增強(qiáng)Python在網(wǎng)絡(luò)方面的應(yīng)用功能。這些項(xiàng)目取得了很大的成功,也是許多人愿意來學(xué)習(xí)Python的一大原因。但應(yīng)注意到,這些基于Python的項(xiàng)目也是建立在Python標(biāo)準(zhǔn)庫的基礎(chǔ)上的。
1) 基于socket層的網(wǎng)絡(luò)應(yīng)用
socket是網(wǎng)絡(luò)可編程部分的底層。通過socket包,我們可以直接管理socket,比如說將socket賦予給某個(gè)端口(port),連接遠(yuǎn)程端口,以及通過連接傳輸數(shù)據(jù)。我們也可以利用SocketServer包更方便地建立服務(wù)器。
通過與多線程和多進(jìn)程配合,建立多線程或者多進(jìn)程的服務(wù)器,可以有效提高服務(wù)器的工作能力。此外,通過asyncore包實(shí)現(xiàn)異步處理,也是改善服務(wù)器性能的一個(gè)方案。
2) 互聯(lián)網(wǎng)應(yīng)用
在實(shí)際應(yīng)用中,網(wǎng)絡(luò)的很多底層細(xì)節(jié)(比如socket)都是被高層的協(xié)議隱藏起來的。建立在socket之上的http協(xié)議實(shí)際上更容易也更經(jīng)常被使用。http通過request/responce的模式建立連接并進(jìn)行通信,其信息內(nèi)容也更容易理解。Python標(biāo)準(zhǔn)庫中有http的服務(wù)器端和客戶端的應(yīng)用支持(BaseHTTPServer包; urllib包, urllib2包), 并且可以通過urlparse包對(duì)URL(URL實(shí)際上說明了網(wǎng)絡(luò)資源所在的位置)進(jìn)行理解和操作。
以上的介紹比較粗糙,只希望能為大家提供一個(gè)了解標(biāo)準(zhǔn)庫的入口。歡迎大家一起分享標(biāo)準(zhǔn)庫的使用經(jīng)驗(yàn)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03