
作者 | 宋天龍
來源 | AI科技大本營(yíng)
導(dǎo)語:一切都始于1989年的那個(gè)圣誕節(jié),Python的誕生并不算恰逢其時(shí),它崛起充滿了機(jī)遇巧合,也有其必然性。三十年間,Python技術(shù)不斷更迭,生態(tài)逐漸完善,加上互聯(lián)網(wǎng)、大數(shù)據(jù)、以及人工智能這一波波浪潮的推波助瀾,Python漸漸從小眾最終站上了現(xiàn)在的高度。
從歷史發(fā)展的角度出發(fā),我們才能看清Python崛起的偶然性和必然性。本文將結(jié)合技術(shù)和產(chǎn)業(yè)的發(fā)展,全面透析Python的演進(jìn)之路,幫助讀者理解是什么造就了如今的Python。
Python 1.0時(shí)代:起源與誕生
Guido van Rossum(下面簡(jiǎn)稱Guido)是Python語言之父,他于1982年從阿姆斯特丹大學(xué)獲得了數(shù)學(xué)和計(jì)算機(jī)碩士雙學(xué)位,期間他接觸了很多的語言,包括Pascal,C,F(xiàn)ortran等。
在那個(gè)計(jì)算機(jī)資源貧乏的年代,像計(jì)算機(jī)一樣思考并編程是每個(gè)程序員必須面對(duì)的事情,這讓他非??鄲溃煌瑫r(shí)他又非常欣賞shell,shell簡(jiǎn)單易編程的特性讓程序員更加專注于設(shè)計(jì)和邏輯本身,但shell本質(zhì)上是一個(gè)功能的調(diào)用,它沒有自己的數(shù)據(jù)類型,更無法全面調(diào)用計(jì)算機(jī)功能,因此shell也不算是一門“語言”。
因此,他希望找到一種語言既可以像使用shell一樣簡(jiǎn)單,又可以和C語言的功能相媲美。不過這種語言在那個(gè)年代并不存在。
1989年的圣誕節(jié),Guido開始編寫Python語言的編譯器。Python這個(gè)名字來源于他喜歡的電視劇Monty Python’s Flying Circus,而不是表面意義上的“蟒蛇”。他希望這個(gè)新的語言,能符合他的理想:介于C和shell之間,功能全面、易學(xué)、易用又可拓展。
1991年,第一個(gè)Python編譯器誕生,這標(biāo)志著Python的第一個(gè)版本正式誕生。它基于C語言,并具備了基礎(chǔ)的類、函數(shù)、異常處理等功能特性,同時(shí)具備可擴(kuò)展性。Python語法很多來自C,但又受到ABC語言的強(qiáng)烈影響。例如來源于ABC語言強(qiáng)制縮進(jìn)的規(guī)定本身可以讓Python容易讀,但如果縮進(jìn)出錯(cuò)卻會(huì)影響編譯和執(zhí)行。Python本身不以性能為重,但當(dāng)確實(shí)需要考慮性能時(shí),Python程序員卻可以深入底層來編寫C程序,并編譯為.so文件引入到Python中使用。
Python語言的魅力在于讓程序員可以花更多的時(shí)間用于思考程序的邏輯,而不是具體的實(shí)現(xiàn)細(xì)節(jié),這一特性也得到Guido同事的歡迎。他們?cè)诜答伿褂靡庖姷耐瑫r(shí)也參與到Python的改進(jìn)中來,因此最初Guido和一些同事構(gòu)成了Python的核心團(tuán)隊(duì),當(dāng)然,核心決策者還是Guido本人。隨后,Python的使用拓展到研究所之外,并吸引了越來越多的程序員。
但是,最初Python的使用非常小眾,因?yàn)樵谀莻€(gè)計(jì)算機(jī)資源非常有限的年代,大家都傾向于最大化榨取計(jì)算機(jī)資源并提升運(yùn)算效率,而Python顯然不是為此而生。
Python 2.0時(shí)代:崛起
最初發(fā)布時(shí),Python在設(shè)計(jì)層面存在一些缺陷,例如以滿足跨語言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求的Unicode字符編碼標(biāo)準(zhǔn)在1994年才正式公布,所以一直以來Python 2及之前的版本對(duì)Unicode的支持并不完全。相信大家在使用Python 2版本處理中文時(shí)都遇到過各種問題。
2000年發(fā)布的Python 2.0標(biāo)志著Python的框架基本確定。重要框架方向包括:
1965年,戈登·摩爾提出了著名的摩爾定律,其內(nèi)容為:當(dāng)價(jià)格不變時(shí),集成電路上可容納的元器件的數(shù)目,約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍。在隨后超過半個(gè)世紀(jì)的時(shí)間里,個(gè)人計(jì)算機(jī)的發(fā)展日新月異,已經(jīng)由資源不足向資源過剩轉(zhuǎn)變。這客觀上為Python的應(yīng)用提供了基礎(chǔ)條件——只有在資源過剩的條件下,程序員才不會(huì)過度關(guān)注榨取性能。
隨著Python自身功能的完善以及生態(tài)系統(tǒng)的擴(kuò)展,Python在Web開發(fā)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)分析與數(shù)據(jù)挖掘、人工智能等應(yīng)用方面逐漸嶄露頭角。
Django和Flask引領(lǐng)的WEB開發(fā)模式
2004年,目前最流行的WEB框架Django誕生。2010年,另一個(gè)流行的輕量級(jí)WEB框架Flask誕生。Django是一個(gè)WEB解決方案“全家桶”,其功能大而全,包含了幾乎所有WEB開發(fā)相關(guān)的組件和功能,它可以大大節(jié)省開發(fā)者在基礎(chǔ)組件、選型、適配等方面的時(shí)間和精力;而Flask只包含基本的配置,默認(rèn)依賴于兩個(gè)外部庫(kù)也可以自由替換,給開發(fā)者提供最大的自主空間。這兩類完全相反方向上的WEB開發(fā)模式,幾乎可以為所有開發(fā)者提供了很好的選型參照物:無論開發(fā)者想要一站式還是最大化自主解決方案,Python都能滿足。
此后,以豆瓣、春雨醫(yī)生、知乎、Dropbox、YouTube、CIA(美國(guó)中情局)等為代表的企業(yè)和機(jī)構(gòu)都基于Python做網(wǎng)站開發(fā),預(yù)示著Python應(yīng)用到WEB開發(fā)領(lǐng)域逐漸成為一種新興趨勢(shì)。
人人都能勝任的網(wǎng)絡(luò)爬蟲
Python自帶的標(biāo)準(zhǔn)庫(kù)中,urllib、urllib2、requests庫(kù)對(duì)于簡(jiǎn)單網(wǎng)頁(yè)的抓取實(shí)現(xiàn)非常簡(jiǎn)單,即使在面對(duì)海量數(shù)據(jù)抓取需求時(shí),第三方庫(kù)Scrapy也能應(yīng)對(duì)自如;再配合正則表達(dá)式庫(kù)re、網(wǎng)頁(yè)代碼解析BeautifulSoup、html和xml解析庫(kù)lxml、多線程庫(kù)threading等特性,使得Python在應(yīng)用到網(wǎng)絡(luò)爬蟲任務(wù)上時(shí),只需要很少的開發(fā)量便能迅速完成任務(wù)?;赑ython簡(jiǎn)單易學(xué)的特性,幾乎人人都能開發(fā)網(wǎng)絡(luò)爬蟲。
比shell更好用的自動(dòng)化運(yùn)維工具
Python是跨語言和平臺(tái)的,幾乎所有Linux系統(tǒng)和MAC系統(tǒng)都自帶Python庫(kù),Windows系統(tǒng)也可以自定義安裝。Python默認(rèn)的os、sys等庫(kù)可實(shí)現(xiàn)與操作系統(tǒng)的交互和執(zhí)行功能,更重要的是Python還能直接執(zhí)行系統(tǒng)終端命令。因此,使用Python編寫的系統(tǒng)運(yùn)維和管理腳本在可讀性、性能、代碼重用度、擴(kuò)展性幾方面都優(yōu)于普通的shell腳本,在自動(dòng)化運(yùn)維方面應(yīng)用廣泛。
數(shù)據(jù)分析與科學(xué)計(jì)算三劍客
2008年發(fā)布的Numpy、scipy和2009年發(fā)布的pandas是數(shù)據(jù)分析與科學(xué)計(jì)算的三劍客。
NumPy(Numeric Python的簡(jiǎn)稱)是Python科學(xué)計(jì)算的基礎(chǔ)工具包,也是Python做數(shù)據(jù)計(jì)算的關(guān)鍵庫(kù)之一,同時(shí)又是很多第三方庫(kù)的依賴庫(kù)。
Scipy(Scientific Computing Tools for Python的簡(jiǎn)稱)是一組專門解決科學(xué)和工程計(jì)算不同場(chǎng)景的主題工具包,它提供的主要功能側(cè)重于數(shù)學(xué)、函數(shù)等,例如積分和微分方程求解。Pandas(Python Data Analysis Library的簡(jiǎn)稱)是一個(gè)用于Python數(shù)據(jù)分析的庫(kù),它的主要作用是進(jìn)行數(shù)據(jù)分析和預(yù)處理。
Pandas提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維表格型數(shù)據(jù)結(jié)構(gòu)DataFrame,類似于R中的數(shù)據(jù)框,能提供類似于數(shù)據(jù)庫(kù)中的切片、切塊、聚合、選擇子集等精細(xì)化操作,為數(shù)據(jù)分析提供便捷。另外,Pandas還提供了時(shí)間序列的功能,用于金融行業(yè)的數(shù)據(jù)分析。
除此之外,很多大型公司也都在使用Python完成不同類型的其他工作,其中不乏世界知名公司,如國(guó)外的Google、Facebook、NASA 、雅虎、YouTube等,國(guó)內(nèi)的網(wǎng)易、騰訊、搜狐、金山等。例如谷歌在Google Groups、Gmail、Google Maps等項(xiàng)目中將Python用作網(wǎng)絡(luò)應(yīng)用的后端;在Google Cloud Platform中的Google Cloud Storage本地部署環(huán)境中,gsutil也在Python 2基礎(chǔ)上開發(fā)和應(yīng)用。
后Python2與Python3時(shí)代:AI讓Python大放異彩
2008年12月,Python 3發(fā)布。Python 3相對(duì)于Python 2的早期版本(主要是Python2.6之前)是一個(gè)較大的升級(jí),它在設(shè)計(jì)的時(shí)候沒有考慮向下兼容,所以很多早期版本的Python程序無法在Python 3上運(yùn)行。為了照顧早期的版本,推出過渡版本2.6——基本使用了Python 2.x的語法和庫(kù),同時(shí)考慮了向Python 3.0的遷移,允許使用部分Python 3.0的語法與函數(shù)。同時(shí),Python還提供了Python 2到Python 3的Python文件轉(zhuǎn)換功能,以幫助開發(fā)者升級(jí)。
2010年7月發(fā)布了Python 2.x系列的最后一個(gè)版本,主版本號(hào)為2.7。大量Python 3的特性被反向遷移到了Python 2.7,2.7版本比2.6版本進(jìn)步非常多,同時(shí)擁有大量Python 3中的特性和庫(kù),并且照顧了原有的Python開發(fā)人群。Python2.7也是當(dāng)前絕大多數(shù)Linux操作系統(tǒng)最新版本的默認(rèn)Python版本。
從2008年開始,Python 2與Python 3是并存發(fā)展的。但在2018年3月,Guido在郵件列表上宣布Python 2.7將于2020年1月1日終止支持,這意味著之后Python 2將不再被統(tǒng)一維護(hù),與之對(duì)應(yīng)的是主流第三方庫(kù)也不會(huì)再提供針對(duì)Python 2版本的開發(fā)支持。Python 2的時(shí)代即將過去。
這一時(shí)期,Python繼續(xù)以其獨(dú)特魅力吸引更多的開發(fā)者加入,但真正讓Python大放異彩的卻是AI(人工智能)的爆發(fā)。
AI并不是一個(gè)新生事物,而是從20世紀(jì)50年代就開始出現(xiàn),隨后經(jīng)過了大概20年的黃金時(shí)期,又分別在20世紀(jì)70年代和90年代兩次進(jìn)入寒冬期。從2006年開始,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的出現(xiàn),讓AI進(jìn)入爆發(fā)期。
在AI領(lǐng)域,Python擁有很多相關(guān)庫(kù)和框架。其中最著名的是:
在互聯(lián)網(wǎng)領(lǐng)域,F(xiàn)acebook和Google都是全球IT企業(yè)的標(biāo)桿,具備行業(yè)領(lǐng)導(dǎo)力和風(fēng)向指示意義。他們基于Python開發(fā)的AI庫(kù)(PyTorch和TensorFlow)已經(jīng)成為目前最流行的AI庫(kù),而且“到底選擇PyTorch還是Tensorflow”仍然是一個(gè)具有爭(zhēng)議性的話題。
在AI時(shí)代,主要應(yīng)用場(chǎng)景包括:
在不同的領(lǐng)域,Python都能扮演非常重要的角色,因此,在國(guó)外的各大榜單中,Python都已經(jīng)成為最受歡迎的語言(或至少是之一)。不只在商業(yè)領(lǐng)域流行,國(guó)內(nèi)很多地區(qū)和教育機(jī)構(gòu)正將Python納入教材之中。比如Python進(jìn)入山東小學(xué)六年級(jí)的教材,浙江信息技術(shù)教材將放棄VB,改用Python 語言,Python列入全國(guó)計(jì)算機(jī)二級(jí)等級(jí)考試大綱等。
Python的未來發(fā)展
在Python發(fā)展過程中,Guido一直是核心人物,甚至被稱為“終身仁慈獨(dú)裁者”,但在2018年經(jīng)歷了退出管理層風(fēng)波之后,他又在2019年以五大指導(dǎo)委員之一的身份重回決策層。這為Python迎來了新的治理方案:指導(dǎo)委員會(huì)模式。這種模式意味著Python的未來將從Guido一人決定變?yōu)?人決定,雖然比很多開源語言仍然有民主化空間(例如PHP的改進(jìn)由社區(qū)投票決定),但也算是一種從專制到民主的進(jìn)步。
有關(guān)Python的每個(gè)提升計(jì)劃,都是在PEP(Python Enhancement Proposal)列表中——每個(gè)版本新特性和變化都通過PEP提案經(jīng)過社區(qū)決策層討論、投票決議,最終才有我們看到的功能。
目前,Python的最新穩(wěn)定的主版本是3.7,Python 3.8也已經(jīng)有了預(yù)覽版,大概在2023年左右Python 4便會(huì)問世。在之后的時(shí)間里,Python會(huì)如何發(fā)展?我們可以從Python軟件基金會(huì)的董事會(huì)成員、CPython的核心開發(fā)人員Nick Coghlan的信息中略知一二:
首先,Python的PEP流程和制度沒有任何變化,通過增加新模塊和功能來增強(qiáng)的基礎(chǔ)能力。隨著Python 2在2020年不再維護(hù),社區(qū)在Python 3的資源和投入會(huì)相應(yīng)增加。
其次,不同解釋器的實(shí)現(xiàn)和功能擴(kuò)展還將繼續(xù)增強(qiáng),方向包括PyPy關(guān)于JIT編譯器生成和軟件事務(wù)內(nèi)存的嘗試,以及科學(xué)和數(shù)據(jù)分析社區(qū),對(duì)面向數(shù)組編程的探索等。
再次,嵌入式應(yīng)用的增強(qiáng),核心是與其他虛擬機(jī)運(yùn)行時(shí)(如JVM和CLR)的集成和改進(jìn),尤其是在教育領(lǐng)域取得的進(jìn)展,可能會(huì)讓Python作為更受歡迎的嵌入式腳本語言,在更大的應(yīng)用程序中運(yùn)行。
最后,對(duì)于為了兼容和維持Python 2的部分功能而存在于Python 3中的原有代碼,在后續(xù)版本中應(yīng)該會(huì)逐步優(yōu)化甚至去掉。而對(duì)于其他更改,則會(huì)根據(jù)情況棄用、提出警告、逐步替代以及保留。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03