
為什么說Python是目前熱度增長最快的編程語言
近年來 Python 的熱度不斷上升,知名IT技術(shù)問答社區(qū) Stack Overflow 最近公布了程序語言排行榜,讓我們從數(shù)據(jù)的角度解讀為什么說 Python 是目前熱度增長最快的編程語言...
之前我們探討了富裕國家(被世界銀行定義為高收入的國家)比起其他國家更傾向于使用各種不同的技術(shù)。我們發(fā)現(xiàn)當中最大的差異是關(guān)于編程語言 Python 。在高收入國家中,Python 的增長熱度甚至比 Stack Overflow 的 Trends 工具等更為明顯。
在本文中我們將探討在過去五年中,高收入國家中 Python 熱度的驚人增長。下面讓我們用數(shù)據(jù)解讀為什么說在主要編程語言中 Python 的增長速度是最快的。
這篇文章中涉及的數(shù)據(jù)主要針對高收入國家 ; 這通常代表美國,英國,德國,加拿大等國家的趨勢,這些國家共占 Stack Overflow 總流量的 64%。印度,巴西,俄羅斯和中國等國家,也為全球軟件開發(fā)生態(tài)系統(tǒng)做出了巨大的貢獻。盡管 Python 在這些國家也顯示出了增長,但這篇文章對這些經(jīng)濟體涉及的不多。
但同時值得強調(diào)的是,一種語言的用戶數(shù)量并不是衡量語言質(zhì)量的標準:在此我們說明的僅為當前開發(fā)人員使用語言的情況。(實際上:之前我主要用 Python 編程,但后來轉(zhuǎn)為了使用 R 語言)。
Python 在高收入國家的熱度增長
在 StackOverflow 編程語言流行趨勢中可以看到,Python 在過去幾年中一直在迅速增長。但是在本文中,我們將重點關(guān)注高收入國家,并主要考慮被瀏覽的問題,而不是所提的問題(這會得出類似的結(jié)果,但是具有較小的每月噪音,特別是對于小的標簽)。
關(guān)于 Stack Overflow 瀏覽問題的數(shù)據(jù)可以追溯到2011年底,在這段時間內(nèi),我們將 Python 的熱度增長對比其他五種主要編程語言。(注意,這比 Trends 工具的時間范圍短,Trends 可追溯到2008年)。包括的編程語言為目前高收入國家中十大 Stack Overflow 訪問標簽中的六個; 我們沒有包括的四個是 CSS,HTML,Android 和 JQuery。
2017 年 6 月,Python 第一次成為高收入國家在 Stack Overflow 訪問量最多的標簽。當中,Python 是美國和英國訪問量最大的標簽,在其他高收入國家 Python 訪問量為前兩名(除 Java 或 JavaScript 之外)。這是令人印象深刻的,因為在 2012 年,Python 的訪問量還低于其他五種語言,如今比當時增長了 2.5 倍。
部分原因是由于 Java 的季節(jié)性流量特征。由于 Java 在本科教育中比重較大,因此在春秋季 Java 流量上升,夏季則下降。到今年年底它會再次趕超 Python 嗎?我們可以嘗試使用 “STL” 模型預(yù)測未來兩年的增長情況,該模型將增長與季節(jié)趨勢相結(jié)合,以預(yù)測語言的未來價值。
根據(jù)該模型,在秋天 Python 可能會保持領(lǐng)先地位,亦或者會被 Java 超越(大致處于模型預(yù)測的變化范圍之內(nèi))。但在 2018 年,Python 顯然會成為最受歡迎的標簽。根據(jù) STL,與過去兩年一樣,JavaScript 和 Java 在高收入國家中將保持相似的流量。
哪些標簽的增長速度最快?
以上只包括了六種最受歡迎的編程語言。那么在其他值得注意的技術(shù)中,哪些技術(shù)在高收入國家中增長最快呢?
我們根據(jù) 2017 年至 2016 年的流量比例對增長率進行了定義。在分析中,我們決定僅考慮編程語言(如 Java 和 Python)和平臺(如 iOS,Android,Windows 和Linux),而不考慮如 Angular 的框架或如 TensorFlow 的庫(盡管其中許多增長顯著,我們在之后的研究中將涉及)。
由于在圖表中難以定義“增長最快”,我們將增長量與總體平均值進行比較。
以 27% 的年增長率,Python 成為流量大且增長迅速的標簽 ; 第二名是 R 語言。在高收入國家中大多數(shù)其他標簽的流量增長保持穩(wěn)定,Android,iOS 和 PHP 的訪問量則略有下降。還可以注意到,在函數(shù)式編程語言中,Scala 所占比重最大并不斷增長,而 F# 和 Clojure 所占比重較小增長率縮小,Haskell 比重居中,且增長保持穩(wěn)定。
上圖中有個遺漏的部分:去年,關(guān)于 TypeScript 問題的流量增長達到驚人的142%,為了避免給數(shù)據(jù)帶來的影響我們未將其列入其中。我們還可以看到,還有一些語言的增長速度與 Python 類似或者更快(如 R 語言,Go 和 Rust),并且還有許多標簽(如 Swift 和 Scala)也呈現(xiàn)令人印象深刻的增長。那么與 Python 相比,這些語言的流量增長隨著時間呈現(xiàn)什么特點呢?
如 R 語言和 Swift 等語言的發(fā)展確實令人印象深刻,而且在較短的時間內(nèi) TypeScript 也顯示出非??焖俚脑鲩L。許多使用量較小的語言,在軟件生態(tài)系統(tǒng)中的增長顯著。但如圖所示,當標簽一開始比重較小時,更容易顯示出快速的增長。
我們并不是說這些語言在一定程度上在與 Python 競爭。相反,在這里要說明的是為什么要單獨把這些語言的增長量放到其他類別中; 一開始這些語言都為流量較小的標簽。而 Python 則一個不尋常的例子,它既是 Stack Overflow 中最受歡迎的標簽之一,也是增長最快標簽的之一。(同時它也在加速增長!自 2013 年以來,Python 的增長速度在逐年加速)。
世界其他地區(qū)
到目前為止,在本文中我們一直在分析高收入國家的編程語言趨勢。那么在印度,巴西,俄羅斯和中國其他等國家,Python 的增長情況是否也是如此呢?
確實如此。
在高收入國家之外的國家,Python 仍然是增長最快的主要編程語言; 開始它的比重較低,兩年后才開始增長(2014 年而不是 2012 年)。事實上,非高收入國家中Python 的年增長率速略于高收入國家。本文中我們沒有涉及到,而其使用率與國內(nèi)生產(chǎn)總值為正相關(guān)的R語言也在增長。
本文關(guān)于高收入國家中的程序語言增長和下降的許多結(jié)論都適用于世界其他地區(qū); 兩個部分增長率之間的斯皮爾曼等級相關(guān)系數(shù)為 0.979。在某些情況下,我們可以看到類似 Python “滯后”的現(xiàn)象,一般來說一項技術(shù)在高收入國家中被廣泛采用,一兩年后才會才在世界其他地區(qū)擴張。(這是一個有趣的現(xiàn)象)
結(jié)語
我們并不想挑起爭論哪種編程語言更好的所謂“語言戰(zhàn)爭”。一種語言的用戶數(shù)量并不意味著它的質(zhì)量,當然也不能說明哪種語言更適合某種特定的情況。但是從這個角度而言,我們應(yīng)該了解開發(fā)者生態(tài)系統(tǒng)的語言構(gòu)成,以及該生態(tài)系統(tǒng)是如何變化的。
本文表明了在過去的 5 年中,Python 已經(jīng)顯示出驚人的增長,尤其是在高收入國家中。之后我們將探索當中的原因。我們將按國家和行業(yè)對增長情況進行劃分,并分析哪些技術(shù)會與 Python 一起使用(例如,我們會分析 Python 的增長量中哪些是來自 web 開發(fā),哪些是來自數(shù)據(jù)科學(xué))。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10