
作者:梁唐
來源: 早起Python
早起導讀
今天這篇文章咱們來聊聊這個問題。對于我來說python的應用場景主要是機器學習、深度學習相關,對于其他的場景涉獵不多。因此本文的目的并不是列舉出一系列小項目給你們練手,而是希望引導大家思考這個問題,從而找到適合自己的練習項目。
python的誤區(qū)
不知道各位初學者如何看待Python這一門語言,又是如何看待程序員的技能,根據(jù)我的理解, 這當中可能存在一些誤解。其實不論哪一門語言的應用場景可能都不只是一個方向,往往是多個方向,尤其是Python這種比較成熟并且廣受歡迎的語言,它在許多領域都有很高的建樹,這就導致了Python可以做的事情非常多,相應的要學習的東西也就非常多。
也許在新手看來一個比較厲害的Python使用者,應該是所有技術(shù)通殺的,對于python的方方面面都非常了解。然而很遺憾,這是非常困難或者說幾乎是不可能的。困難的原因也是很簡單的,因為人的精力是有限的,想要在一個領域做到優(yōu)秀就已經(jīng)非常不容易,需要學習大量技術(shù)和知識了,更何況掌握所有方向。所以大家對于這樣一個問題,應該有一個清晰的答案,對于Python這樣一門語言,你們學習它的目的究竟是什么?
也許你有很多個答案,但是很遺憾,對于你未來職業(yè)發(fā)展來說,你可能只能選擇其中一個。
方向選擇
如果你玩過暗黑破壞神、魔獸世界或者是類似的RPG游戲的話,那么你對于選擇職業(yè)這個問題應該非常了解。在我們剛進入游戲或者是進入游戲不久,我們就需要面臨一次職業(yè)選擇,職業(yè)一旦選擇往往不可更改,你就需要在這個職業(yè)一直玩下去,如果想要換職業(yè)只有從頭開始,重新玩一個新的號。
在職場當中和游戲是非常類似的,我們最終也需要選擇我們的職業(yè),并且我們只能選擇一個崗位,輕易也是不能更改的。如果要更改,需要從頭開始,之前累積的經(jīng)驗會全部清零。因為不同崗位對于能力的要求是完全不同的,所以對于初學者而言,其實也會面臨這么一個選擇,只不過這個選擇是隱形的,當你選擇崗位進行投遞簡歷的時候,這個選擇就潛移默化的發(fā)生了。
Python常用的基礎語法并不多,在我們之前的文章當中幾乎涵蓋了大半。當我們完成了這部分學習之后,單單學習語法已經(jīng)沒有出路了。再接下來進階就必須要學習一些應用上的內(nèi)容,也就是要面臨一個技術(shù)選型了。
對于Python而言,一般常見的方向有這么幾種:web開發(fā)、機器學習、網(wǎng)絡爬蟲、運維、游戲開發(fā)。
下面我簡單介紹一下這幾個方向,大家可以對照一下自己的興趣,選擇一個自己感興趣或者是比較適合的。
Web開發(fā)
Web開發(fā)應該是當下最普遍的程序員的工作崗位了,Python在web上的應用主要是web的后端開發(fā),也就是負責服務器邏輯處理這個部分。
我們都知道在后端這個領域目前國內(nèi)最吃香的語言應該是Java,幾乎大半的公司都是使用Java作為后端語言。Java之后的其他幾門語言我也難分伯仲,簡單列舉一下有新興的Go,有古老的PHP,當然還有Python,還有已經(jīng)幾乎絕跡的C++和C#。Python在這個領域當中應該只能算是不算特別小眾,總體來說還是偏小眾的。
小眾的原因和Python本身的特性有關,因為Python是解釋型語言,而不是編譯型語言。所以和Java、Go這種編譯型語言相比,在性能上天然就要劣勢。并且由于Python全局鎖的限制,導致了Python多線程在計算密集型的并發(fā)場景當中表現(xiàn)非常糟糕,所以很少有大公司會使用Python作為后端主力語言。據(jù)我了解國內(nèi)知名一些的應該只有豆瓣、知乎,國外的有YouTube,但據(jù)說有些已經(jīng)遷移到其他語言了,有的已經(jīng)有相應的遷移計劃了。
Python在后端的主要優(yōu)勢在于敏捷,也就是開發(fā)效率比較高。Python的Django、Falsk等框架還是非常完善以及好用的,我們可以很快地從零開始搭建出一個像樣的后端來,并且迭代的速度也很快。所以對于一些需要小步快跑對于性能要求不高的小公司,可能會選擇Python,也就是大公司幾乎不會選擇Python作為Web后端的開發(fā)語言,技術(shù)棧也必然完全不同。
如果你需要選擇這個方向,那么你除了要學習Python后端開發(fā)的相關知識,比如Django、Flask等框架之外,對于計算機網(wǎng)絡以及前端也需要一定的了解,這些也是后端工程師的必修課。
總體來說,Python后端這個發(fā)展方向相對比較平坦,后期發(fā)力的難度比較大,天花板比較低。學習難度和Java后端相比可能要稍微簡單一些,就業(yè)壓力應該也還好,相關的崗位雖然不太多但也不會太少。
如果要選擇這個領域的話,可以選擇一些比較常規(guī)的項目作為入門的項目。比如搭建一個個人博客,或者是XX管理系統(tǒng),等這些熟練了之后就可以學習更多其他的工具庫了,比如數(shù)據(jù)庫ORM框架、kafka、redis等這些常用的中間件。把這些內(nèi)容再結(jié)合到web當中,創(chuàng)建出新的項目。等這一塊也差不多了,接下來就可以研究研究架構(gòu)設計、設計模式等等進階的內(nèi)容了。
這個領域我相對比較了解一些,對于機器學習來說,Python目前是妥妥的主力語言。早年還能看到一些使用R來做機器學習的工程師,目前已經(jīng)幾乎看不到了,幾乎是清一色的Python。但是老實說機器學習當中Python只是起到膠水語言的作用,幾乎所有核心的實現(xiàn)邏輯都不是Python支撐的。
在機器學習當中對于Python原生的內(nèi)容要求非常普通,只需要會基本的語法,了解迭代器、生成器幾乎就足夠了。因為大部分內(nèi)容都是通過框架或者是工具來實現(xiàn)的,Python只是把這些邏輯粘合到一起而已。這個方向的從業(yè)者的技能點在Python上的非常少,大部分都在機器學習的相關理論、一些庫工具的使用、深度學習框架的使用、數(shù)據(jù)處理方面的經(jīng)驗。
并且機器學習本身就是一個比較大的領域,它也有很多方面的應用。比如搜索、廣告、推薦這些傳統(tǒng)的應用場景,以及CV(計算機視覺)、NLP(自然語言處理)、風控等等比較新一些的領域。所以選擇了機器學習這個大方向,并且完成了基礎知識的學習之后,還是要再面臨一次選擇的,因為還需要選擇進一步細分的小方向。根據(jù)我個人的經(jīng)驗來說它們的發(fā)展前景是推薦、搜索、廣告 > NLP > CV > 風控,這只是我個人的判斷,僅供大家參考。
機器學習這個方向整體來說前景是非常不錯的,目前幾乎大中小型的公司都有機器學習或者是深度學習的崗位。雖然崗位多,但是競爭并不低,因為想要涌進來的人實在是太多了。尤其是這兩年AI火熱,大量的人想要擠進這個行業(yè)中來,所以招聘門檻還是不低的。
如果你想要選擇這個方向的話,只需要基本的Python語法即可,但是需要對機器學習這個領域有著比較深入的學習。比如機器學習的核心概念、常用的一些模型、數(shù)據(jù)處理的一些方法、模型效果的評估標準等等。等對機器學習的理解足夠了,就可以找kaggle、天池大數(shù)據(jù)等一些比賽來實戰(zhàn)一下。
Python爬蟲
爬蟲這個方向大家也不陌生,很多人應該看過一些相關的負面新聞,比如竊取用戶隱私或者是竊取了某某公司的數(shù)據(jù)等等。實際上爬蟲的本質(zhì)是利用程序模擬人工對網(wǎng)頁進行訪問,從而將網(wǎng)頁當中相關有價值的信息存儲下來。
Python由于語法簡單,并且網(wǎng)絡相關的工具庫非常完善,而且不需要經(jīng)過編譯就可以直接運行。更重要的一點是Python的全局鎖在網(wǎng)絡請求這種IO密集型的場景當中非常合適,并不會影響效率。而且Python可以很方便的整合其他語言的功能以及特性,使得Python做爬蟲非常合適,以至于市面上大部分的爬蟲工程師都是以Python為語言開發(fā)的。并且現(xiàn)在也衍生了許多分布式爬蟲的框架和工具。
由于大家都使用爬蟲,而一些大公司不愿意自己的相關信息被競爭對手獲取了去。舉個例子,假設某東把淘寶所有的商品信息都爬取了下來,然后針對性的降價來強行吸引用戶,那么顯然對于淘寶是一個打擊。為了防止類似以及其他不利于公司的情況出現(xiàn),這些大公司都會設置一些反爬蟲的機制。比如在請求來臨時會判斷是否是機器人,或者是會限制一個ip最多訪問的商品數(shù)量等等。
既然有反爬機制,那么自然也有破除反爬機制的機制。所以公司里真正爬蟲工程師往往的日常工作就是和一些大公司的反爬工程師斗智斗勇。你設置了這個反爬機制,我就想一個辦法來破除。明天你發(fā)現(xiàn)了我的方法做了修補,我再繼續(xù)想辦法……并且在編寫爬蟲之前,需要做大量網(wǎng)頁的分析,找到網(wǎng)頁或者是應用中數(shù)據(jù)的源頭api。有些公司會把api隱藏起來,或者是需要一定的校驗才能訪問,那么就需要設置一些方法針對性的破除之后才能使用爬蟲。
有些人不喜歡這種斗智斗勇很多,開發(fā)時間很少的工作,而有些人就樂此不疲,大家可以對照一下自身的情況做一個選擇。如果想要選擇這個方向的話,可以從一些公開的沒有設置反爬機制的數(shù)據(jù)開始,學習一些目前比較先進的爬蟲框架,之后再一步步提升難度,去試著破除大公司的反爬機制,成為一個優(yōu)秀的爬蟲工程師。
運維和游戲開發(fā)
老實講這兩個領域我的了解實在是不多,所以硬著頭皮簡單說說,水平有限,如果有錯誤還請大家海涵。
運維在我們都知道就是負責維護機房機器環(huán)境、項目發(fā)布上線等工作的,由于現(xiàn)在公司用到的機器的數(shù)量越來越多,整個發(fā)布以及維護的流程也就越來越麻煩。之前極其少的時候還可以人工一臺一臺搞定,現(xiàn)在機器多了還使用人工來干顯然就不現(xiàn)實了。為了解決這個問題,所以現(xiàn)在先進的運維會使用Python編寫腳本,來批量操作機器安裝環(huán)境或者是發(fā)布項目等等。
說白了其實也是把Python當成是腳本語言這樣的工具來使用,核心的能力其實還是偏在Linux命令、操作系統(tǒng)、分布式集群這一個部分。對于運維這個領域,我個人感覺和機器學習差不多,Python只是純工具,大家想要入門項目的話,可能還是要以運維相關的技能為主,使用Python來作為工具輔助。
游戲開發(fā)我稍稍了解一點,之前用Python做過一些簡單的小游戲。Python當中的pygame非常好用,編寫小游戲非常合適。并且Python也可以接入Unity,github里能搜到不少使用Python做出來的游戲。但是有沒有游戲公司招聘Python程序員來進行游戲開發(fā)我就不清楚了,畢竟不是做這個行業(yè)的,但至少大家做一些小游戲來自娛自樂肯定還是沒問題的。如果要練手的話可以考慮做一個2048,doodle jump這些比較簡單的小游戲。
小結(jié)
如果只是尋找Python的新手入門項目,網(wǎng)上隨便搜索一下出來的結(jié)果是非常多的。但是這并沒有太多的意義,因為這些項目并不一定適合每一個人。而在明確自己想要從事的方向之前,合適與不合適也無從談起,所以希望大家都可以先明確自己的方向,之后再找到對應的進階道路則要容易得多。所以如果你之前只是想要學好Python這門語言,但是又沒有考慮過方向相關的話,我建議你可以思考一下這方面的問題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10