
互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代,程序員成了公認(rèn)的高薪工作,是眾多企業(yè)的搶手人才。但凡大學(xué)專業(yè)沾邊計(jì)算機(jī)的理科生,都有機(jī)會(huì)去競逐一下互聯(lián)網(wǎng)大廠的高薪崗位。
數(shù)據(jù)時(shí)代,數(shù)據(jù)人才就像之前的程序員成了企業(yè)的「香餑餑」,互聯(lián)網(wǎng)大廠又開始招募大量數(shù)據(jù)崗位,根據(jù)《2020中國數(shù)字化人才現(xiàn)狀與展望》報(bào)告顯示,數(shù)據(jù)人才的需求在不斷增加:
數(shù)據(jù)人才的崗位薪資也高于普通白領(lǐng)平均薪資:
面對(duì)這么大好的形勢(shì),這次難道沒咱們文科生什么事情了嗎?「我讀的文科,我讀的商科,我數(shù)學(xué)不好,我能學(xué)數(shù)據(jù)分析嗎?」這也是我們被問的最多的問題之一。
其實(shí)文科生已經(jīng)意識(shí)到自己的競爭對(duì)手會(huì)是數(shù)學(xué)好的理科生,所以他們的問題細(xì)化成兩個(gè)就是:
· 如果不是計(jì)算機(jī)或者數(shù)學(xué)統(tǒng)計(jì)相關(guān)專業(yè),他就不能做數(shù)據(jù)分析嗎?
· 想轉(zhuǎn)行數(shù)據(jù)分析師,應(yīng)該學(xué)哪些技能或者編程語言?
我們根據(jù)服務(wù)過7萬學(xué)生的經(jīng)驗(yàn),總結(jié)了三個(gè)關(guān)鍵,幫助文科、商科專業(yè)的學(xué)生成功找到數(shù)據(jù)好工作:
· 找對(duì)求職途徑
· 找準(zhǔn)就業(yè)企業(yè)
· 找好學(xué)習(xí)方法
進(jìn)入一家公司一般有兩種途徑——常規(guī)的人力資源(HR)途徑和內(nèi)推途徑。HR途徑就是通過招聘人員、公司招聘網(wǎng)站、招聘系統(tǒng),或者申請(qǐng)實(shí)習(xí)來找到工作;而內(nèi)推途徑則是通過招聘經(jīng)理或者公司的現(xiàn)任員工來推薦申請(qǐng)工作。
HR途徑上會(huì)根據(jù)硬性的專業(yè)要求、學(xué)歷要求進(jìn)行篩選,可能在你被面試之前,傳統(tǒng)的HR途徑因?yàn)槟銢]有數(shù)學(xué)統(tǒng)計(jì)或計(jì)算機(jī)學(xué)位而剔除你。但在內(nèi)推途徑中,你通常能夠直接地與決定是否錄用你的人以及最終與你共事的人或團(tuán)隊(duì)打交道。
對(duì)于那些只擁有市場(chǎng)營銷教育背景的求職者來說,獲得一份數(shù)據(jù)科學(xué)家工作的最佳途徑就是選擇內(nèi)推。
在BOSS直聘上以「數(shù)據(jù)」為關(guān)鍵詞搜索,得到北京地區(qū)的前3226個(gè)熱門崗位,我們可以看到:
3.1 最熱門的崗位
數(shù)據(jù)分析師,是招聘職位里面最熱門的,其次是大數(shù)據(jù)開發(fā)工程師、數(shù)據(jù)產(chǎn)品經(jīng)理,說明在產(chǎn)品經(jīng)理領(lǐng)域,數(shù)據(jù)的應(yīng)用也是非常廣泛。
3.2 薪酬水平
數(shù)據(jù)相關(guān)崗位的薪酬集中在月薪20-50K之間,部分高薪的可以到月薪50-100K,比如BOSS直聘就在北京以80-100K,16薪,招分布式存儲(chǔ)計(jì)算平臺(tái)專家,但要求是10年以上的工作經(jīng)驗(yàn),不要被這個(gè)工作經(jīng)驗(yàn)嚇到,看看接下來的統(tǒng)計(jì)。
3.3 工作經(jīng)驗(yàn)的要求
我們可以看到工作經(jīng)驗(yàn)的要求還是集中在1-3年,3-5年,其中經(jīng)驗(yàn)不限的也占了較大比重,所以有志于從事數(shù)據(jù)行業(yè)的,可以大膽的嘗試,這個(gè)行業(yè)很開放,另一個(gè)佐證就是下面的學(xué)歷。
3.4 學(xué)歷要求
本科是要求最多的,因此擔(dān)心學(xué)歷是不是必須要碩士的可以放心,數(shù)據(jù)告訴你:本科就滿足大部分企業(yè)的要求。
3.5 招聘企業(yè)
從數(shù)據(jù)來看,在北京對(duì)于數(shù)據(jù)人才需求最大的企業(yè)是京東,接下來是滴滴、理想汽車。
3.6 最需要的技能
SQL、Python,數(shù)據(jù)分析,是這些數(shù)據(jù)崗位要求最多的技能。這些技能要怎么掌握,學(xué)習(xí)方法就至關(guān)重要了。
并不是所有想往數(shù)據(jù)方向發(fā)展的人都已經(jīng)從事過數(shù)據(jù)相關(guān)的工作,但每個(gè)人都可以將自己曾經(jīng)做過的數(shù)據(jù)相關(guān)的項(xiàng)目整理到一起,以此來展示自己在數(shù)據(jù)領(lǐng)域的工作能力。如果你做過一些很不錯(cuò)的項(xiàng)目,并且將它們展示在你的github或簡歷上,這將大大提高你找到工作的機(jī)會(huì)。
4.1 如何選擇一個(gè)好的項(xiàng)目呢?
關(guān)于數(shù)據(jù)項(xiàng)目的選擇,最重要的事情之一是它需要是非常有針對(duì)性且具有行業(yè)獨(dú)特性。項(xiàng)目內(nèi)容越具體、越緊密聯(lián)系某個(gè)你感興趣的行業(yè),你就能越好地解釋這個(gè)項(xiàng)目的意義。
選擇的項(xiàng)目應(yīng)該符合下列兩個(gè)類別之一(或者兩者都包括):
(1)這個(gè)項(xiàng)目是針對(duì)你想進(jìn)入的某個(gè)行業(yè)或某份工作設(shè)計(jì)的——做這類項(xiàng)目可以證明你為什么要申請(qǐng)某個(gè)特定的職位。這還說明你對(duì)可能從事的領(lǐng)域已有了潛在的了解。
(2)這個(gè)項(xiàng)目對(duì)你來說是有趣的、有熱情的——當(dāng)你面試時(shí),面試官談?wù)撈疬@段經(jīng)歷,這一點(diǎn)熱情就會(huì)變得很明顯。當(dāng)候選人對(duì)自己做過的項(xiàng)目感到自豪時(shí),面試官是可以明顯感受到候選人在被問到該項(xiàng)目時(shí)的那份激情的。
4.2 學(xué)習(xí)數(shù)據(jù)技能的最佳路徑——「以終為始」的項(xiàng)目學(xué)習(xí)
你選擇的項(xiàng)目應(yīng)該大致遵循以下這樣一個(gè)流程,并且在做完項(xiàng)目后你需要能夠詳細(xì)地描述當(dāng)中的每個(gè)步驟。
Step 1: 解決一個(gè)實(shí)際數(shù)據(jù)問題——以終為始,課程的最后是怎么的項(xiàng)目?項(xiàng)目背景是什么?是出于什么原因要去做這個(gè)項(xiàng)目?(商業(yè)問題舉例:希望通過歷史數(shù)據(jù)評(píng)估營銷渠道的效果,以此為明年的營銷預(yù)算分配提供建議)
Step 2: 數(shù)據(jù)收集——好的項(xiàng)目要有數(shù)據(jù)收集的過程,既可以是直接從數(shù)據(jù)源下載數(shù)據(jù)集,或者是從某個(gè)渠道去使用API爬取。(例如使用python從Twitter上獲取tweets相關(guān)的數(shù)據(jù)。)
Step 3: 數(shù)據(jù)清洗和聚合——這一步實(shí)在太重要了。沒有這一步的項(xiàng)目都不是“貼合實(shí)際工作情況“的好項(xiàng)目。它是數(shù)據(jù)科學(xué)中最重要的一步。對(duì)數(shù)據(jù)格式的處理和清洗會(huì)對(duì)最終分析的結(jié)果產(chǎn)生非常大的影響。你需要通過項(xiàng)目去完全了解你在處理數(shù)據(jù)時(shí)做出決策的原因,比如如何處理缺失值,如何選擇或提出某些變量特征,以及如何處理異常值等等。(例如某些天因?yàn)榧夹g(shù)問題,無法收集到營銷支出的數(shù)據(jù)。)
Step 4: 變量探索——這部分對(duì)于一個(gè)好項(xiàng)目來說也非常重要。因?yàn)樵谶@部分分析中,你要去審視每一個(gè)變量的特點(diǎn)。你需要深入研究每個(gè)變量(或者叫特征)的分布,并評(píng)估這些特征之間的關(guān)系。為了顯示這些關(guān)系,你需要使用諸如箱線圖、直方圖、相關(guān)性圖等視覺效果。這一過程有助于告訴你哪些變量和數(shù)據(jù)可以幫助你解答你想要解決的商業(yè)問題。(例如顯示每天不同渠道的營銷費(fèi)用的分布圖,每天的平均花費(fèi)。)
Step 5: 數(shù)據(jù)探索性分析——在這一步,你開始利用數(shù)據(jù)來探索趨勢(shì)??梢允褂?a href='/map/shujutoushibiao/' style='color:#000;font-size:inherit;'>數(shù)據(jù)透視表來了解變量和變量之間隨著時(shí)間變化而變化的趨勢(shì)。可視化的工具也應(yīng)該在這一環(huán)節(jié)的分析中被大量運(yùn)用。與前面一步非常相似,這一步也是幫助你來了解在模型中要放入哪些變量。(例如每個(gè)品牌每天的銷量、營銷支出與銷售量之間的散點(diǎn)圖,等等)
Step 6: 特征工程(或叫變量轉(zhuǎn)換transformation)——這一步的分析非常重要(所以我將其單獨(dú)列為一步),然而它通常應(yīng)與數(shù)據(jù)分析(Step 5)同時(shí)進(jìn)行。特征工程分為兩種:
(1)創(chuàng)建可以提高預(yù)測(cè)準(zhǔn)確性的新特征變量;
(2)改變數(shù)據(jù)的性質(zhì),使其更適合進(jìn)行量化分析。好的項(xiàng)目會(huì)教你,在構(gòu)建新特征變量時(shí)如何充分發(fā)揮創(chuàng)造性。你可以使用其他數(shù)據(jù)進(jìn)行各種形式的組合,把數(shù)據(jù)的屬性從數(shù)值轉(zhuǎn)換成類別(或者反過來),亦或是對(duì)某一特征變量應(yīng)用一個(gè)變形的函數(shù)。(比如,相比直接顯示每一天的絕對(duì)數(shù)值,你可以利用這一天的數(shù)據(jù)除以一段時(shí)間內(nèi)的平均值,來創(chuàng)造出可以展示相對(duì)概念的變量。)
Step 7: 模型的構(gòu)建和評(píng)估——你應(yīng)該要比較多個(gè)模型,以確定哪個(gè)模型對(duì)于你需要解決的問題能給出最合理的解釋和結(jié)果。通過使用訓(xùn)練集和測(cè)試集對(duì)模型進(jìn)行交叉驗(yàn)證,你可以看出哪一模型對(duì)預(yù)測(cè)結(jié)果準(zhǔn)確率更高。同時(shí)你還應(yīng)該特別注意如何去評(píng)估模型好壞,能夠解釋為什么你選擇這些評(píng)估指標(biāo)。
(例如比較一個(gè)隨機(jī)森林、lasso回歸和支持向量機(jī)回歸模型來預(yù)測(cè)產(chǎn)品銷量。)
Step 8: 將模型結(jié)果進(jìn)行應(yīng)用(Optional)——如果面試官看到候選人將她的模型投入運(yùn)用進(jìn)了一個(gè)真實(shí)的網(wǎng)頁或API,這會(huì)讓人印象很深刻。這表明候選人可以使用更高級(jí)的編程技術(shù)或編程包。我個(gè)人偏愛使用python,但是我也看到過其他人把R使用得爐火純青。(例如在你可以創(chuàng)建一個(gè)R Shiny Project,通過對(duì)預(yù)測(cè)指標(biāo)給予不同的假設(shè)來預(yù)測(cè)銷量。)
Step 9: 回顧與展示——你需要回顧你做過的項(xiàng)目,看看在項(xiàng)目過程中遇到了哪些困難,通過什么方法解決,哪些地方可以做得更好,并不是所有項(xiàng)目都可以從始到終進(jìn)行得很完美)這些都將是你在面試中回答行為問題的寶貴素材。我還建議你可以根據(jù)當(dāng)前項(xiàng)目的發(fā)現(xiàn)和洞察來思考和開啟下一個(gè)項(xiàng)目的主題。(例如我應(yīng)該在這個(gè)分析中考慮如何自動(dòng)化一些比較手動(dòng)的流程,是否可以找到其他一些指標(biāo)來提高模型準(zhǔn)確率。)
如果你是“非計(jì)算機(jī)或者數(shù)學(xué)統(tǒng)計(jì)專業(yè)背景”的數(shù)據(jù)崗位求職者,那么就像上文所說的,你應(yīng)該遵循以下步驟:
· 找對(duì)求職途徑——找人內(nèi)推,而不只是給HR投簡歷。
· 找準(zhǔn)就業(yè)企業(yè)——去有著更多數(shù)據(jù)的公司,走上你的數(shù)據(jù)成長之路
· 找好學(xué)習(xí)方法——去學(xué)習(xí)一套完整的數(shù)據(jù)技能,做有針對(duì)性的數(shù)據(jù)項(xiàng)目。
CDA數(shù)據(jù)分析師按照CDA認(rèn)證標(biāo)準(zhǔn)打造的《敏捷算法建模訓(xùn)練營》,完全符合一個(gè)優(yōu)秀的項(xiàng)目的9大必備條件!攜手全球領(lǐng)先的咨詢公司首席數(shù)據(jù)科學(xué)家,真實(shí)還原企業(yè)常見的數(shù)據(jù)科學(xué)項(xiàng)目,致力于培養(yǎng)優(yōu)秀的數(shù)據(jù)科學(xué)家!項(xiàng)目經(jīng)歷可放在簡歷上提升履歷背景。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03