
作者 | Admond Lee
翻譯 | Mika
本文為 CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)
你想成為一名數(shù)據(jù)科學(xué)家?很棒,說(shuō)明你是很有上進(jìn)心的人,而且對(duì)數(shù)據(jù)科學(xué)充滿熱情,并希望通過(guò)解決復(fù)雜的問(wèn)題為公司帶來(lái)價(jià)值。但是你在數(shù)據(jù)科學(xué)方面毫無(wú)經(jīng)驗(yàn),也不知道如何開(kāi)始。我很懂你,因?yàn)樵?jīng)我也是如此。本文就是特別針對(duì)熱情且有抱負(fù)的數(shù)據(jù)科學(xué)家,解答進(jìn)入該領(lǐng)域最常見(jiàn)的問(wèn)題和挑戰(zhàn)。
我希望通過(guò)分享我自己的經(jīng)驗(yàn),幫助你了解入科從事數(shù)據(jù)科學(xué)的職業(yè),并為你提供一些指南,讓你的學(xué)習(xí)之旅更加愉快。讓我們開(kāi)始吧!
數(shù)據(jù)科學(xué)人才缺口
根據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),2020年全球大數(shù)據(jù)和業(yè)務(wù)分析收入將超過(guò)2100億美元。
根據(jù)LinkedIn 與2018年8月發(fā)布的美國(guó)勞動(dòng)力報(bào)告, 2015年美國(guó)的數(shù)據(jù)科學(xué)人才過(guò)剩。三年后,隨著越來(lái)越多公司面臨數(shù)據(jù)科學(xué)技能人才的短缺,這一趨勢(shì)發(fā)生了巨大變化。越來(lái)越多的公司開(kāi)始使用大數(shù)據(jù)得出分析見(jiàn)解和制定決策。
從經(jīng)濟(jì)角度講,這完全取決于供需關(guān)系。
好消息是:形勢(shì)以及發(fā)生了轉(zhuǎn)變。壞消息是:隨著數(shù)據(jù)科學(xué)領(lǐng)域的就業(yè)機(jī)會(huì)不斷增加,但很多有抱負(fù)的數(shù)據(jù)科學(xué)家由于技能不符合市場(chǎng)的需求,而難以找到心儀的工作。
在接下來(lái)的部分中,你將看到該如何提高數(shù)據(jù)科學(xué)技能,從而在大量求職者中脫穎而出,最終收獲夢(mèng)想的工作。
終極指南
1.需要哪些技能以及如何掌握?
說(shuō)實(shí)話,要掌握數(shù)據(jù)科學(xué)領(lǐng)域所有技能幾乎是不可能的,因?yàn)榉秶珡V了??傆幸恍┘夹g(shù)是數(shù)據(jù)科學(xué)家沒(méi)有掌握的,因?yàn)椴煌臉I(yè)務(wù)需要不同的技能。
但有一些核心技能是數(shù)據(jù)科學(xué)家所必須掌握的。
技術(shù)能力,數(shù)學(xué)和統(tǒng)計(jì)學(xué),編程和商業(yè)知識(shí)。盡管無(wú)論使用何種語(yǔ)言,編程能力都是必備的。作為數(shù)據(jù)科學(xué)家,我們應(yīng)該運(yùn)用商業(yè)溝通能力想企業(yè)高層說(shuō)明模型結(jié)果,同時(shí)基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的支持。
數(shù)學(xué)和統(tǒng)計(jì)學(xué)
關(guān)于數(shù)學(xué)和統(tǒng)計(jì)學(xué),可以查看Randy Lao的相關(guān)文章,當(dāng)中的資源非常豐富。
https://medium.com/@randylaosat
當(dāng)我剛開(kāi)始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),我讀了這本書(shū) An Introduction to Statistical Learning?—?with Applications in R(統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論 - 與R中的應(yīng)用)。我強(qiáng)烈推薦這本書(shū)給初學(xué)者,因?yàn)楸緯?shū)側(cè)重于統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)的基本概念,并提供詳細(xì)而直觀的解釋。如果你特別喜歡數(shù)學(xué),也許你更喜歡這本書(shū):The Elements of Statistical Learning(統(tǒng)計(jì)學(xué)習(xí)中的元素)。
編程
關(guān)于學(xué)習(xí)編程,特別是對(duì)于沒(méi)有經(jīng)驗(yàn)的初學(xué)者,我建議專(zhuān)注于學(xué)習(xí)一種語(yǔ)言,我個(gè)人更喜歡Python,因?yàn)镻ython更容易學(xué)習(xí)。關(guān)于Python或R哪種語(yǔ)言更好一直都存在爭(zhēng)論,我個(gè)人認(rèn)為重點(diǎn)應(yīng)放在如何幫助企業(yè)解決問(wèn)題,而不是使用哪種語(yǔ)言。
商業(yè)知識(shí)
最后,我要強(qiáng)調(diào)的是對(duì)商業(yè)知識(shí)的理解也是至關(guān)重要的。
軟技能
事實(shí)上,軟技能比硬技能更重要。在LinkedIn詢問(wèn)了2000名商業(yè)領(lǐng)袖,我們發(fā)現(xiàn)2018年他們最希望員工具備的軟技能包括:領(lǐng)導(dǎo)力、溝通能力、合作能力和時(shí)間管理能力。我認(rèn)為這些軟技能在數(shù)據(jù)科學(xué)家的日常工作中起著至關(guān)重要的作用。
2.如何選擇合適的訓(xùn)練營(yíng)和在線課程?
隨著人工智能和數(shù)據(jù)科學(xué)的興起,大量課程課程、訓(xùn)練營(yíng)如雨后春筍般涌現(xiàn),都不希望錯(cuò)失良機(jī)。
因此問(wèn)題來(lái)了,該如何選擇適合你的學(xué)習(xí)資源呢?
我的選擇方法如下:
沒(méi)有一門(mén)課程能涵蓋你需要的所有資源。有些課程在某些方面是重疊的,因此不值得花錢(qián)購(gòu)買(mǎi)不同但有重復(fù)性的課程。
首先要知道你需要學(xué)什么。不要因?yàn)榛ㄉ诤臀说臉?biāo)題就盲目選擇課程。通過(guò)查看求職網(wǎng)站上數(shù)據(jù)科學(xué)家的職位描述,你會(huì)發(fā)現(xiàn)一些公司需要的通用技能。然后通過(guò)了解自己缺乏的技能去搜索相應(yīng)課程。
比較不同平臺(tái)提供的優(yōu)質(zhì)課程。類(lèi)比幾個(gè)課程,并且查看其他人的評(píng)論(非常重要?。A硪环矫?,Coursera、Udemy、Lynda、Codecademy、DataCamp、Dataquest等平臺(tái)也提供許多免費(fèi)課程。
以下是我個(gè)人特別喜歡的一些課程:
1.Machine Learning ,主講人: Coursera的聯(lián)合創(chuàng)始人吳恩達(dá)
2.Python for Data Science and Machine Learning Bootcamp,主講人 :Jose Portilla
3.Deep Learning A-Z?: Hands-On Artificial Neural Networks,主講人: Kirill Eremenko,Hadelin de Ponteves
4.Python for Data Science Essential Training ,主講人:Lillian Pierson
5.The Ultimate Hands-On Hadoop?—?Tame your Big Data,主講人:Frank Kane
3.能否通過(guò)開(kāi)源學(xué)習(xí)成為數(shù)據(jù)科學(xué)家?
我想說(shuō)的是,通過(guò)開(kāi)源學(xué)習(xí)足以讓你開(kāi)始從事數(shù)據(jù)科學(xué),之后可以根據(jù)業(yè)務(wù)需求進(jìn)一步發(fā)展自己的職業(yè)生涯。
4.對(duì)于零基礎(chǔ)的初學(xué)者有什么推薦的書(shū)籍嗎?
沒(méi)有固定的學(xué)習(xí)途徑,條條大路通羅馬。閱讀相關(guān)書(shū)籍是掌握基礎(chǔ)知識(shí)的良好。
注意不要試圖去記憶具體的數(shù)學(xué)和算法細(xì)節(jié),因?yàn)楫?dāng)應(yīng)用于實(shí)際問(wèn)題進(jìn)行編程時(shí),你可能會(huì)忘記這些內(nèi)容。
你只需了解一定的基礎(chǔ)知識(shí),并繼續(xù)學(xué)習(xí),要?jiǎng)?wù)實(shí)。不要試圖完全了解所有知識(shí),因?yàn)橛袝r(shí)完美主義會(huì)給你的學(xué)習(xí)拖后腿。
關(guān)于Python、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識(shí),我推薦以下書(shū)籍:
Learning Python
Python for Data Analysis
An Introduction to Statistical Learning
Machine Learning for Absolute Beginners
Python Machine Learning
Python Data Science Handbook
Introduction to Machine Learning with Python
Deep Learning with Python
Deep Learning with Keras
5.如何在理解商業(yè)問(wèn)題(制定解決方案)和提高技術(shù)技能(編程、數(shù)學(xué)知識(shí)等)之間取得平衡?
在理解商業(yè)問(wèn)題和制定解決方案之前,我首先去提高自己的技術(shù)技能。
商業(yè)問(wèn)題在于”是什么”和”為什么”。要解決商業(yè)問(wèn)題,首先必須解決問(wèn)題。而技術(shù)技能是注重于”怎么做”。我的建議主要基于個(gè)人經(jīng)驗(yàn)。
6.如何克服開(kāi)啟數(shù)據(jù)科學(xué)家職業(yè)生涯的挑戰(zhàn)?
對(duì)于許多數(shù)據(jù)科學(xué)家來(lái)說(shuō),主要挑戰(zhàn)就是數(shù)據(jù)科學(xué)是信息的海洋。我們可能失去方向,因?yàn)橛刑嗟慕ㄗh和資源,大量的在線課程、研討會(huì)等等,你需要保持專(zhuān)注,知道你擁有什么,你需要什么。
在我的數(shù)據(jù)科學(xué)歷程中,我主要通過(guò)這些方法克服這些挑戰(zhàn):
有效地篩選學(xué)習(xí)資源
在剛開(kāi)始時(shí),我因?yàn)榇罅康馁Y源感到困惑。通過(guò)聽(tīng)數(shù)據(jù)科學(xué)家的播客,閱讀如何開(kāi)啟數(shù)據(jù)科學(xué)領(lǐng)域的文章,嘗試不同在線課程。最終我關(guān)注我在本文中分享的這些優(yōu)質(zhì)資源。
不要放棄
當(dāng)學(xué)習(xí)過(guò)程太過(guò)艱難時(shí),我開(kāi)始懷疑自己,我真的有能力做到嗎?我追求的道理是正確的嗎?最終對(duì)數(shù)據(jù)科學(xué)的熱情和耐心讓我重新開(kāi)始,繼續(xù)不斷努力和前行。
獲得數(shù)據(jù)科學(xué)相關(guān)的工作
由于就業(yè)市場(chǎng)競(jìng)爭(zhēng)激烈,找到心儀的數(shù)據(jù)科學(xué)工作對(duì)我來(lái)說(shuō)并非易事。我提交了大量的簡(jiǎn)歷都毫無(wú)結(jié)果。因此我開(kāi)始改進(jìn)找工作的方法,參加聚會(huì)和研討會(huì),在網(wǎng)上分享我的學(xué)習(xí)經(jīng)歷,在招聘會(huì)上于潛在雇主接觸等等。
7.如何有效地在簡(jiǎn)歷中加入自己的工作經(jīng)驗(yàn),從而提高被錄用的幾率?
這是一種誤解,你并不能通過(guò)簡(jiǎn)歷中的經(jīng)驗(yàn)就被聘用。事實(shí)上,簡(jiǎn)歷是面試的敲門(mén)磚。
因此,學(xué)習(xí)如何寫(xiě)簡(jiǎn)歷對(duì)于獲得面試機(jī)會(huì)至關(guān)重要。研究表明,招聘人員在確定求職者是否適合該職位時(shí),平均看簡(jiǎn)歷的時(shí)間僅為6秒。
關(guān)于完善簡(jiǎn)歷,我推薦以下網(wǎng)站和文章:
Vault
TopResume
Optimize Guide
A Resume Expert Gives Career Advice
https://www.facebook.com/businessinsider/videos/10153537949019071/
How to Pass the 6-Second Resume Test
https://www.topresume.com/career-advice/how-to-pass-the-6-second-resume-test
How to tailor your Academic CV for Data Science roles
https://www.linkedin.com/pulse/how-tailor-your-academic-cv-data-science-roles-jason-byrne/?trackingId=3ykuEpfW%2BISNc%2Fx9YFbIZQ%3D%3D
What do Hiring Managers Look For in a Data Scientist’s CV?
https://www.linkedin.com/pulse/what-do-hiring-managers-look-data-scientists-cv-ben-dias/
The 14 Things You Need On Your Resume To Land Your Dream Job
https://www.elitedaily.com/money/14-signs-you-have-a-strong-resume/617472
8.怎樣的作品集能幫助我們找到第一數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)方面的工作?
簡(jiǎn)歷是不夠的,你還需要作品集的支撐。在看了簡(jiǎn)歷之后,招聘人員希望更多地了解你的背景,這時(shí)就需要作品集了。
可以試著在社交媒體平臺(tái)分享自己的學(xué)習(xí)經(jīng)歷,寫(xiě)文章和做播客都是不錯(cuò)的選擇。
更多資源
學(xué)習(xí)平臺(tái) :
Towards Data Science, Quora, DZone, KDnuggets, Analytics Vidhya, DataTau, fast.ai
推薦視頻:
Webinars——Data Science Office Hours, Data Science Connect, Humans of Data Science (HoDS)
推薦文章:
A Badass’s Guide to Breaking Into Data
http://www.data-mania.com/blog/guide-to-breaking-into-data/
10 Must Have Data Science Skills
https://www.kdnuggets.com/2016/05/10-must-have-skills-data-scientist.html?utm_content=buffer7c1a3&utm_medium=social&utm_source=linkedin.com&utm_campaign=buffer
My Data Science & Machine Learning, Beginner’s Learning Path
https://www.linkedin.com/pulse/my-data-science-machine-learning-beginners-path-vin-vashishta/?trackingId=J16vYmqLQEZ5wr4oElpnNA%3D%3D
24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
https://www.analyticsvidhya.com/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/
值得關(guān)注的數(shù)據(jù)科學(xué)家
LinkedIn上的數(shù)據(jù)科學(xué)社區(qū)非常棒,以下是我認(rèn)為值得關(guān)注的數(shù)據(jù)科學(xué)家和專(zhuān)業(yè)人士:
Randy Lao
Kyle McKiou
Favio Vázquez
Vin Vashishta
Eric Weber
Sarah Nooravi
Kate Strachnyi
Tarry Singh
Karthikeyan P.T.R.
Megan Silvey
Imaad Mohamed Khan
Andreas Kretz
Andriy Burkov
Carla Gentry
Nic Ryan
Beau Walker
結(jié)語(yǔ)
希望本文能夠解決你的問(wèn)題。每當(dāng)你在數(shù)據(jù)科學(xué)旅程中遇到任何障礙,快要放棄時(shí)請(qǐng)記住,堅(jiān)持是關(guān)鍵。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03