
對于數(shù)據(jù)科學(xué)來說,現(xiàn)在是發(fā)展的黃金時期。這是個新領(lǐng)域,但增長迅速,同時數(shù)據(jù)科學(xué)家的缺口也很大。最好的學(xué)習(xí)方法是通過實踐,知道自己真的需要學(xué)習(xí)什么,最重要的是,當(dāng)你通過這種方式學(xué)習(xí),你可以獲得立刻就可以用到的技能。
1、學(xué)會愛數(shù)據(jù)
數(shù)據(jù)科學(xué)是一個廣泛而模糊的領(lǐng)域,這使得它很難學(xué)習(xí)。 沒有動力,你最終會中途停止對自己失去信心。你需要些東西來激勵你不斷學(xué)習(xí),即使是在半夜公式已經(jīng)開始變的模糊,你還是想探究關(guān)于神經(jīng)網(wǎng)絡(luò)的意義。你需要些動力來讓你發(fā)現(xiàn)統(tǒng)計、線性代數(shù)和神經(jīng)網(wǎng)絡(luò)之間的聯(lián)系,當(dāng)你在困惑“下一步我該學(xué)習(xí)什么?”的時候。我學(xué)習(xí)的入口是用數(shù)據(jù)來預(yù)測股市,盡管當(dāng)時我完全不熟悉。我編碼的第一批項目用于預(yù)測股票幾乎沒有統(tǒng)計,但是我知道它們表現(xiàn)的并不好,所以我日以繼夜的工作讓它們變的更好。我癡迷于改善程序的性能,我癡迷于股票市場,我學(xué)習(xí)去愛數(shù)據(jù)。我去學(xué)習(xí)一切能讓這個項目結(jié)果更好的技能。并不是每個人都會癡迷于股市預(yù)測,但重要的是要發(fā)現(xiàn)你想學(xué)習(xí)的東西。數(shù)據(jù)可以計算出關(guān)于你的城市很多新鮮有趣的事情,比如所有設(shè)備在互聯(lián)網(wǎng)上的映射、找到真正的NBA球員的位置,今年又哪些地方有難民,或者是其他事情。數(shù)據(jù)科學(xué)的偉大之處是有無限有趣的東西可以發(fā)現(xiàn)——那就是問問題然后找到一個方法來得到答案。
2、在實踐中學(xué)習(xí)
學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)、圖像識別和其他尖端技術(shù)是很重要的,但大多數(shù)數(shù)據(jù)科學(xué)工作不涉及這些:90%的工作將是數(shù)據(jù)清理。精通幾個算法比知道一點許多算法要好。如果你知道線性回歸、k – means聚類和邏輯回歸可以解釋和詮釋他們的研究結(jié)果,并可以用這些完成一個項目,你將比如果你知道每一個演算法,但不使用它們更優(yōu)秀。大多數(shù)時候,當(dāng)你使用一種算法,它將是庫中的一個版本(你很少會自己編碼支持向量機實現(xiàn)——這需要太長時間)。所有這些意味著最好的學(xué)習(xí)方法是在項目工作中學(xué)習(xí),通過項目,你可以獲得有用的技能。
一種方法是在一個項目中先找到一個你喜歡的數(shù)據(jù)集,回答一個有趣的問題。這里有一些好的地方。
另一種方法是找到一個深層次的問題,例如預(yù)測股票市場,然后分解成小步驟。 我第一次連接到雅虎財經(jīng)的API,并爬下每日價格數(shù)據(jù)。然后我創(chuàng)建了一些指標(biāo),比如在過去的幾天里的平均價格,并用它們來預(yù)測未來(這里沒有真正的算法,只是技術(shù)分析)。這個效果不太好,所以我學(xué)會了一些統(tǒng)計知識,然后用線性回歸。 然后連接到另一個API,清理每一分鐘的數(shù)據(jù),并存儲在一個SQL數(shù)據(jù)庫。 等等,直到算法效果很好。
這樣做的好處是我在一個學(xué)習(xí)環(huán)境中學(xué)習(xí)。不僅僅學(xué)習(xí)了SQL語法,用它來儲存價格數(shù)據(jù),還比僅僅學(xué)習(xí)語法多學(xué)習(xí)了十倍的東西。學(xué)習(xí)而不應(yīng)用的知識很難被保留,當(dāng)你做實際的工作的時候也不會準備好。
3、學(xué)會溝通
數(shù)據(jù)科學(xué)家需要不斷展示他們的分析結(jié)果。這個過程可以區(qū)別數(shù)據(jù)科學(xué)家的水平。交流的一部分是對主題的理解和理論, 另一個是理解如何組織你的結(jié)果。最后一部分是能夠清楚地解釋您的分析。 展示你的數(shù)據(jù)分析的結(jié)果。試著教那些對數(shù)據(jù)科學(xué)技術(shù)知識并沒有什么概念的人,比如你的朋友和家人這可以可以幫助您理解概念。試著在聚會上演講。使用github管理你所有的分析。在一些社區(qū)中活躍,比如Quora , DataTau , machine learningsubreddit。
4、向同行學(xué)習(xí)
你根本想不到你會從同行身上學(xué)到多少東西,在數(shù)據(jù)工作中,團隊合作非常重要。在聚會中找一些同伴。開源軟件包。給哪些寫有趣的數(shù)據(jù)分析博客發(fā)消息看有沒有合作的可能。
5、不斷增加學(xué)習(xí)的難度
你完全熟悉這個項目的工作了? 你最后一次使用一個新概念是在一周前? 那么是時候做些更加困難的挑戰(zhàn)了。如果你停止攀登,那么不進則退。如果你發(fā)現(xiàn)自己太舒適,這里有一些建議:處理更大的數(shù)據(jù)集。 學(xué)習(xí)使用spark??纯茨隳懿荒茏屇愕乃惴ǜ臁D銓⑷绾螌⑺惴〝U展到多個處理器? 你能做到嗎?理解更多的理論算法并使用。這會改變你的假設(shè)嗎?試圖教一個新手去做你現(xiàn)在正在做同樣的事情。上面這些這至少是一個思路告訴你在開始學(xué)習(xí)數(shù)據(jù)科學(xué)的時候到底要做什么。如果你完成了這些,你將發(fā)現(xiàn)你的能力自然而然就提升了。我不喜歡那些“一個清單”這樣的建議,因為這讓我很難按部就班去做。我發(fā)現(xiàn)很多人在跟著書單或者課程學(xué)習(xí)中半途而廢。我個人相信如果你有正確的目標(biāo)任何人都可以學(xué)習(xí)數(shù)據(jù)科學(xué)。這是一個幫助你學(xué)習(xí)大數(shù)據(jù)的網(wǎng)站,其中包括了很多優(yōu)秀的學(xué)習(xí)經(jīng)驗和討論。你可以分析一些有趣的數(shù)據(jù)集,比如美國中央情報局的文件和球員統(tǒng)計。還可以完成一些項目,比如建立一個投資組合。如果你不知道如何分析,這也不是問題,我們會教你python。我們教Python因為它是最初級的友好語言,用于大量生產(chǎn)數(shù)據(jù)的科學(xué)工作,可用于各種各樣的應(yīng)用。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03