
分享
數(shù)據(jù)科學(xué)有志之士最常見的問題之一是 "對于機器學(xué)習(xí),我需要知道多少數(shù)學(xué)?" 希望進入機器學(xué)習(xí)領(lǐng)域的學(xué)生往往將數(shù)學(xué)視為一個巨大的入門障礙。
行業(yè)中的守門人對這種擔憂沒有幫助,他們給學(xué)生貼上了不合格的標簽,除非他們擁有該學(xué)科的碩士或博士學(xué)位。
那么,為了在數(shù)據(jù)科學(xué)行業(yè)工作,你需要知道多少數(shù)學(xué)?
答案是。沒有你想象的那么多。
大多數(shù)公司在數(shù)據(jù)的幫助下解決非常類似的用例。他們要求數(shù)據(jù)科學(xué)家建立機器學(xué)習(xí)模型,可以預(yù)測客戶流失,進行細分,并預(yù)測銷售。
用于解決這些問題的方法是相似的,而且任務(wù)變得相當重復(fù)。沒有必要重新發(fā)明輪子,他們使用開箱即用的ML算法。
即使出現(xiàn)了需要建立自定義機器學(xué)習(xí)模型的情況,對特定主題的直觀理解也是足夠的。你不需要去深究,也絕對不需要成為數(shù)學(xué)專家來成為數(shù)據(jù)科學(xué)家。
例如,我們知道梯度下降是用來尋找線性回歸中的最佳擬合線的。你不需要開始學(xué)習(xí)如何解決微分方程,你只需要了解微積分的原理,就可以了解到這是如何做到的。
同樣,如果你要用Tensorflow構(gòu)建一個神經(jīng)網(wǎng)絡(luò)--你需要進行大量的矩陣操作,但你將在計算機程序的幫助下進行。由于這個原因,你不需要回去練習(xí)解代數(shù)方程。你只需要了解它們是如何工作的。
在這篇文章中,我將為你指出一些資源,幫助你開始學(xué)習(xí)數(shù)據(jù)科學(xué)的數(shù)學(xué)。我將專注于三個領(lǐng)域--線性代數(shù)、微積分和統(tǒng)計。
線性代數(shù)
線性代數(shù)--從基礎(chǔ)到前沿。edX上的這門課程將在本科水平上教你線性代數(shù)。它從一個緩慢的空間開始,只要你有高中水平的數(shù)學(xué)知識,你就可以學(xué)習(xí)這個課程。
這門課程最好的地方是,它用Matlab中的實際例子教你線性代數(shù),這讓你通過算法和編程的視角來看待這個學(xué)科。如果你的目標是學(xué)習(xí)機器學(xué)習(xí)的線性代數(shù),這種學(xué)習(xí)方法特別有用。
這個課程可以免費試聽。如果你想獲得結(jié)業(yè)證書,你可以申請財政援助。
3Blue1Brown--《線性代數(shù)精華》:我以前沒有上過這門課,但在我自己尋找數(shù)學(xué)學(xué)習(xí)資源的過程中,曾多次遇到它。
許多有志于機器學(xué)習(xí)的人對這門課程深信不疑,因為它為學(xué)習(xí)者提供了對線性代數(shù)的概念性理解。與其學(xué)習(xí)任意的公式或機械地推導(dǎo)它們,你將獲得對線性代數(shù)如何工作的直覺。如果你的最終目標是將這些概念應(yīng)用于機器學(xué)習(xí)模型,這將是非常有幫助的。
微積分
我推薦兩門為機器學(xué)習(xí)學(xué)習(xí)微積分的課程。微積分的本質(zhì)》是3Blue1Brown開設(shè)的一門偉大的微積分入門課程。同樣,這將為你提供對微積分概念的直觀理解,并深入解釋公式背后的意義,而不僅僅是讓你記住它們。
接下來,你可以學(xué)習(xí)3Blue1Brown的神經(jīng)網(wǎng)絡(luò)系列。如果你知道如何使用Keras等庫實現(xiàn)神經(jīng)網(wǎng)絡(luò),但并不真正了解這些模型背后的工作原理,你應(yīng)該學(xué)習(xí)這門課程。它為你提供了梯度下降算法的全面解釋,以及其背后的微積分概念。
統(tǒng)計數(shù)字
概率與統(tǒng)計:To p or not to p???-庫塞拉
這是我所學(xué)過的最好的統(tǒng)計學(xué)入門課程之一,由倫敦大學(xué)提供。這門課程是針對主修非數(shù)學(xué)專業(yè)的學(xué)生,如商業(yè)和金融。
正因為如此,統(tǒng)計學(xué)概念的解釋方式簡單易懂,并有許多真實世界的例子。
學(xué)習(xí)本課程后,你將對描述性和推斷性統(tǒng)計、不同的抽樣分布、抽樣技術(shù)、置信區(qū)間以及P值的計算方法有所了解。
所有這些概念都可以直接應(yīng)用于現(xiàn)實世界的數(shù)據(jù)分析。
統(tǒng)計學(xué)習(xí)-edX
這是另一個學(xué)習(xí)機器學(xué)習(xí)模型背后的直覺的優(yōu)秀課程。
與本列表中的其他資源一樣,本課程不太注重數(shù)學(xué)公式,而是以概念的方式解釋機器學(xué)習(xí)模型。
然而,要學(xué)習(xí)這門課程,建議有一些微積分知識,因為導(dǎo)師傾向于使用符號,否則可能會使你感到困惑。
你將學(xué)習(xí)線性和邏輯回歸等概念,以及正則化技術(shù),如脊和套索回歸,以及何時使用它們。有一整堂課專門討論用于減輕過擬合的技術(shù),并解釋了這些技術(shù)背后的基本數(shù)學(xué)直覺。
這是我上過的最有幫助的課程之一,因為它幫助我不再把機器學(xué)習(xí)模型當作黑盒子。我對不同類型的模型應(yīng)該用在什么地方,什么時候應(yīng)該應(yīng)用降維,以及什么時候執(zhí)行不同種類的特征選擇技術(shù)有了了解。
我花了很多時間試圖回到過去,學(xué)習(xí)本科階段的微積分和線性代數(shù)。然而,盡管花了很多時間學(xué)習(xí)公式和解微分方程,我的知識還是有脫節(jié),因為我從來沒有完全理解這些概念與機器學(xué)習(xí)算法的關(guān)系。
上述資源是突破這一障礙的好方法,因為它們讓你對機器學(xué)習(xí)背后的數(shù)學(xué)有一個概念性的理解,而不是把你帶入復(fù)雜公式和定理的兔子洞。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03