2020-06-11
閱讀量:
1030
統(tǒng)計模型與機器學習在線性回歸上的差異
線性回歸是一種統(tǒng)計方法,通過這種方法我們既可以訓練一個線性回歸器,又可以通過最小二乘法擬合一個統(tǒng)計回歸模型。
前者做的事兒叫"訓練"模型,它只用到了數(shù)據(jù)的一個子集,而訓練得到的模型究竟表現(xiàn)如何需要通過數(shù)據(jù)的另一個子集測試集測試之后才能知道。機器學習的最終目的是在測試集上獲得最佳性能。
對于后者,我們則事先假設數(shù)據(jù)是一個具有高斯噪聲的線性回歸量,然后試圖找到一條線,最大限度地減少了所有數(shù)據(jù)的均方誤差。不需要訓練或測試集,在許多情況下,特別是在研究中(如下面的傳感器示例),建模的目的是描述數(shù)據(jù)與輸出變量之間的關系, 而不是對未來數(shù)據(jù)進行預測。我們稱此過程為統(tǒng)計推斷,而不是預測。盡管我們可以使用此模型進行預測,這也可能是你所想的,但評估模型的方法不再是測試集,而是評估模型參數(shù)的顯著性和健壯性。
機器學習(這里特指有監(jiān)督學習)的目的是獲得一個可反復預測的模型。我們通常不關心模型是否可以解釋。機器學習只在乎結(jié)果。就好比對公司而言,你的價值只用你的表現(xiàn)來衡量。而統(tǒng)計建模更多的是為了尋找變量之間的關系和確定關系的顯著性,恰巧迎合了預測。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論
0條評論