
損失函數(shù)(loss function)是用來估量你模型的預測值f(x)與真實值Y的不一致程度,它是一個非負實值函數(shù),通常使用L(Y, f(x))來表示,損失函數(shù)越小,模型的魯棒性就越好。損失函數(shù)是經(jīng)驗風險函數(shù)的核心部分,也是結構風險函數(shù)重要組成部分。模型的結構風險函數(shù)包括了經(jīng)驗風險項和正則項,通常可以表示成如下式子:
其中,前面的均值函數(shù)表示的是經(jīng)驗風險函數(shù),L代表的是損失函數(shù),后面的是正則化項(regularizer)或者叫懲罰項(penalty term),它可以是L1,也可以是L2,或者其他的正則函數(shù)。整個式子表示的意思是找到使目標函數(shù)最小時的值。下面主要列出幾種常見的損失函數(shù)。
有些人可能覺得邏輯回歸的損失函數(shù)就是平方損失,其實并不是。平方損失函數(shù)可以通過線性回歸在假設樣本是高斯分布的條件下推導得到,而邏輯回歸得到的并不是平方損失。在邏輯回歸的推導中,它假設樣本服從伯努利分布(0-1分布),然后求得滿足該分布的似然函數(shù),接著取對數(shù)求極值等等。而邏輯回歸并沒有求似然函數(shù)的極值,而是把極大化當做是一種思想,進而推導出它的經(jīng)驗風險函數(shù)為:最小化負的似然函數(shù)(即max F(y, f(x)) —-> min -F(y, f(x)))。從損失函數(shù)的視角來看,它就成了log損失函數(shù)了。
log損失函數(shù)的標準形式:
將它帶入到上式,通過推導可以得到logistic的損失函數(shù)表達式,如下:
如果是二分類的話,則m值等于2,如果是多分類,m就是相應的類別總個數(shù)。這里需要解釋一下:之所以有人認為邏輯回歸是平方損失,是因為在使用梯度下降來求最優(yōu)解的時候,它的迭代式子與平方損失求導后的式子非常相似,從而給人一種直觀上的錯覺。
這里有個PDF可以參考一下:Lecture 6: logistic regression.pdf.
二、平方損失函數(shù)(最小二乘法, Ordinary Least Squares )
最小二乘法是線性回歸的一種,OLS將問題轉化成了一個凸優(yōu)化問題。在線性回歸中,它假設樣本和噪聲都服從高斯分布(為什么假設成高斯分布呢?其實這里隱藏了一個小知識點,就是中心極限定理,可以參考【central limit theorem】),最后通過極大似然估計(MLE)可以推導出最小二乘式子。最小二乘的基本原則是:最優(yōu)擬合直線應該是使各點到回歸直線的距離和最小的直線,即平方和最小。換言之,OLS是基于距離的,而這個距離就是我們用的最多的歐幾里得距離。為什么它會選擇使用歐式距離作為誤差度量呢(即Mean squared error, MSE),主要有以下幾個原因:
簡單,計算方便;
歐氏距離是一種很好的相似性度量標準;
在不同的表示域變換后特征性質不變。
平方損失(Square loss)的標準形式如下:
(Y,f(X))=(Y?f(X))2L(Y,f(X))=(Y?f(X))2
當樣本個數(shù)為n時,此時的損失函數(shù)變?yōu)椋?br />而在實際應用中,通常會使用均方差(MSE)作為一項衡量指標,公式如下:
上面提到了線性回歸,這里額外補充一句,我們通常說的線性有兩種情況,一種是因變量y是自變量x的線性函數(shù),一種是因變量y是參數(shù)的線性函數(shù)。在機器學習中,通常指的都是后一種情況。
三、指數(shù)損失函數(shù)(Adaboost)
學過Adaboost算法的人都知道,它是前向分步加法算法的特例,是一個加和模型,損失函數(shù)就是指數(shù)函數(shù)。在Adaboost中,經(jīng)過m此迭代之后,可以得到:
Adaboost每次迭代時的目的是為了找到最小化下列式子時的參數(shù) 和G:
而指數(shù)損失函數(shù)(exp-loss)的標準形式如下
可以看出,Adaboost的目標式子就是指數(shù)損失,在給定n個樣本的情況下,Adaboost的損失函數(shù)為:
關于Adaboost的推導,可以參考Wikipedia:AdaBoost或者《統(tǒng)計學習方法》P145.
在機器學習算法中,hinge損失函數(shù)和SVM是息息相關的。在線性支持向量機中,最優(yōu)化問題可以等價于下列式子:
下面來對式子做個變形,令:
于是,原式就變成了:
如若取,式子就可以表示成:
可以看出,該式子與下式非常相似:
前半部分中的就是hinge損失函數(shù),而后面相當于L2正則項。
Hinge 損失函數(shù)的標準形式
可以看出,當|y|>=1時,L(y)=0。更多內容,參考Hinge-loss。
補充一下:在libsvm中一共有4中核函數(shù)可以選擇,對應的是-t參數(shù)分別是:
0-線性核;
1-多項式核;
2-RBF核;
3-sigmoid核。
五、其它損失函數(shù)
除了以上這幾種損失函數(shù),常用的還有:
0-1損失函數(shù)
絕對值損失函數(shù)
下面來看看幾種損失函數(shù)的可視化圖像,對著圖看看橫坐標,看看縱坐標,再看看每條線都表示什么損失函數(shù),多看幾次好好消化消化。
OK,暫時先寫到這里,休息下。最后,需要記住的是:參數(shù)越多,模型越復雜,而越復雜的模型越容易過擬合。過擬合就是說模型在訓練數(shù)據(jù)上的效果遠遠好于在測試集上的性能。此時可以考慮正則化,通過設置正則項前面的hyper parameter,來權衡損失函數(shù)和正則項,減小參數(shù)規(guī)模,達到模型簡化的目的,從而使模型具有更好的泛化能力。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03