99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
2018-11-16 閱讀量: 1223
Logistic回歸的算法原理

眾所周知,Logistic回歸假設(shè)依賴(或響應(yīng))變量遵循二項(xiàng)分布。 現(xiàn)在,您可能想知道,什么是二項(xiàng)分布? 可以通過以下特征來認(rèn)識(shí)下二項(xiàng)分布:

  1. 必須有由n表示的固定數(shù)量的試驗(yàn),即在數(shù)據(jù)集中,必須有固定數(shù)量的行。
  2. 每次試驗(yàn)只能有兩個(gè)結(jié)果; 即,響應(yīng)變量只能有兩個(gè)唯一的類別。
  3. 每次試驗(yàn)的結(jié)果必須相互獨(dú)立; 即,響應(yīng)變量的唯一級(jí)別必須彼此獨(dú)立。
  4. 每次試驗(yàn)的成功概率(p)和失?。╭)應(yīng)該相同。

讓我們了解Logistic回歸的工作原理。 對(duì)于線性回歸,其中輸出是輸入要素的線性組合,我們將等式寫為:

  `Y = βo + β1X + ∈` 

在Logistic回歸中,我們使用相同的等式,但對(duì)Y進(jìn)行了一些修改。 讓我們重申一個(gè)關(guān)于Logistic回歸的事實(shí):我們計(jì)算概率。并且,概率總是介于0和1之間。換句話說,我們可以說:

  1. 響應(yīng)值必須為正數(shù)。
  2. 它應(yīng)該低于1。

首先,我們將滿足上述兩個(gè)標(biāo)準(zhǔn)。 我們知道任何值的指數(shù)始終是正數(shù)。 并且,任何number除以number + 1將始終低于1.讓我們實(shí)現(xiàn)這兩個(gè)發(fā)現(xiàn):

這是邏輯功能。

現(xiàn)在我們確信概率值總是介于0和1之間。要確定鏈接函數(shù),請(qǐng)仔細(xì)遵循代數(shù)計(jì)算。 P(Y=1|X)可以被解讀為“給定x的某個(gè)值,Y = 1的概率”。 Y只能取兩個(gè)值,1或0.為了便于計(jì)算,讓我們將P(Y=1|X)重寫為p(X) 。

邏輯回歸方程推導(dǎo)

正如您可能認(rèn)識(shí)到的,上面(立即)方程的右側(cè)描述了自變量的線性組合。 左側(cè)稱為log - oddsodds ratiologit函數(shù),是Logistic回歸的鏈接函數(shù)。 此鏈接函數(shù)遵循sigmoid(如下所示)函數(shù),該函數(shù)將其概率范圍限制在0和1之間。

SigmoidPlot后勤功能

我們可以將上述等式解釋為,變量x的單位增加導(dǎo)致比值比乘以ε與冪β 。 換句話說,回歸系數(shù)解釋了預(yù)測(cè)變量單位變化的響應(yīng)中l(wèi)og(odds)的變化。 但是,由于p(X)和X之間的關(guān)系不是直線,輸入特征的單位變化不會(huì)直接影響模型輸出,但會(huì)影響比值比。

這與線性回歸相矛盾,其中,無(wú)論輸入要素的值如何,回歸系數(shù)始終表示輸入要素中每單位增加的模型輸出的固定增加/減少。

在多元回歸中,我們使用普通最小二乘(OLS)來確定獲得良好模型擬合的最佳系數(shù)。 在Logistic回歸中,我們使用最大似然法來確定最佳系數(shù)并最終確定良好的模型擬合。

最大似然的工作方式如下:它試圖找到系數(shù)(βo,β1)的值,使得預(yù)測(cè)概率盡可能接近觀察到的概率。 換句話說,對(duì)于二元分類(1/0),最大似然將嘗試找到βo和β1的值,使得結(jié)果概率最接近1或0.似然函數(shù)寫為

0.0000
0
關(guān)注作者
收藏
評(píng)論(0)

發(fā)表評(píng)論

暫無(wú)數(shù)據(jù)
推薦帖子