俺来也俺也啪www色,国产成人拍精品视频午夜网站 ,女人被爽到高潮视频免费国产

詹惠兒

2018-11-16 閱讀量: 1223

Logistic回歸的算法原理

眾所周知，Logistic回歸假設(shè)依賴（或響應(yīng)）變量遵循二項(xiàng)分布。現(xiàn)在，您可能想知道，什么是二項(xiàng)分布？可以通過以下特征來認(rèn)識(shí)下二項(xiàng)分布：

必須有由n表示的固定數(shù)量的試驗(yàn)，即在數(shù)據(jù)集中，必須有固定數(shù)量的行。
每次試驗(yàn)只能有兩個(gè)結(jié)果; 即，響應(yīng)變量只能有兩個(gè)唯一的類別。
每次試驗(yàn)的結(jié)果必須相互獨(dú)立; 即，響應(yīng)變量的唯一級(jí)別必須彼此獨(dú)立。
每次試驗(yàn)的成功概率（p）和失?。╭）應(yīng)該相同。

讓我們了解Logistic回歸的工作原理。對(duì)于線性回歸，其中輸出是輸入要素的線性組合，我們將等式寫為：

  `Y = βo + β1X + ∈`

在Logistic回歸中，我們使用相同的等式，但對(duì)Y進(jìn)行了一些修改。讓我們重申一個(gè)關(guān)于Logistic回歸的事實(shí)：我們計(jì)算概率。并且，概率總是介于0和1之間。換句話說，我們可以說：

響應(yīng)值必須為正數(shù)。
它應(yīng)該低于1。

首先，我們將滿足上述兩個(gè)標(biāo)準(zhǔn)。我們知道任何值的指數(shù)始終是正數(shù)。并且，任何number除以number + 1將始終低于1.讓我們實(shí)現(xiàn)這兩個(gè)發(fā)現(xiàn)：

這是邏輯功能。

現(xiàn)在我們確信概率值總是介于0和1之間。要確定鏈接函數(shù)，請(qǐng)仔細(xì)遵循代數(shù)計(jì)算。 P(Y=1|X)可以被解讀為“給定x的某個(gè)值，Y = 1的概率”。 Y只能取兩個(gè)值，1或0.為了便于計(jì)算，讓我們將P(Y=1|X)重寫為p(X) 。

正如您可能認(rèn)識(shí)到的，上面（立即）方程的右側(cè)描述了自變量的線性組合。左側(cè)稱為log - odds或odds ratio或logit函數(shù)，是Logistic回歸的鏈接函數(shù)。此鏈接函數(shù)遵循sigmoid（如下所示）函數(shù)，該函數(shù)將其概率范圍限制在0和1之間。

我們可以將上述等式解釋為，變量x的單位增加導(dǎo)致比值比乘以ε與冪β 。換句話說，回歸系數(shù)解釋了預(yù)測(cè)變量單位變化的響應(yīng)中l(wèi)og（odds）的變化。但是，由于p（X）和X之間的關(guān)系不是直線，輸入特征的單位變化不會(huì)直接影響模型輸出，但會(huì)影響比值比。

這與線性回歸相矛盾，其中，無(wú)論輸入要素的值如何，回歸系數(shù)始終表示輸入要素中每單位增加的模型輸出的固定增加/減少。

在多元回歸中，我們使用普通最小二乘法（OLS）來確定獲得良好模型擬合的最佳系數(shù)。在Logistic回歸中，我們使用最大似然法來確定最佳系數(shù)并最終確定良好的模型擬合。

最大似然的工作方式如下：它試圖找到系數(shù)（βo，β1）的值，使得預(yù)測(cè)概率盡可能接近觀察到的概率。換句話說，對(duì)于二元分類（1/0），最大似然將嘗試找到βo和β1的值，使得結(jié)果概率最接近1或0.似然函數(shù)寫為