99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀機(jī)器學(xué)習(xí)基礎(chǔ)—梯度下降法（Gradient Descent）

機(jī)器學(xué)習(xí)基礎(chǔ)—梯度下降法（Gradient Descent）

2017-03-12

機(jī)器學(xué)習(xí)基礎(chǔ)—梯度下降法（Gradient Descent）

梯度下降法。一開始只是對(duì)其做了下簡(jiǎn)單的了解。隨著內(nèi)容的深入，發(fā)現(xiàn)梯度下降法在很多算法中都用的到，除了之前看到的用來處理線性模型，還有BP神經(jīng)網(wǎng)絡(luò)等。于是就有了這篇文章。

本文主要講了梯度下降法的兩種迭代思路，隨機(jī)梯度下降（Stochastic gradient descent）和批量梯度下降（Batch gradient descent）。以及他們?cè)?a href='/map/python/' style='color:#000;font-size:inherit;'>python中的實(shí)現(xiàn)。

梯度下降法

梯度下降是一個(gè)最優(yōu)化算法，通俗的來講也就是沿著梯度下降的方向來求出一個(gè)函數(shù)的極小值。那么我們?cè)诟叩葦?shù)學(xué)中學(xué)過，對(duì)于一些我們了解的函數(shù)方程，我們可以對(duì)其求一階導(dǎo)和二階導(dǎo)，比如說二次函數(shù)?？墒俏覀?cè)谔幚韱栴}的時(shí)候遇到的并不都是我們熟悉的函數(shù)，并且既然是機(jī)器學(xué)習(xí)就應(yīng)該讓機(jī)器自己去學(xué)習(xí)如何對(duì)其進(jìn)行求解，顯然我們需要換一個(gè)思路。因此我們采用梯度下降，不斷迭代，沿著梯度下降的方向來移動(dòng)，求出極小值。

此處我們還是用coursea的機(jī)器學(xué)習(xí)課中的案例，假設(shè)我們從中介那里拿到了一個(gè)地區(qū)的房屋售價(jià)表，那么在已知房子面積的情況下，如何得知房子的銷售價(jià)格。顯然，這是一個(gè)線性模型，房子面積是自變量x，銷售價(jià)格是因變量y。我們可以用給出的數(shù)據(jù)畫一張圖。然后，給出房子的面積，就可以從圖中得知房子的售價(jià)了。

現(xiàn)在我們的問題就是，針對(duì)給出的數(shù)據(jù)，如何得到一條最擬合的直線。

對(duì)于線性模型，如下。

h(x)是需要擬合的函數(shù)。

J(θ)稱為均方誤差或cost function。用來衡量訓(xùn)練集眾的樣本對(duì)線性模式的擬合程度。

m為訓(xùn)練集眾樣本的個(gè)數(shù)。

θ是我們最終需要通過梯度下降法來求得的參數(shù)。

\[h(\theta)=\sum_{j=0}^n \theta_jx_j \\ J(\theta)=\frac1{2m}\sum_{i=0}^m(y^i-h_\theta(x^i))^2\]

接下來的梯度下降法就有兩種不同的迭代思路。

批量梯度下降（Batch gradient descent）

現(xiàn)在我們就要求出J(θ)取到極小值時(shí)的$θ^T$向量。之前已經(jīng)說過了，沿著函數(shù)梯度的方向下降就能最快的找到極小值。

計(jì)算J(θ)關(guān)于$\theta^T$的偏導(dǎo)數(shù),也就得到了向量中每一個(gè)$\theta$的梯度。

\[ \begin{align} \frac{\partial J(\theta)}{\partial\theta_j} & = -\frac1m\sum_{i=0}^m(y^i-h_\theta(x^i)) \frac{\partial}{\partial\theta_j}(y^i-h_\theta(x^i)) \\ & = -\frac1m\sum_{i=0}^m(y^i-h_\theta(x^i)) \frac{\partial}{\partial\theta_j}(\sum_{j=0}^n\theta_jx_j^i-y^i) \\ & = -\frac1m\sum_{i=0}^m(y^i-h_\theta(x^i))x^i_j \end{align} \]

沿著梯度的方向更新參數(shù)θ的值

\[ \theta_j := \theta_j + \alpha\frac{\partial J(\theta)}{\partial\theta_j} :=\theta_j - \alpha\frac1m\sum_{i=0}^m(y^i-h_\theta(x^i))x^i_j \]

迭代直到收斂。

可以看到，批量梯度下降是用了訓(xùn)練集中的所有樣本。因此在數(shù)據(jù)量很大的時(shí)候，每次迭代都要遍歷訓(xùn)練集一遍，開銷會(huì)很大，所以在數(shù)據(jù)量大的時(shí)候，可以采用隨機(jī)梯度下降法。

隨機(jī)梯度下降（Stochastic gradient descent）

和批量梯度有所不同的地方在于，每次迭代只選取一個(gè)樣本的數(shù)據(jù)，一旦到達(dá)最大的迭代次數(shù)或是滿足預(yù)期的精度，就停止。

可以得出隨機(jī)梯度下降法的θ更新表達(dá)式。
\[ \theta_j:=\theta_j - \alpha\frac1m(y^i-h_\theta(x^i))x^i_j \]
迭代直到收斂。

兩種迭代思路的python實(shí)現(xiàn)

下面是python的代碼實(shí)現(xiàn)，現(xiàn)在僅僅是用純python的語法（python2.7）來實(shí)現(xiàn)的。隨著學(xué)習(xí)的深入，屆時(shí)還會(huì)有基于numpy等一些庫(kù)的實(shí)現(xiàn)，下次補(bǔ)充。

#encoding:utf-8

#隨機(jī)梯度
def stochastic_gradient_descent(x,y,theta,alpha,m,max_iter):
 """隨機(jī)梯度下降法，每一次梯度下降只使用一個(gè)樣本。

 :param x: 訓(xùn)練集種的自變量
 :param y: 訓(xùn)練集種的因變量
 :param theta: 待求的權(quán)值
 :param alpha: 學(xué)習(xí)速率
 :param m: 樣本總數(shù)
 :param max_iter: 最大迭代次數(shù)
 """
 deviation = 1
 iter = 0
 flag = 0
 while True:
 for i in range(m): #循環(huán)取訓(xùn)練集中的一個(gè)
 deviation = 0
 h = theta[0] * x[i][0] + theta[1] * x[i][1]
 theta[0] = theta[0] + alpha * (y[i] - h)*x[i][0]
 theta[1] = theta[1] + alpha * (y[i] - h)*x[i][1]

 iter = iter + 1
 #計(jì)算誤差
 for i in range(m):
 deviation = deviation + (y[i] - (theta[0] * x[i][0] + theta[1] * x[i][1])) ** 2
 if deviation <EPS or iter >max_iter:
 flag = 1
 break
 if flag == 1 :
 break
 return theta, iter

#批量梯度
def batch_gradient_descent(x,y,theta,alpha,m,max_iter):
 """批量梯度下降法，每一次梯度下降使用訓(xùn)練集中的所有樣本來計(jì)算誤差。

 :param x: 訓(xùn)練集種的自變量
 :param y: 訓(xùn)練集種的因變量
 :param theta: 待求的權(quán)值
 :param alpha: 學(xué)習(xí)速率
 :param m: 樣本總數(shù)
 :param max_iter: 最大迭代次數(shù)
 """
 deviation = 1
 iter = 0
 while deviation > EPS and iter < max_iter:
 deviation = 0
 sigma1 = 0
 sigma2 = 0
 for i in range(m): #對(duì)訓(xùn)練集中的所有數(shù)據(jù)求和迭代
 h = theta[0] * x[i][0] + theta[1] * x[i][1]
 sigma1 = sigma1 + (y[i] - h)*x[i][0]
 sigma2 = sigma2 + (y[i] - h)*x[i][1]
 theta[0] = theta[0] + alpha * sigma1 /m
 theta[1] = theta[1] + alpha * sigma2 /m
 #計(jì)算誤差
 for i in range(m):
 deviation = deviation + (y[i] - (theta[0] * x[i][0] + theta[1] * x[i][1])) ** 2
 iter = iter + 1
 return theta, iter

#運(yùn)行為兩種算法設(shè)置不同的參數(shù)
# data and init
matrix_x = [[2.1,1.5],[2.5,2.3],[3.3,3.9],[3.9,5.1],[2.7,2.7]]
matrix_y = [2.5,3.9,6.7,8.8,4.6]
MAX_ITER = 5000
EPS = 0.0001

#隨機(jī)梯度
theta = [2,-1]
ALPHA = 0.05

resultTheta,iters = stochastic_gradient_descent(matrix_x, matrix_y, theta, ALPHA, 5, MAX_ITER)
print 'theta=',resultTheta
print 'iters=',iters

#批量梯度
theta = [2,-1]
ALPHA = 0.05

resultTheta,iters = batch_gradient_descent(matrix_x, matrix_y, theta, ALPHA, 5, MAX_ITER)
print 'theta=',resultTheta
print 'iters=',iters

運(yùn)行結(jié)果
ALPHA = 0.05ALPHA = 0.05
theta= [-0.08445285887795494, 1.7887820818368738]
iters= 1025
theta= [-0.08388979324755381, 1.7885951009289043]
iters= 772
[Finished in 0.5s]
ALPHA = 0.01
theta= [-0.08387216503392847, 1.7885649678753883]
iters= 3566
theta= [-0.08385924864202322, 1.788568071697816]
iters= 3869
[Finished in 0.1s]
ALPHA = 0.1
theta= [588363545.9596066, -664661366.4562845]
iters= 5001
theta= [-0.09199523483489512, 1.7944581778450577]
iters= 516
[Finished in 0.2s]

總結(jié)

梯度下降法是一種最優(yōu)化問題求解的算法。有批量梯度和隨機(jī)梯度兩種不同的迭代思路。他們有以下的差異：

批量梯度收斂速度慢，隨機(jī)梯度收斂速度快。

批量梯度是在θ更新前對(duì)所有樣例匯總誤差，而隨機(jī)梯度下降的權(quán)值是通過考查某個(gè)樣本來更新的

批量梯度的開銷大，隨機(jī)梯度的開銷小。數(shù)據(jù)分析師培訓(xùn)

使用梯度下降法時(shí)需要尋找出一個(gè)最好的學(xué)習(xí)效率。這樣可以使得使用最少的迭代次數(shù)達(dá)到我們需要的精度。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報(bào)名CDA認(rèn)證考試，點(diǎn)擊>>> “CDA報(bào)名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點(diǎn)擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫(kù)，點(diǎn)擊>>> “CDA題庫(kù)” 了解CDA考試詳情；

? 想了解CDA考試含金量，點(diǎn)擊>>> “CDA含金量” 了解CDA考試詳情；

python 機(jī)器學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò) numpy 數(shù)據(jù)分析

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼，搜微信號(hào)：CDAshujufenxi

上一篇圖論在大數(shù)據(jù)分析中的作用！

下一篇CDA認(rèn)證再升一檔！與國(guó)家共同推進(jìn)大數(shù)據(jù)人才培養(yǎng)標(biāo)準(zhǔn)教育事業(yè)！

CDA報(bào)考指南

報(bào)考流程
考試時(shí)間
報(bào)名費(fèi)用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號(hào) 經(jīng)營(yíng)許可證編號(hào)：京B2-20210330

聯(lián)系電話：13321103290 (微信同號(hào))

CDA教材
CDA題庫(kù)
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

<p id="efuuw"><source id="efuuw"></source></p>

免密碼登錄

提交首次登錄驗(yàn)證后自動(dòng)注冊(cè)

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

機(jī)器學(xué)習(xí)基礎(chǔ)—梯度下降法（Gradient Descent）

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長(zhǎng)度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南 ...

CDA 認(rèn)證考試大綱 2025 重磅更新：一二級(jí)考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者 ...

SQL 在預(yù)測(cè)分析中的應(yīng)用：從數(shù)據(jù)查詢到趨勢(shì)預(yù)判 ...

數(shù)據(jù)查詢結(jié)束后：分析師的收尾工作與價(jià)值深化 ...

CDA 數(shù)據(jù)分析師考試：從報(bào)考到取證的全攻略 ...

【CDA干貨】單樣本趨勢(shì)性檢驗(yàn)：捕捉數(shù)據(jù)背后的時(shí)間 ...

year_month數(shù)據(jù)類型：時(shí)間維度的精準(zhǔn)切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí) ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗(yàn)：數(shù)據(jù)趨勢(shì) ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略 ...

統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉(zhuǎn)日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

機(jī)器學(xué)習(xí)基礎(chǔ)—梯度下降法（Gradient Descent）

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長(zhǎng)度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南 ...

CDA 認(rèn)證考試大綱 2025 重磅更新：一二級(jí)考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者 ...

SQL 在預(yù)測(cè)分析中的應(yīng)用：從數(shù)據(jù)查詢到趨勢(shì)預(yù)判 ...

數(shù)據(jù)查詢結(jié)束后：分析師的收尾工作與價(jià)值深化 ...

CDA 數(shù)據(jù)分析師考試：從報(bào)考到取證的全攻略 ...

【CDA干貨】單樣本趨勢(shì)性檢驗(yàn)：捕捉數(shù)據(jù)背后的時(shí)間 ...

year_month數(shù)據(jù)類型：時(shí)間維度的精準(zhǔn)切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí) ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗(yàn)：數(shù)據(jù)趨勢(shì) ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略 ...

統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉(zhuǎn)日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...