99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

^{<kbd id="cn0tb"></kbd>}
<meter id="cn0tb"></meter>

熱線電話：13121318867

登錄

首頁精彩閱讀數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六）

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六）

2014-11-29

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六）

高斯導(dǎo)出誤差正態(tài)分布

事實上，棣莫弗早在1730年~1733年間便已從二項分布逼近的途徑得到了正態(tài)密度函數(shù)的形式，到了1780年后，拉普拉斯也推出了中心極限定理的一般形式，但無論是棣莫弗，還是拉普拉斯，此時他們這些研究成果都還只是一個數(shù)學(xué)表達式而非概率分布，也就是壓根就還沒往誤差概率分布的角度上去思索，而只有到了1809年，高斯提出“正太誤差”的理論之后，它正太理論才得以“概率分布“的身份進入科學(xué)殿堂，從而引起人們的重視。

追本溯源，正態(tài)分布理論這條大河的源頭歸根結(jié)底是測量誤差理論。那高斯到底在正態(tài)分布的確立做了哪些貢獻呢？請看下文。

1801年1月，天文學(xué)家Giuseppe Piazzi發(fā)現(xiàn)了一顆從未見過的光度8等的星在移動，這顆現(xiàn)在被稱作谷神星（Ceres）的小行星在夜空中出現(xiàn)6個星期，掃過八度角后在就在太陽的光芒下沒了蹤影，無法觀測。而留下的觀測數(shù)據(jù)有限，難以計算出他的軌道，天文學(xué)家也因此無法確定這顆新星是彗星還是行星，這個問題很快成了學(xué)術(shù)界關(guān)注的焦點。高斯當(dāng)時已經(jīng)是很有名望的年輕數(shù)學(xué)家了，這個問題也引起了他的興趣。高斯一個小時之內(nèi)就計算出了行星的軌道，并預(yù)言了它在夜空中出現(xiàn)的時間和位置。1801年12月31日夜，德國天文愛好者奧伯斯(Heinrich Olbers)在高斯預(yù)言的時間里，用望遠(yuǎn)鏡對準(zhǔn)了這片天空。果然不出所料，谷神星出現(xiàn)了！

高斯為此名聲大震，但是高斯當(dāng)時拒絕透露計算軌道的方法直到1809年高斯系統(tǒng)地完善了相關(guān)的數(shù)學(xué)理論后，才將他的方法公布于眾，而其中使用的數(shù)據(jù)分析方法，就是以正態(tài)誤差分布為基礎(chǔ)的最小二乘法。那高斯是如何推導(dǎo)出誤差分布為正態(tài)分布的呢？請看下文。
跟上面一樣，還是設(shè)真值為

，而

為n次獨立測量值，每次測量的誤差為

，假設(shè)誤差ei的密度函數(shù)為f(e)，則測量值的聯(lián)合概率為n個誤差的聯(lián)合概率，記為

到此為止，高斯的作法實際上與拉普拉斯相同，但在繼續(xù)往下進行時，高斯提出了兩個創(chuàng)新的想法。

第一個創(chuàng)新的想法便是：高斯并沒有像前面的拉普拉斯那樣采用貝葉斯的推理方式，而是直接取L(θ)達到最小值的

作為

的估計值，這也恰恰是他解決此問題采用的創(chuàng)新方法，即

現(xiàn)在我們把L(θ)稱為樣本的似然函數(shù)，而得到的估計值θ?稱為極大似然估計。高斯首次給出了極大似然的思想，這個思想后來被統(tǒng)計學(xué)家R.A.Fisher系統(tǒng)地發(fā)展成為參數(shù)估計中的極大似然估計理論。
高斯的第二點創(chuàng)新的想法是：他把整個問題的思考模式倒過來，既然千百年來大家都認(rèn)為算術(shù)平均是一個好的估計，那么就直接先承認(rèn)算術(shù)平均就是極大似然估計(換言之，極大似然估計導(dǎo)出的就應(yīng)該是算術(shù)平均)，所以高斯猜測：

然后高斯再去尋找相應(yīng)的誤差密度函數(shù)

以迎合這一點。即尋找這樣的概率分布函數(shù)

,使得極大似然估計正好是算術(shù)平均

。通過應(yīng)用數(shù)學(xué)技巧求解這個函數(shù)f,高斯證明了所有的概率密度函數(shù)中，唯一滿足這個性質(zhì)的就是（記為(11)式）：

而這恰巧是我們所熟知的正態(tài)分布的密度函數(shù)

，就這樣，誤差的正態(tài)分布就被高斯給推導(dǎo)出來了！

但，高斯是如何證明的呢？也就是說，高斯是如何一下子就把上面(11)式所述的概率密度函數(shù)給找出來的呢？如下圖所示（摘自數(shù)理統(tǒng)計學(xué)簡史第127頁注2，圖中開頭所說的高斯的第2原則就是上面所講的高斯的第二點創(chuàng)新的想法，而下圖最后所說的(11)式就是上面推導(dǎo)出來的概率密度函數(shù)）：

進一步，高斯基于這個誤差分布函數(shù)對最小二乘法給出了一個很漂亮的解釋。對于最小二乘公式中涉及的每個誤差ei,有

，則結(jié)合高斯的第一個創(chuàng)新方法：極大似然估計及上述的概率密度，(e1,?,en)的聯(lián)合概率分布為

要使得這個概率最大，必須使得

取最小值，這正好就是最小二乘法的要求。

高斯的這項工作對后世的影響極大，它使正態(tài)分布同時有了”高斯分布“的名稱，不止如此，后世甚至也把最小二乘法的發(fā)明權(quán)也歸功于他，由于他的這一系列突出貢獻，人們采取了各種形式紀(jì)念他，如現(xiàn)今德國10馬克的鈔票上便印有這高斯頭像及正態(tài)分布的密度曲線

，借此表明在高斯的一切科學(xué)貢獻中，尤以此”正太分布“的確立對人類文明的進程影響最大。

至此，咱們來總結(jié)下：

如你所見，相比于勒讓德1805給出的最小二乘法描述，高斯基于誤差正態(tài)分布的最小二乘理論顯然更高一籌，高斯的工作中既提出了極大似然估計的思想，又解決了誤差的概率密度分布的問題，由此我們可以對誤差大小的影響進行統(tǒng)計度量了。
但事情就完了么？沒有。高斯設(shè)定了準(zhǔn)則“最大似然估計應(yīng)該導(dǎo)出優(yōu)良的算術(shù)平均”，并導(dǎo)出了誤差服從正態(tài)分布，推導(dǎo)的形式上非常簡潔優(yōu)美。但是高斯給的準(zhǔn)則在邏輯上并不足以讓人完全信服，因為算術(shù)平均的優(yōu)良性當(dāng)時更多的是一個經(jīng)驗直覺，缺乏嚴(yán)格的理論支持。高斯的推導(dǎo)存在循環(huán)論證的味道：因為算術(shù)平均是優(yōu)良的，推出誤差必須服從正態(tài)分布；反過來，又基于正態(tài)分布推導(dǎo)出最小二乘和算術(shù)平均，來說明最小二乘法和算術(shù)平均的優(yōu)良性，故其中無論正反論點都必須借助另一方論點作為其出發(fā)點，可是算術(shù)平均到并沒有自行成立的理由。

也就是上面說到的高斯的第二點創(chuàng)新的想法“他把整個問題的思考模式倒過來：既然千百年來大家都認(rèn)為算術(shù)平均是一個好的估計，那么就直接先承認(rèn)算術(shù)平均就是極大似然估計(換言之，極大似然估計導(dǎo)出的就應(yīng)該是算術(shù)平均)”存在著隱患，而這一隱患的消除又還得靠咱們的老朋友拉普拉斯解決了。

受高斯啟發(fā)，拉普拉斯將誤差的正態(tài)分布理論和中心極限定理聯(lián)系起來，提出了元誤差解釋。他指出如果誤差可以看成許多微小量的疊加，則根據(jù)他的中心極限定理，隨機誤差理應(yīng)當(dāng)有高斯分布(換言之，按中心極限定理來說，正態(tài)分布是由大量的但每一個作用較小的因素的作用導(dǎo)致而成)。而20世紀(jì)中心極限定理的進一步發(fā)展，也給這個解釋提供了更多的理論支持。

至此，誤差分布曲線的尋找塵埃落定，正態(tài)分布在誤差分析中確立了自己的地位。在整個正態(tài)分布被發(fā)現(xiàn)與應(yīng)用的歷史中，棣莫弗、拉普拉斯、高斯各有貢獻，拉普拉斯從中心極限定理的角度解釋它，高斯把它應(yīng)用在誤差分析中，殊途同歸。不過因為高斯在數(shù)學(xué)家中的名氣實在是太大，正態(tài)分布的桂冠還是更多的被戴在了高斯的腦門上，目前數(shù)學(xué)界通行的用語是正態(tài)分布、高斯分布，兩者并用。

正態(tài)分布的時間簡史

至此，正態(tài)分布從首次出現(xiàn)到最終確立，其時間簡史為：

1705年，伯努力的著作推測術(shù)問世，提出伯努利大數(shù)定律；
1730-1733年，棣莫弗從二項分布逼近得到正態(tài)密度函數(shù)，首次提出中心極限定理；
1780年，拉普拉斯建立中心極限定理的一般形成；
1805年，勒讓德發(fā)明最小二乘法；
1809年，高斯引入正態(tài)誤差理論，不但補充了最小二乘法，而且首次導(dǎo)出正態(tài)分布；
1811年，拉普拉斯利用中心極限定理論證正態(tài)分布；
1837年，海根提出元誤差學(xué)說，自此之后，逐步正式確立誤差服從正態(tài)分布。

如上所見，是先有的中心極限定理，而后才有的正態(tài)分布(當(dāng)然，最后拉普拉斯用中心極限定理論證了正態(tài)分布)，能了解這些歷史，想想，都覺得是一件無比激動的事情。所以，我們切勿以為概率論與數(shù)理統(tǒng)計的教材上是先講的正態(tài)分布，而后才講的中心極限定理，而顛倒原有歷史的發(fā)明演進過程。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認(rèn)證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

正態(tài)分布最小二乘數(shù)據(jù)挖掘數(shù)據(jù)分析

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇隨機森林 vs XGBoost vs 決策樹：算法選擇中的

下一篇圖論在大數(shù)據(jù)分析中的作用！

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六）

高斯導(dǎo)出誤差正態(tài)分布

正態(tài)分布的時間簡史

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六 ）

高斯導(dǎo)出誤差正態(tài)分布

正態(tài)分布的時間簡史

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識（六）

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...