99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識(六 )
數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識(六 )
2014-11-29
收藏

數(shù)據(jù)挖掘中所需的概率論與數(shù)理統(tǒng)計知識(六 )


高斯導出誤差正態(tài)分布

    事實上,棣莫弗早在1730年~1733年間便已從二項分布逼近的途徑得到了正態(tài)密度函數(shù)的形式,到了1780年后,拉普拉斯也推出了中心極限定理的一般形式,但無論是棣莫弗,還是拉普拉斯,此時他們這些研究成果都還只是一個數(shù)學表達式而非概率分布,也就是壓根就還沒往誤差概率分布的角度上去思索,而只有到了1809年,高斯提出“正太誤差”的理論之后,它正太理論才得以“概率分布“的身份進入科學殿堂,從而引起人們的重視。
   追本溯源,正態(tài)分布理論這條大河的源頭歸根結(jié)底是測量誤差理論。那高斯到底在正態(tài)分布的確立做了哪些貢獻呢?請看下文。
    1801年1月,天文學家Giuseppe Piazzi發(fā)現(xiàn)了一顆從未見過的光度8等的星在移動,這顆現(xiàn)在被稱作谷神星(Ceres)的小行星在夜空中出現(xiàn)6個星期,掃過八度角后在就在太陽的光芒下沒了蹤影,無法觀測。而留下的觀測數(shù)據(jù)有限,難以計算出他的軌道,天文學家也因此無法確定這顆新星是彗星還是行星,這個問題很快成了學術(shù)界關(guān)注的焦點。高斯當時已經(jīng)是很有名望的年輕數(shù)學家了,這個問題也引起了他的興趣。高斯一個小時之內(nèi)就計算出了行星的軌道,并預言了它在夜空中出現(xiàn)的時間和位置。1801年12月31日夜,德國天文愛好者奧伯斯(Heinrich Olbers)在高斯預言的時間里,用望遠鏡對準了這片天空。果然不出所料,谷神星出現(xiàn)了!
    高斯為此名聲大震,但是高斯當時拒絕透露計算軌道的方法直到1809年高斯系統(tǒng)地完善了相關(guān)的數(shù)學理論后,才將他的方法公布于眾,而其中使用的數(shù)據(jù)分析方法,就是以正態(tài)誤差分布為基礎(chǔ)的最小二乘法。那高斯是如何推導出誤差分布為正態(tài)分布的呢?請看下文。
    跟上面一樣,還是設(shè)真值為,而為n次獨立測量值,每次測量的誤差為,假設(shè)誤差ei的密度函數(shù)為f(e),則測量值的聯(lián)合概率為n個誤差的聯(lián)合概率,記為
    到此為止,高斯的作法實際上與拉普拉斯相同,但在繼續(xù)往下進行時,高斯提出了兩個創(chuàng)新的想法。
    第一個創(chuàng)新的想法便是:高斯并沒有像前面的拉普拉斯那樣采用貝葉斯的推理方式,而是直接取L(θ)達到最小值的作為的估計值,這也恰恰是他解決此問題采用的創(chuàng)新方法,即
     現(xiàn)在我們把L(θ)稱為樣本的似然函數(shù),而得到的估計值θ?稱為極大似然估計。高斯首次給出了極大似然的思想,這個思想后來被統(tǒng)計學家R.A.Fisher系統(tǒng)地發(fā)展成為參數(shù)估計中的極大似然估計理論。
    高斯的第二點創(chuàng)新的想法是:他把整個問題的思考模式倒過來,既然千百年來大家都認為算術(shù)平均是一個好的估計,那么就直接先承認算術(shù)平均就是極大似然估計(換言之,極大似然估計導出的就應(yīng)該是算術(shù)平均),所以高斯猜測:
    然后高斯再去尋找相應(yīng)的誤差密度函數(shù)以迎合這一點。即尋找這樣的概率分布函數(shù),使得極大似然估計正好是算術(shù)平均。通過應(yīng)用數(shù)學技巧求解這個函數(shù)f,高斯證明了所有的概率密度函數(shù)中,唯一滿足這個性質(zhì)的就是(記為(11)式):
   
    而這恰巧是我們所熟知的正態(tài)分布的密度函數(shù),就這樣,誤差的正態(tài)分布就被高斯給推導出來了!
    但,高斯是如何證明的呢?也就是說,高斯是如何一下子就把上面(11)式所述的概率密度函數(shù)給找出來的呢?如下圖所示(摘自數(shù)理統(tǒng)計學簡史第127頁注2,圖中開頭所說的高斯的第2原則就是上面所講的高斯的第二點創(chuàng)新的想法,而下圖最后所說的(11)式就是上面推導出來的概率密度函數(shù)):
    進一步,高斯基于這個誤差分布函數(shù)對最小二乘法給出了一個很漂亮的解釋。對于最小二乘公式中涉及的每個誤差ei,有,則結(jié)合高斯的第一個創(chuàng)新方法:極大似然估計及上述的概率密度,(e1,?,en)的聯(lián)合概率分布為
    要使得這個概率最大,必須使得取最小值,這正好就是最小二乘法的要求。
    高斯的這項工作對后世的影響極大,它使正態(tài)分布同時有了”高斯分布“的名稱,不止如此,后世甚至也把最小二乘法的發(fā)明權(quán)也歸功于他,由于他的這一系列突出貢獻,人們    采取了各種形式紀念他,如現(xiàn)今德國10馬克的鈔票上便印有這高斯頭像及正態(tài)分布的密度曲線,借此表明在高斯的一切科學貢獻中,尤以此”正太分布“的確立對人類文明的進程影響最大。
    至此,咱們來總結(jié)下:
  1. 如你所見,相比于勒讓德1805給出的最小二乘法描述,高斯基于誤差正態(tài)分布最小二乘理論顯然更高一籌,高斯的工作中既提出了極大似然估計的思想,又解決了誤差的概率密度分布的問題,由此我們可以對誤差大小的影響進行統(tǒng)計度量了。
  2. 但事情就完了么?沒有。高斯設(shè)定了準則“最大似然估計應(yīng)該導出優(yōu)良的算術(shù)平均”,并導出了誤差服從正態(tài)分布,推導的形式上非常簡潔優(yōu)美。但是高斯給的準則在邏輯上并不足以讓人完全信服,因為算術(shù)平均的優(yōu)良性當時更多的是一個經(jīng)驗直覺,缺乏嚴格的理論支持。高斯的推導存在循環(huán)論證的味道:因為算術(shù)平均是優(yōu)良的,推出誤差必須服從正態(tài)分布;反過來,又基于正態(tài)分布推導出最小二乘和算術(shù)平均,來說明最小二乘法和算術(shù)平均的優(yōu)良性,故其中無論正反論點都必須借助另一方論點作為其出發(fā)點,可是算術(shù)平均到并沒有自行成立的理由。
    也就是上面說到的高斯的第二點創(chuàng)新的想法他把整個問題的思考模式倒過來:既然千百年來大家都認為算術(shù)平均是一個好的估計,那么就直接先承認算術(shù)平均就是極大似然估計(換言之,極大似然估計導出的就應(yīng)該是算術(shù)平均)”存在著隱患,而這一隱患的消除又還得靠咱們的老朋友拉普拉斯解決了。
    受高斯啟發(fā),拉普拉斯將誤差的正態(tài)分布理論和中心極限定理聯(lián)系起來,提出了元誤差解釋。他指出如果誤差可以看成許多微小量的疊加,則根據(jù)他的中心極限定理,隨機誤差理應(yīng)當有高斯分布(換言之,按中心極限定理來說,正態(tài)分布是由大量的但每一個作用較小的因素的作用導致而成)。而20世紀中心極限定理的進一步發(fā)展,也給這個解釋提供了更多的理論支持。
    至此,誤差分布曲線的尋找塵埃落定,正態(tài)分布在誤差分析中確立了自己的地位。在整個正態(tài)分布被發(fā)現(xiàn)與應(yīng)用的歷史中,棣莫弗、拉普拉斯、高斯各有貢獻,拉普拉斯從中心極限定理的角度解釋它,高斯把它應(yīng)用在誤差分析中,殊途同歸。不過因為高斯在數(shù)學家中的名氣實在是太大,正態(tài)分布的桂冠還是更多的被戴在了高斯的腦門上,目前數(shù)學界通行的用語是正態(tài)分布、高斯分布,兩者并用。

正態(tài)分布的時間簡史

    至此,正態(tài)分布從首次出現(xiàn)到最終確立,其時間簡史為:
  1. 1705年,伯努力的著作推測術(shù)問世,提出伯努利大數(shù)定律;
  2. 1730-1733年,棣莫弗從二項分布逼近得到正態(tài)密度函數(shù),首次提出中心極限定理;
  3. 1780年,拉普拉斯建立中心極限定理的一般形成;
  4. 1805年,勒讓德發(fā)明最小二乘法;
  5. 1809年,高斯引入正態(tài)誤差理論,不但補充了最小二乘法,而且首次導出正態(tài)分布;
  6. 1811年,拉普拉斯利用中心極限定理論證正態(tài)分布
  7. 1837年,海根提出元誤差學說,自此之后,逐步正式確立誤差服從正態(tài)分布
    如上所見,是先有的中心極限定理,而后才有的正態(tài)分布(當然,最后拉普拉斯用中心極限定理論證了正態(tài)分布),能了解這些歷史,想想,都覺得是一件無比激動的事情。所以,我們切勿以為概率論與數(shù)理統(tǒng)計的教材上是先講的正態(tài)分布,而后才講的中心極限定理,而顛倒原有歷史的發(fā)明演進過程。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }