99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界(二)
用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界(二)
2015-06-11
收藏

用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界(二)


如果對(duì)所研究的總體得出結(jié)論是您做 Web 民意測驗(yàn)的動(dòng)機(jī)(而不是為站點(diǎn)訪問者提供的消遣),那么您應(yīng)該實(shí)現(xiàn)一些技術(shù),以確保一人一票(所以,他們必須用唯一的標(biāo)識(shí)登錄才能投票),并確保隨機(jī)選擇投票者樣本(例如,隨機(jī)選擇成員的子集,然后給他們發(fā)電子郵件,鼓勵(lì)他們投票)。 最終,目標(biāo)是消除(至少減少)各種偏差,它們可能會(huì)削弱對(duì)所研究總體得出結(jié)論的能力。 檢驗(yàn)假設(shè) 假設(shè)新斯科舍省啤酒消費(fèi)者統(tǒng)計(jì)樣本沒有發(fā)生偏差,您現(xiàn)在能夠得出 Keiths 是最受歡迎品牌這一結(jié)論嗎? 要回答這個(gè)問題,請考慮一個(gè)相關(guān)的問題:如果您要獲得另一個(gè)新斯科舍省啤酒消費(fèi)者的樣本,您希望看到完全相同的結(jié)果嗎?實(shí)際上,您會(huì)希望不同樣本中所觀察到的結(jié)果有一定的變化。

 考慮這個(gè)預(yù)期的抽樣可變性,您可能懷疑通過隨機(jī)抽樣可變性是否比反映所研究總體中的實(shí)際差異能更好地說明觀察到的品牌偏好。在統(tǒng)計(jì)學(xué)術(shù)語中,這個(gè)抽樣可變性說明被稱為虛假設(shè)(null hypothesis)。(虛假設(shè)由符號(hào) Ho 表示)在本例中,用公式將它表示成這樣的語句:在作出回答的所有類別中,各種回答的期望數(shù)目相同。 Ho:# Keiths = # Olands = # Schooner = # Other 如果您能夠排除虛假設(shè),那么您在回答 Keiths 是否是最受歡迎品牌這個(gè)最初的問題上取得了一些進(jìn)展。那么,另一個(gè)可接受的假設(shè)是在所研究的總體中,各種回答所占比例不同。 這個(gè)“先檢驗(yàn)虛假設(shè)”邏輯在民意測驗(yàn)數(shù)據(jù)分析中的多個(gè)階段都適用。排除這一虛假設(shè),這樣數(shù)據(jù)就不會(huì)完全不同,隨后您可以繼續(xù)檢驗(yàn)一個(gè)更具體的虛假設(shè),即 Keiths 和 Schooner,或者 Keiths 與其它所有品牌之間沒有差別。 您繼續(xù)檢驗(yàn)虛假設(shè)而不是直接評(píng)估另一假設(shè),是因?yàn)閷?duì)于在虛假設(shè)條件下人們希望觀察到的事物進(jìn)行統(tǒng)計(jì)建模更容易。接下來,我將演示如何對(duì)在虛假設(shè)下所期望的事物建模,這樣我就可以將觀察結(jié)果與在虛假設(shè)條件下所期望的結(jié)果加以比較。 對(duì)虛假設(shè)建模:X 平方分布統(tǒng)計(jì) 到目前為止,您已經(jīng)使用一個(gè)報(bào)告每種回答選項(xiàng)頻率計(jì)數(shù)(和百分比)的表匯總了 Web 民意測驗(yàn)的結(jié)果。要檢驗(yàn)虛假設(shè)(表單元頻率之間不存在差別),計(jì)算每個(gè)表單元與您在虛假設(shè)條件下所期望值的總體偏差度量要容易得多。

 在這個(gè)啤酒歡迎度民意測驗(yàn)的示例中,在虛假設(shè)條件下的期望頻率如下: 期望頻率 = 觀察數(shù)目 / 回答選項(xiàng)的數(shù)目 期望頻率 = 1000 / 4 期望頻率 = 250 要計(jì)算每個(gè)單元中回答的內(nèi)容與期望頻率相差多少的總體度量,您可以將所有的差別總計(jì)到一個(gè)反映觀察頻率與期望頻率相差多少的總體度量中:(285 - 250) + (250 - 250) + (215 - 250) + (250 - 250)。 如果您這么做,您會(huì)發(fā)現(xiàn)期望頻率是 0,因?yàn)槠骄档?a href='/map/piancha/' style='color:#000;font-size:inherit;'>偏差的和永遠(yuǎn)是 0。要解決這個(gè)問題,應(yīng)當(dāng)取所有差值的平方(這就是X 平方分布(Chi Square)中平方的由來)。最后,為了使各樣本(這些樣本具有不同的觀察數(shù))的這個(gè)值具有可比性(換句話說,使它標(biāo)準(zhǔn)化),將該值除以期望頻率。因此,X 平方分布統(tǒng)計(jì)的公式如下所示(“O”表示“觀察頻率”,“E”等于“期望頻率”): 圖 1. X 平方分布統(tǒng)計(jì)的公式 如果計(jì)算啤酒歡迎度民意測驗(yàn)數(shù)據(jù)的 X 平方分布統(tǒng)計(jì),會(huì)得到值 9.80。要檢驗(yàn)虛假設(shè),需要知道在假設(shè)存在隨機(jī)抽樣可變性的情況下獲得這么一個(gè)極限值的概率。

要得出這一概率,需要理解 X 平方分布的抽樣分布是什么樣的。 觀察 X 平方分布的抽樣分布 圖 2. X 平方分布圖 在每幅圖中,橫軸表示所得到的 X 平方分布值大?。▓D中所示范圍從 0 到 10)??v軸顯示各 X 平方分布值的概率(或稱為出現(xiàn)的相對(duì)頻率)。 當(dāng)您研究這些 X 平方分布圖時(shí),請注意,當(dāng)您在實(shí)驗(yàn)中改變自由度(即 df)時(shí),概率函數(shù)的形狀會(huì)改變。對(duì)于民意測驗(yàn)數(shù)據(jù)的示例,自由度是這樣計(jì)算的:記下民意測驗(yàn)中的回答選項(xiàng)(k)的數(shù)目,然后用這個(gè)值減 1(df = k - 1)。 通常,當(dāng)您在實(shí)驗(yàn)中增加回答選項(xiàng)的數(shù)目時(shí),獲得較大 X 平方分布值的概率會(huì)下降。這是因?yàn)楫?dāng)增加回答選項(xiàng)時(shí),就增加了方差值的數(shù)目 ― (觀察值 - 期望值)2 ― 您可以求它的總數(shù)。因此,當(dāng)您增加回答選項(xiàng)時(shí),獲得大的 X 平方分布值的統(tǒng)計(jì)概率應(yīng)該增加,而獲得較小 X 平方分布值的概率會(huì)減少。這就是為什么 X 平方分布的抽樣分布的形狀隨著 df 值的不同而變化的原因。 

此外,要注意到通常人們對(duì) X 平方分布結(jié)果的小數(shù)點(diǎn)部分不感興趣,而是對(duì)位于所獲得的值右邊曲線的總計(jì)部分感興趣。該尾數(shù)概率告訴您獲取一個(gè)象您觀察到的極限值是可能(如一個(gè)大的尾數(shù)區(qū)域)還是不可能(小的尾數(shù)區(qū)域)。(實(shí)際上,我不使用這些圖來計(jì)算尾數(shù)概率,因?yàn)槲铱梢詫?shí)現(xiàn)數(shù)學(xué)函數(shù)來返回給定 X 平方分布值的尾數(shù)概率。我在本文后面討論的 X 平方分布程序中會(huì)采用這種做法。) 要進(jìn)一步了解這些圖是如何派生出來的,可以看看如何模擬與 df = 2(它表示 k = 3)對(duì)應(yīng)的圖的內(nèi)容。想象把數(shù)字 1、2 和 3 放進(jìn)帽子里,搖一搖,選一個(gè)數(shù)字,然后記錄所選的數(shù)字作為一次嘗試。

對(duì)這個(gè)實(shí)驗(yàn)進(jìn)行 300 次嘗試,然后計(jì)算 1、2 和 3 出現(xiàn)的頻率。 每次您做這個(gè)實(shí)驗(yàn)時(shí),都應(yīng)當(dāng)期望結(jié)果有稍微不同的頻率分布,這一分布反映了抽樣的可變性,同時(shí),這個(gè)分布又不會(huì)真正偏離可能的概率范圍。 下面的 Multinomial 類實(shí)現(xiàn)了這一想法。您可以用以下值初始化該類:要做實(shí)驗(yàn)的次數(shù)、每個(gè)實(shí)驗(yàn)中所做嘗試的次數(shù),以及每次試驗(yàn)的選項(xiàng)數(shù)目。每個(gè)實(shí)驗(yàn)的結(jié)果記錄在一個(gè)名為 Outcomes 的數(shù)組中。 清單 1. Multinomial 類的內(nèi)容 <?php // Multinomial.php // Copyright 2003, Paul Meagher // Distributed under LGPL  class Multinomial {  var $NExps;  var $NTrials;  var $NOptions;  var $Outcomes = array();  function Multinomial($NExps, $NTrials, $NOptions) {   $this->NExps  = $NExps;   $this->NTrials = $NTrials;   $this->NOptions = $NOptions;   for ($i=0; $i < $this->NExps; $i++) {    $this->Outcomes[$i] = $this->runExperiment();      }  }    function runExperiment() {   $Outcome = array();   for ($i = 0; $i < $this->NExps; $i++){    $choice = rand(1,$this->NOptions);    $Outcome[$choice]++;   }   return $Outcome;  }      } ?> 請注意,runExperiment 方法是該腳本中非常重要的一部分,它保證在每次實(shí)驗(yàn)中所做出的選擇是隨機(jī)的,并且跟蹤到目前為止在模擬實(shí)驗(yàn)中做出了哪些選擇。 

為了找到 X 平方分布統(tǒng)計(jì)的抽樣分布,只需獲取每次實(shí)驗(yàn)的結(jié)果,并且計(jì)算該結(jié)果的 X 平方分布統(tǒng)計(jì)。由于隨機(jī)抽樣的可變性,因此這個(gè) X 平方分布統(tǒng)計(jì)會(huì)隨實(shí)驗(yàn)的不同而不同。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }