99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線(xiàn)電話(huà):13121318867

登錄
首頁(yè)精彩閱讀方差分析--T檢驗(yàn)和F檢驗(yàn)的異同
方差分析--T檢驗(yàn)和F檢驗(yàn)的異同
2017-10-26
收藏

方差分析--T檢驗(yàn)和F檢驗(yàn)的異同

最近在圖書(shū)館借了本《R和ASReml-R統(tǒng)計(jì)分析教程》,林元震和陳曉陽(yáng)主編的關(guān)于R的書(shū)籍,當(dāng)時(shí)看上這本書(shū)的原因在于里面以統(tǒng)計(jì)學(xué)知識(shí)為主,作為R語(yǔ)言實(shí)戰(zhàn)的良好補(bǔ)充,雖然R語(yǔ)言實(shí)戰(zhàn)是一本相當(dāng)詳實(shí)的介紹R語(yǔ)言的書(shū),但是其中的統(tǒng)計(jì)學(xué)原理往往一筆帶過(guò)(雖然本書(shū)也不是很詳盡),但是作為一個(gè)數(shù)據(jù)分析從業(yè)人員,我感覺(jué)對(duì)于很多統(tǒng)計(jì)理論,達(dá)到可以講明白原理和邏輯就可以,具體的計(jì)算過(guò)程和推導(dǎo)反而在其次,而最重要的是在什么情況下應(yīng)用什么算法和模型,這才是最關(guān)鍵的。

這篇博客分享下對(duì)方差分析的理解。

其實(shí)在之前的文章中,對(duì)t檢驗(yàn)相關(guān)說(shuō)明比較多,而方差分析和t檢驗(yàn)方法的功效和作用非常相近,網(wǎng)上對(duì)此也不是很詳盡,下面首先說(shuō)說(shuō)我的理解。

這里說(shuō)的t檢驗(yàn)是雙樣本t,也就是兩組數(shù),看這兩組數(shù)據(jù)對(duì)應(yīng)的總體差異;方差檢驗(yàn)也是看兩組(及以上)的數(shù)據(jù)見(jiàn)有沒(méi)有差異,那么其實(shí)二者是不是一樣呢?

其實(shí)在某種程度是一樣的。下面的情況分為兩個(gè)維度:檢驗(yàn)的組數(shù)和組內(nèi)方差

情況1:僅有兩組,且組內(nèi)方差相等

在這種情況下,t檢驗(yàn)和F檢驗(yàn)相等

我們看下F檢驗(yàn)的原理,F(xiàn)檢驗(yàn)是看F分布,而F value是SSB/SSW,關(guān)于SSB和SSW可以參考可汗學(xué)院有一節(jié)專(zhuān)門(mén)講組間平方和(SSB)和組內(nèi)平方和(SSW),如果我們把組間平方和理解為兩組之間的差異,組內(nèi)平方和理解為兩組內(nèi)部不同數(shù)據(jù)的差異的話(huà),那么簡(jiǎn)單點(diǎn)說(shuō),兩個(gè)數(shù)據(jù)在有差異的前提下,究竟是組間的差異大,還是組內(nèi)的差異大呢?如果是組間的差異大,那么這兩組數(shù)據(jù)本身不一致的概率就非常大了,對(duì)應(yīng)F值比較大;

那么看看兩組的t檢驗(yàn),t檢驗(yàn)的前提是兩組數(shù)據(jù)都是從不同樣本抽出的數(shù)據(jù),而樣本都符合正態(tài)分布,然后用這兩個(gè)樣本推斷這兩個(gè)總體存不存在差異;舉個(gè)例子,我有一缸黑米,和一缸白米,為了看這兩缸米的密度有沒(méi)有差異,用小勺各盛了十次,觀察密度,然后用小勺的十次,去判定總體的差異;如果想用t檢驗(yàn),前提假設(shè)是由于隨機(jī)誤差,兩缸米在抽取的時(shí)候密度會(huì)有隨機(jī)誤差,那么每次抽取的密度都呈現(xiàn)正態(tài)分布,還有一個(gè)假設(shè),就是兩個(gè)勺子盛的米離散程度是相等的,也就是方差相等。所以,在方差相等,或者說(shuō)方差齊的前提是t檢驗(yàn)的必要前提。而F檢驗(yàn)不要求方差齊,或者說(shuō)本身就是檢查方差的差異的。

按照之前的定義,如果兩組方差齊,由于F檢驗(yàn)的F值是SSB/SSW,組內(nèi)方差相等,如果兩組有變異,那么全部都是由于組間差異造成的,F(xiàn)檢驗(yàn)自然成了t檢驗(yàn),下面附上F檢驗(yàn)和t檢驗(yàn)的代碼和結(jié)果(數(shù)據(jù)參考了《R和ASReml-R統(tǒng)計(jì)分析教程》中的數(shù)據(jù)):

weight<-scan()
16.68 20.67 18.42 18 17.44 15.95 18.68 23.22 21.42 19 18.92 NA

V<-rep(c('LY1','DXY'),rep(6,2))
df<-data.frame(V,weight)
a<-subset(df$weight,V=='LY1')
b<-subset(df$weight,V=='DXY')
var.test(a,b)
t.test(a,b,var.equal=T,paired = F)

t檢驗(yàn)的結(jié)果是:

Two Sample t-test

data:  a and b
t = -2.1808, df = 9, p-value = 0.0571
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -4.86513222  0.08913222
sample estimates:
mean of x mean of y
   17.860    20.248
F檢驗(yàn):

fit<-aov(weight~V,data=df)
summary(fit)

結(jié)果:

  Df Sum Sq Mean Sq F value Pr(>F)  
V            1  15.55   15.55   4.756 0.0571 .
Residuals    9  29.43    3.27                 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
1 observation deleted due to missingness

可以看到p值都是0.0571,相等,因?yàn)榍疤崾窃趖檢驗(yàn)中加入了var.test,然后設(shè)置參數(shù)var.equal=T。下面看看方差不等的情況:

情況2,兩組數(shù)據(jù),方差不齊

在這種情況下,如果忽略了方差齊的前提,比如我重新做一組數(shù)據(jù),先檢測(cè)防擦:

weight<-scan()
16.68 20.67 18.42 18 17.44 30 18.68 23.22 21.42 19 18.92 82

V<-rep(c('LY1','DXY'),rep(6,2))
df<-data.frame(V,weight)
a<-subset(df$weight,V=='LY1')
b<-subset(df$weight,V=='DXY')
var.test(a,b)

看到檢測(cè)結(jié)果:

F test to compare two variances

data:  a and b
F = 0.038913, num df = 5, denom df = 5, p-value = 0.002832
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.005445095 0.278085194
sample estimates:
ratio of variances
        0.03891273

p為0.002832,所以方差不齊;

但是然后我們進(jìn)行方差齊的t檢驗(yàn):

t.test(a,b,var.equal=T,paired = F)

Two Sample t-test

data:  a and b
t = -0.98304, df = 10, p-value = 0.3488
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -33.77097  13.09431
sample estimates:
mean of x mean of y
 20.20167  30.54000  
看到兩組均值相等的概率好大;

方差不齊調(diào)整后的t檢驗(yàn):

t.test(a,b,var.equal=F,paired = F)
Welch Two Sample t-test

data:  a and b
t = -0.98304, df = 5.3885, p-value = 0.3676
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -36.79643  16.11976
sample estimates:
mean of x mean of y
 20.20167  30.54000

P值是0.3676 稍微比之前大一些;

F檢驗(yàn):

fit<-aov(weight~V,data=df)
summary(fit)

  Df Sum Sq Mean Sq F value Pr(>F)
V            1    321   320.6   0.966  0.349
Residuals   10   3318   331.8       

p是0.349;這和t檢驗(yàn)在方差齊的前提下是相等的。

我理解是這樣的:
t檢驗(yàn)的前提是方差齊,只有方差齊了,t檢驗(yàn)的結(jié)果才反應(yīng)兩組數(shù)據(jù)的是否有差異,否則如果方差不齊的話(huà),會(huì)把組內(nèi)的差異也考慮進(jìn)去,所以判定的概率就更寬松;而F檢驗(yàn)其實(shí)就是看組間差異和組內(nèi)差異的比較,所以本質(zhì)上和t檢驗(yàn)方差齊的概念相似。但是實(shí)際上在方差不齊的時(shí)候是無(wú)法進(jìn)行t檢驗(yàn)的,結(jié)果不具有統(tǒng)計(jì)學(xué)意義。
情況3&4:多組情況下,方差齊&多組方差不齊
t檢驗(yàn)一般適用于兩組,所以在多維的情況下,不適用t檢驗(yàn),而F檢驗(yàn)可以判定多組、一組多變量和多組間有交互(單因素、協(xié)方差、雙因素?zé)o重復(fù)、雙因素有重復(fù)等),然后在通過(guò)兩兩比較進(jìn)行分析,用duncan和tukey等方法去判定。

數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線(xiàn)
立即咨詢(xún)
客服在線(xiàn)
立即咨詢(xún)
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶(hù)后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }