分類變量之間的相關(guān)性一般可以采用列聯(lián)表分析或卡方檢驗(yàn)的方法來進(jìn)行驗(yàn)證。
列聯(lián)表是兩個(gè)分類變量的分類水平之間形成的交叉頻數(shù)表,通過計(jì)算行百分比或列百分比,對(duì)實(shí)際頻率和期望頻率進(jìn)行對(duì)比分析,例如一個(gè)典型的列聯(lián)表如下:

對(duì)于表中頻數(shù)、期望頻數(shù)、行/列百分比的解讀方法要熟練掌握。比如98代表的是頭發(fā)顏色為金色,眼睛顏色為深色的樣本數(shù)量。而355.2則是期望的數(shù)量。6.7%是行百分比,也就是在所有頭發(fā)顏色為金色的樣本中,眼睛顏色為深色的占比。
列聯(lián)表是一種比較簡(jiǎn)單的描述性統(tǒng)計(jì)方法,而卡方檢驗(yàn)則可以通過量化的方法對(duì)兩個(gè)分類變量的相關(guān)性進(jìn)行檢驗(yàn),卡方統(tǒng)計(jì)量如下:

其中O是觀察到的頻數(shù),E是期望的頻數(shù),可以看到卡方檢驗(yàn)關(guān)注的就是統(tǒng)計(jì)樣本實(shí)際觀測(cè)值與期望值之間的偏離程度。卡方值越大,說明偏離越大,也就是實(shí)際觀測(cè)值越不符合期望。如果卡方值等于0,這說明觀測(cè)結(jié)果和期望完全相符??ǚ綑z驗(yàn)是一種用途非常廣的假設(shè)檢驗(yàn)方法。
另外卡方檢驗(yàn)的結(jié)果與分類變量的順序無關(guān),將任意兩行進(jìn)行互換,卡方值不變。








暫無數(shù)據(jù)