
SPSS統(tǒng)計(jì)基礎(chǔ)-交叉表功能的使用
交叉表過程形成二階和多階表,并提供了各種二階表關(guān)聯(lián)檢驗(yàn)和度量。表的結(jié)構(gòu)以及類別是否排序決定了要使用的檢驗(yàn)或度量。
僅對二階表計(jì)算交叉表關(guān)聯(lián)統(tǒng)計(jì)量和度量。如果指定一行、一列和一個(gè)層因子(控制變量),交叉表過程將為層因子(或兩個(gè)或更多控制變量的值組合)的每個(gè)值形成一個(gè)關(guān)聯(lián)統(tǒng)計(jì)量和量度面板。例如,如果性別是一個(gè)已婚(是、否)與生活(生活充滿激情、循規(guī)蹈矩或索然無味)相對照的表的層因子,則女性的二階表結(jié)果將與男性的二階表結(jié)果分開計(jì)算,并打印成互相接續(xù)的面板格式。
關(guān)聯(lián)統(tǒng)計(jì)量和度量。Pearson 卡方、似然比卡方、線性關(guān)聯(lián)檢驗(yàn)、Fisher 的精確檢驗(yàn)、Yates 校正卡方、Pearson 的r、Spearman 的rho、列聯(lián)系數(shù)、phi、Cramér 的V,、對稱和非對稱lambda、Goodman 和Kruskal 的tau、不確定性系數(shù)、gamma、Somers 的d、Kendall 的tau-b、Kendall 的tau-c、eta 系數(shù)、Cohen 的kappa、相對風(fēng)險(xiǎn)估計(jì)、幾率比、McNemar 檢驗(yàn)、Cochran 和Mantel-Haenszel 統(tǒng)計(jì)量以及列比例統(tǒng)計(jì)量。
數(shù)據(jù)。要定義每個(gè)表變量的類別,請使用數(shù)值或字符串(八個(gè)或八個(gè)以下字節(jié))變量的值。例如,對于gender,您可用將數(shù)據(jù)編碼為1 和2,或編碼為male 和female。
假設(shè)。如有關(guān)統(tǒng)計(jì)量一節(jié)中所述,某些統(tǒng)計(jì)量和度量假定已排序的類別(有序數(shù)據(jù))或數(shù)量值(定距或者定比數(shù)據(jù))。另有一些統(tǒng)計(jì)量則在表變量具有未排序的類別(名義數(shù)據(jù))時(shí)有效。對于基于卡方的統(tǒng)計(jì)量(phi、Cramér 的V 和列聯(lián)系數(shù)),數(shù)據(jù)應(yīng)為來自多項(xiàng)分布的隨機(jī)樣本。
獲取交叉制表
E 從菜單中選擇:
分析> 描述統(tǒng)計(jì)> 交叉表...
根據(jù)需要,您可以:
選擇一個(gè)或多個(gè)控制變量。
單擊統(tǒng)計(jì)量以獲取二階表或子表的關(guān)聯(lián)檢驗(yàn)和度量。
單擊單元格以獲取觀察值和期望值、百分比值和殘差。
單擊格式以控制類別的順序
交叉表:層
如果選擇一個(gè)或多個(gè)層變量,則將對每個(gè)層變量(控制變量)的每個(gè)類別產(chǎn)生單獨(dú)的交叉制表。例如,如果有一個(gè)行變量、一個(gè)列變量和一個(gè)具有兩個(gè)類別的層變量,則可為層變量的每個(gè)類別生成一個(gè)二階表。要形成另一層控制變量,請單擊下一個(gè)。為每個(gè)第一層變量與每個(gè)第二層變量(等等)的每種類別組合生成子表。如果請求了關(guān)聯(lián)統(tǒng)計(jì)量和度量,則它們僅應(yīng)用于二階子表。
顯示復(fù)式條形圖。復(fù)式條形圖可幫助匯總個(gè)案組的數(shù)據(jù)。對于在“行”下指定的變量的每個(gè)值,均有一個(gè)聚類條形圖。定義每個(gè)聚類內(nèi)的條形圖的變量就是您在“列”下指定的變量。對于此變量的每個(gè)值,均有一組不同顏色或圖案的條形圖。如果您在“列”或“行”下指定多個(gè)變量,則為每個(gè)雙變量組合生成一個(gè)復(fù)式條形圖。
交叉表統(tǒng)計(jì)量
卡方。對于兩行兩列的表,請選擇卡方以計(jì)算Pearson 卡方、似然比卡方、Fisher 的精確檢驗(yàn)和Yates 修正卡方(連續(xù)性修正)。對于2 × 2 表,如果表不是從具有期望頻率小于5 的單元的較大表中的缺失行或列得來的,則計(jì)算Fisher 的精確檢驗(yàn)。對所有其他2 × 2 表計(jì)算Yates 修正卡方。對于具有任意行列數(shù)的表,選擇卡方來計(jì)算Pearson 卡方和似然比卡方。當(dāng)兩個(gè)表變量都是定量變量時(shí),卡方將產(chǎn)生線性關(guān)聯(lián)檢驗(yàn)。
相關(guān)性。對于行和列都包含排序值的表,相關(guān)將生成Spearman 相關(guān)系數(shù)rho(僅數(shù)值數(shù)據(jù))。Spearman 的rho 是秩次之間的關(guān)聯(lián)的測量。當(dāng)兩個(gè)表變量(因子)都是定量變量時(shí),相關(guān)產(chǎn)生Pearson 相關(guān)系數(shù)r,這是變量之間的線性關(guān)聯(lián)的定量。
名義。對于名義數(shù)據(jù)(無內(nèi)在順序,如天主教、新教和猶太教),可以選擇列聯(lián)系數(shù)、Phi(系數(shù))和Cramér 的V、Lambda(對稱和非對稱lambda 以及Goodman 和Kruskal的tau)和不確定性系數(shù)。
相依系數(shù). 一種基于卡方的關(guān)聯(lián)性測量。值的范圍在0 到1 之間,其中0 表示
行變量和列變量之間不相關(guān),而接近1 的值表示變量之間的相關(guān)度很高??赡?
的極大值取決于表中的行數(shù)和列數(shù)。
Phi and Cramer's V. Phi 是基于卡方統(tǒng)計(jì)量的關(guān)聯(lián)性測量,它將卡方檢驗(yàn)統(tǒng)計(jì)量除以樣本大小,并取結(jié)果的平方根。Cramer 的V 是基于卡方統(tǒng)計(jì)量的關(guān)聯(lián)性測量。
Lambda. 一種相關(guān)性測量,它反映使用自變量的值來預(yù)測因變量的值時(shí),誤差成比例縮小。值為1 表示自變量能完全預(yù)測因變量。值為0 表示自變量對于預(yù)測因變量沒有幫助。
不定性系數(shù). 一種相關(guān)性的測量,它表示當(dāng)一個(gè)變量的值用來預(yù)測其他變量的值時(shí),誤差成比例下降的程度。例如,值0.83 指示如果知道一個(gè)變量的值,則在預(yù)測其他變量的值時(shí)會(huì)將誤差減少83%。程序同時(shí)計(jì)算不定性系數(shù)的對稱版本和不對稱版本。
有序。對于行和列都包含已排序值的表,請選擇Gamma(對于2 階表,為零階;對于3階到10 階表,為條件)、Kendall 的tau-b 和Kendall 的tau-c。要根據(jù)行類別預(yù)測列類別,請選擇Somers 的d。
Gamma. 兩個(gè)有序變量之間的相關(guān)性的對稱度量,它的范圍是從-1 到1。絕對值接近1 的值表示兩個(gè)變量之間存在緊密的關(guān)系。接近0 的值表示關(guān)系較弱或者沒有關(guān)系。對于二階表,顯示零階gamma。對于三階表到n 階表,顯示條件gamma。
Somers d.兩個(gè)有序變量之間相關(guān)性的測量,它的范圍是從-1 到1。絕對值接近1的值表示兩個(gè)變量之間存在緊密的關(guān)系,值接近0 則表示兩個(gè)變量之間關(guān)系很弱或沒有關(guān)系。Somers 的d 是gamma 的不對稱擴(kuò)展,不同之處僅在于它包含了未約束到自變量上的成對的數(shù)目。還將計(jì)算此統(tǒng)計(jì)量的對稱版本。
Kendall's tau-b. 將結(jié)考慮在內(nèi)的有序變量或排序變量的非參數(shù)相關(guān)性測量。系數(shù)的符號(hào)指示關(guān)系的方向,絕對值指示強(qiáng)度,絕對值越大則表示關(guān)系強(qiáng)度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。
Kendalls tau-c. 忽略結(jié)的有序變量的非參數(shù)關(guān)聯(lián)性測量。系數(shù)的符號(hào)指示關(guān)系
的方向,絕對值指示強(qiáng)度,絕對值越大則表示關(guān)系強(qiáng)度越高。可能的取值范圍是從-1 到1,但-1 或+1 值只能從正方表中取得。
按區(qū)間標(biāo)定。當(dāng)一個(gè)變量為分類變量,而另一個(gè)變量為定量變量時(shí),請選擇Eta。分類變量必須進(jìn)行數(shù)值編碼。
Eta. 范圍在0 到1 之間的相關(guān)性測量,其中0 值表示行變量和列變量之間無相關(guān)性,接近1 的值表示高度相關(guān)。Eta 適用于在區(qū)間尺度上度量的因變量(例如收入)以及具有有限類別的自變量(例如性別)。計(jì)算兩個(gè)eta 值:一個(gè)將行變量視為區(qū)間變量,另一個(gè)將列變量視為區(qū)間變量。
Kappa. 當(dāng)兩個(gè)估計(jì)方在估計(jì)同一個(gè)對象時(shí),Cohen 的kappa 度量兩者的估計(jì)之間的一致性。值為1 表示完全一致。值為0 表示幾乎完全不一致。Kappa 基于平方表,其中列和行值代表相同刻度。在任何單元格中,如果有一個(gè)變量有觀察值但另一個(gè)變量沒有觀察值,則單元格會(huì)分配計(jì)數(shù)0。如果這兩個(gè)變量的數(shù)據(jù)存儲(chǔ)類型(字符串或數(shù)值)不同,Kappa 不計(jì)算。對于字符串變量,這兩個(gè)變量必須有相同的定義長度。風(fēng)險(xiǎn). 對于2 x 2 表,某因子的存在與某事件的發(fā)生之間關(guān)聯(lián)性強(qiáng)度的測量。如果該統(tǒng)計(jì)量的置信區(qū)間包含值1,則不能假設(shè)因子與事件相關(guān)。當(dāng)因子出現(xiàn)很少時(shí),幾率比可用作估計(jì)或相對風(fēng)險(xiǎn)。
McNemar(M). 兩個(gè)相關(guān)二分變量的非參數(shù)檢驗(yàn)。使用卡方分布檢驗(yàn)響應(yīng)改變?!爸芭c之后”設(shè)計(jì)中的試驗(yàn)干預(yù)會(huì)導(dǎo)致響因變量發(fā)生變化,它對于檢測到這些變化很有用。對于較大的正方表,會(huì)報(bào)告對稱性的McNemar-Bowker 檢驗(yàn)。
Cochran's and Mantel-Haenszel 統(tǒng)計(jì)量. Cochran 和Mantel-Haenszel 統(tǒng)計(jì)量可以用于檢驗(yàn)二分因子變量和二分響應(yīng)變量之間的條件獨(dú)立性,條件是給定一個(gè)或多個(gè)分層(控制)變量定義的協(xié)變量模式。請注意:其他統(tǒng)計(jì)逐層計(jì)算,而Cochran 和Mantel-Haenszel 統(tǒng)計(jì)對所有層進(jìn)行一次性計(jì)算。
交叉表:單元顯示
計(jì)數(shù)。如果行和列變量彼此獨(dú)立,則這是實(shí)際觀察的個(gè)案數(shù)和期望的個(gè)案數(shù)。您可以選擇隱藏低于指定整數(shù)的計(jì)數(shù)。隱藏值將顯示為
比較列的比例。該選項(xiàng)將計(jì)算列屬性的成對比較,并指出給定行中的哪對列明顯不同。使用下標(biāo)字母以APA 樣式格式在交叉表中標(biāo)識(shí)顯著性差異,并以0.05 顯著性水平對其進(jìn)行計(jì)算。
注意:如果指定該選項(xiàng)并且不選擇觀察計(jì)數(shù)或列百分比,則觀察計(jì)數(shù)包含在
交叉表中,并且會(huì)以APA 樣式下標(biāo)字母標(biāo)識(shí)列比例檢驗(yàn)的結(jié)果。
調(diào)整p 值(Bonferroni 方法)。列比例的成對比較使用了Bonferroni 修正,可在進(jìn)行了多個(gè)比較后調(diào)整觀察到的顯著性水平。
百分比。百分比值可以跨行或沿列進(jìn)行相加。還提供表(一層)中表示的個(gè)案總數(shù)的百分比值。注意:如果在“計(jì)數(shù)”組中選擇隱藏小計(jì)數(shù),也會(huì)隱藏與隱藏計(jì)數(shù)相關(guān)的百分比。
殘差。未標(biāo)準(zhǔn)化的原始?xì)埐罱o出了觀察值和期望值之間的差。還提供標(biāo)準(zhǔn)化殘差和經(jīng)過調(diào)整的標(biāo)準(zhǔn)化殘差。
未標(biāo)準(zhǔn)化. 觀察值與期望值之間的差。如果兩個(gè)變量之間沒有關(guān)系,則期望值是期望在單元中出現(xiàn)的個(gè)案數(shù)。如果行變量和列變量獨(dú)立,則正的殘差表示單元中的實(shí)際個(gè)案數(shù)多于期望的個(gè)案數(shù)。
標(biāo)準(zhǔn)化. 殘差除以其標(biāo)準(zhǔn)差的估計(jì)。標(biāo)準(zhǔn)化殘差也稱為Pearson 殘差,它的均
值為0,標(biāo)準(zhǔn)差為1。
調(diào)節(jié)的標(biāo)準(zhǔn)化. 單元格的殘差(觀察值減去期望值)除以其標(biāo)準(zhǔn)誤的估計(jì)值。生成的標(biāo)準(zhǔn)化殘差表示為均值上下的標(biāo)準(zhǔn)差單位。
非整數(shù)權(quán)重。單元計(jì)數(shù)通常為整數(shù)值,因?yàn)樗鼈兇砻總€(gè)單元中的個(gè)案個(gè)數(shù)。但是,如果數(shù)據(jù)文件當(dāng)前按某個(gè)帶小數(shù)值(例如1.25)的權(quán)重變量進(jìn)行加權(quán),則單元計(jì)數(shù)也可能是小數(shù)值。在計(jì)算單元計(jì)數(shù)之前可以進(jìn)行截?cái)嗷蛏崛?,或?yàn)楸盹@示和統(tǒng)計(jì)計(jì)算都使用小數(shù)單元計(jì)數(shù)。
四舍五入單元格計(jì)數(shù). 在計(jì)算任何統(tǒng)計(jì)之前,個(gè)案權(quán)重按原樣使用,但單元中的累積權(quán)重要四舍五入。
截短單元格計(jì)數(shù). 在計(jì)算任何統(tǒng)計(jì)之前,個(gè)案權(quán)重按原樣使用,但截短單元中
的累積權(quán)重。
四舍五入個(gè)案權(quán)重. 在使用之前對個(gè)案權(quán)重進(jìn)行四舍五入。
截短個(gè)案權(quán)重. 在使用之前對個(gè)案權(quán)重進(jìn)行截短。
無調(diào)節(jié). 個(gè)案權(quán)重按原樣使用且使用小數(shù)單元計(jì)數(shù)。但是,當(dāng)需要“精確”統(tǒng)計(jì)
(僅由“精確檢驗(yàn)”選項(xiàng)提供)時(shí),在計(jì)算“精確”檢驗(yàn)統(tǒng)計(jì)之前,單元中的累積
權(quán)重或者截短或者四舍五入。
推薦學(xué)習(xí)書籍
《CDA一級(jí)教材》適合CDA一級(jí)考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計(jì)已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09