
SPSS統(tǒng)計基礎-交叉表功能的使用
交叉表過程形成二階和多階表,并提供了各種二階表關聯(lián)檢驗和度量。表的結(jié)構(gòu)以及類別是否排序決定了要使用的檢驗或度量。
僅對二階表計算交叉表關聯(lián)統(tǒng)計量和度量。如果指定一行、一列和一個層因子(控制變量),交叉表過程將為層因子(或兩個或更多控制變量的值組合)的每個值形成一個關聯(lián)統(tǒng)計量和量度面板。例如,如果性別是一個已婚(是、否)與生活(生活充滿激情、循規(guī)蹈矩或索然無味)相對照的表的層因子,則女性的二階表結(jié)果將與男性的二階表結(jié)果分開計算,并打印成互相接續(xù)的面板格式。
關聯(lián)統(tǒng)計量和度量。Pearson 卡方、似然比卡方、線性關聯(lián)檢驗、Fisher 的精確檢驗、Yates 校正卡方、Pearson 的r、Spearman 的rho、列聯(lián)系數(shù)、phi、Cramér 的V,、對稱和非對稱lambda、Goodman 和Kruskal 的tau、不確定性系數(shù)、gamma、Somers 的d、Kendall 的tau-b、Kendall 的tau-c、eta 系數(shù)、Cohen 的kappa、相對風險估計、幾率比、McNemar 檢驗、Cochran 和Mantel-Haenszel 統(tǒng)計量以及列比例統(tǒng)計量。
數(shù)據(jù)。要定義每個表變量的類別,請使用數(shù)值或字符串(八個或八個以下字節(jié))變量的值。例如,對于gender,您可用將數(shù)據(jù)編碼為1 和2,或編碼為male 和female。
假設。如有關統(tǒng)計量一節(jié)中所述,某些統(tǒng)計量和度量假定已排序的類別(有序數(shù)據(jù))或數(shù)量值(定距或者定比數(shù)據(jù))。另有一些統(tǒng)計量則在表變量具有未排序的類別(名義數(shù)據(jù))時有效。對于基于卡方的統(tǒng)計量(phi、Cramér 的V 和列聯(lián)系數(shù)),數(shù)據(jù)應為來自多項分布的隨機樣本。
獲取交叉制表
E 從菜單中選擇:
分析> 描述統(tǒng)計> 交叉表...
根據(jù)需要,您可以:
選擇一個或多個控制變量。
單擊統(tǒng)計量以獲取二階表或子表的關聯(lián)檢驗和度量。
單擊單元格以獲取觀察值和期望值、百分比值和殘差。
單擊格式以控制類別的順序
交叉表:層
如果選擇一個或多個層變量,則將對每個層變量(控制變量)的每個類別產(chǎn)生單獨的交叉制表。例如,如果有一個行變量、一個列變量和一個具有兩個類別的層變量,則可為層變量的每個類別生成一個二階表。要形成另一層控制變量,請單擊下一個。為每個第一層變量與每個第二層變量(等等)的每種類別組合生成子表。如果請求了關聯(lián)統(tǒng)計量和度量,則它們僅應用于二階子表。
顯示復式條形圖。復式條形圖可幫助匯總個案組的數(shù)據(jù)。對于在“行”下指定的變量的每個值,均有一個聚類條形圖。定義每個聚類內(nèi)的條形圖的變量就是您在“列”下指定的變量。對于此變量的每個值,均有一組不同顏色或圖案的條形圖。如果您在“列”或“行”下指定多個變量,則為每個雙變量組合生成一個復式條形圖。
交叉表統(tǒng)計量
卡方。對于兩行兩列的表,請選擇卡方以計算Pearson 卡方、似然比卡方、Fisher 的精確檢驗和Yates 修正卡方(連續(xù)性修正)。對于2 × 2 表,如果表不是從具有期望頻率小于5 的單元的較大表中的缺失行或列得來的,則計算Fisher 的精確檢驗。對所有其他2 × 2 表計算Yates 修正卡方。對于具有任意行列數(shù)的表,選擇卡方來計算Pearson 卡方和似然比卡方。當兩個表變量都是定量變量時,卡方將產(chǎn)生線性關聯(lián)檢驗。
相關性。對于行和列都包含排序值的表,相關將生成Spearman 相關系數(shù)rho(僅數(shù)值數(shù)據(jù))。Spearman 的rho 是秩次之間的關聯(lián)的測量。當兩個表變量(因子)都是定量變量時,相關產(chǎn)生Pearson 相關系數(shù)r,這是變量之間的線性關聯(lián)的定量。
名義。對于名義數(shù)據(jù)(無內(nèi)在順序,如天主教、新教和猶太教),可以選擇列聯(lián)系數(shù)、Phi(系數(shù))和Cramér 的V、Lambda(對稱和非對稱lambda 以及Goodman 和Kruskal的tau)和不確定性系數(shù)。
相依系數(shù). 一種基于卡方的關聯(lián)性測量。值的范圍在0 到1 之間,其中0 表示
行變量和列變量之間不相關,而接近1 的值表示變量之間的相關度很高??赡?
的極大值取決于表中的行數(shù)和列數(shù)。
Phi and Cramer's V. Phi 是基于卡方統(tǒng)計量的關聯(lián)性測量,它將卡方檢驗統(tǒng)計量除以樣本大小,并取結(jié)果的平方根。Cramer 的V 是基于卡方統(tǒng)計量的關聯(lián)性測量。
Lambda. 一種相關性測量,它反映使用自變量的值來預測因變量的值時,誤差成比例縮小。值為1 表示自變量能完全預測因變量。值為0 表示自變量對于預測因變量沒有幫助。
不定性系數(shù). 一種相關性的測量,它表示當一個變量的值用來預測其他變量的值時,誤差成比例下降的程度。例如,值0.83 指示如果知道一個變量的值,則在預測其他變量的值時會將誤差減少83%。程序同時計算不定性系數(shù)的對稱版本和不對稱版本。
有序。對于行和列都包含已排序值的表,請選擇Gamma(對于2 階表,為零階;對于3階到10 階表,為條件)、Kendall 的tau-b 和Kendall 的tau-c。要根據(jù)行類別預測列類別,請選擇Somers 的d。
Gamma. 兩個有序變量之間的相關性的對稱度量,它的范圍是從-1 到1。絕對值接近1 的值表示兩個變量之間存在緊密的關系。接近0 的值表示關系較弱或者沒有關系。對于二階表,顯示零階gamma。對于三階表到n 階表,顯示條件gamma。
Somers d.兩個有序變量之間相關性的測量,它的范圍是從-1 到1。絕對值接近1的值表示兩個變量之間存在緊密的關系,值接近0 則表示兩個變量之間關系很弱或沒有關系。Somers 的d 是gamma 的不對稱擴展,不同之處僅在于它包含了未約束到自變量上的成對的數(shù)目。還將計算此統(tǒng)計量的對稱版本。
Kendall's tau-b. 將結(jié)考慮在內(nèi)的有序變量或排序變量的非參數(shù)相關性測量。系數(shù)的符號指示關系的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。
Kendalls tau-c. 忽略結(jié)的有序變量的非參數(shù)關聯(lián)性測量。系數(shù)的符號指示關系
的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。
按區(qū)間標定。當一個變量為分類變量,而另一個變量為定量變量時,請選擇Eta。分類變量必須進行數(shù)值編碼。
Eta. 范圍在0 到1 之間的相關性測量,其中0 值表示行變量和列變量之間無相關性,接近1 的值表示高度相關。Eta 適用于在區(qū)間尺度上度量的因變量(例如收入)以及具有有限類別的自變量(例如性別)。計算兩個eta 值:一個將行變量視為區(qū)間變量,另一個將列變量視為區(qū)間變量。
Kappa. 當兩個估計方在估計同一個對象時,Cohen 的kappa 度量兩者的估計之間的一致性。值為1 表示完全一致。值為0 表示幾乎完全不一致。Kappa 基于平方表,其中列和行值代表相同刻度。在任何單元格中,如果有一個變量有觀察值但另一個變量沒有觀察值,則單元格會分配計數(shù)0。如果這兩個變量的數(shù)據(jù)存儲類型(字符串或數(shù)值)不同,Kappa 不計算。對于字符串變量,這兩個變量必須有相同的定義長度。風險. 對于2 x 2 表,某因子的存在與某事件的發(fā)生之間關聯(lián)性強度的測量。如果該統(tǒng)計量的置信區(qū)間包含值1,則不能假設因子與事件相關。當因子出現(xiàn)很少時,幾率比可用作估計或相對風險。
McNemar(M). 兩個相關二分變量的非參數(shù)檢驗。使用卡方分布檢驗響應改變?!爸芭c之后”設計中的試驗干預會導致響因變量發(fā)生變化,它對于檢測到這些變化很有用。對于較大的正方表,會報告對稱性的McNemar-Bowker 檢驗。
Cochran's and Mantel-Haenszel 統(tǒng)計量. Cochran 和Mantel-Haenszel 統(tǒng)計量可以用于檢驗二分因子變量和二分響應變量之間的條件獨立性,條件是給定一個或多個分層(控制)變量定義的協(xié)變量模式。請注意:其他統(tǒng)計逐層計算,而Cochran 和Mantel-Haenszel 統(tǒng)計對所有層進行一次性計算。
交叉表:單元顯示
計數(shù)。如果行和列變量彼此獨立,則這是實際觀察的個案數(shù)和期望的個案數(shù)。您可以選擇隱藏低于指定整數(shù)的計數(shù)。隱藏值將顯示為
比較列的比例。該選項將計算列屬性的成對比較,并指出給定行中的哪對列明顯不同。使用下標字母以APA 樣式格式在交叉表中標識顯著性差異,并以0.05 顯著性水平對其進行計算。
注意:如果指定該選項并且不選擇觀察計數(shù)或列百分比,則觀察計數(shù)包含在
交叉表中,并且會以APA 樣式下標字母標識列比例檢驗的結(jié)果。
調(diào)整p 值(Bonferroni 方法)。列比例的成對比較使用了Bonferroni 修正,可在進行了多個比較后調(diào)整觀察到的顯著性水平。
百分比。百分比值可以跨行或沿列進行相加。還提供表(一層)中表示的個案總數(shù)的百分比值。注意:如果在“計數(shù)”組中選擇隱藏小計數(shù),也會隱藏與隱藏計數(shù)相關的百分比。
殘差。未標準化的原始殘差給出了觀察值和期望值之間的差。還提供標準化殘差和經(jīng)過調(diào)整的標準化殘差。
未標準化. 觀察值與期望值之間的差。如果兩個變量之間沒有關系,則期望值是期望在單元中出現(xiàn)的個案數(shù)。如果行變量和列變量獨立,則正的殘差表示單元中的實際個案數(shù)多于期望的個案數(shù)。
標準化. 殘差除以其標準差的估計。標準化殘差也稱為Pearson 殘差,它的均
值為0,標準差為1。
調(diào)節(jié)的標準化. 單元格的殘差(觀察值減去期望值)除以其標準誤的估計值。生成的標準化殘差表示為均值上下的標準差單位。
非整數(shù)權(quán)重。單元計數(shù)通常為整數(shù)值,因為它們代表每個單元中的個案個數(shù)。但是,如果數(shù)據(jù)文件當前按某個帶小數(shù)值(例如1.25)的權(quán)重變量進行加權(quán),則單元計數(shù)也可能是小數(shù)值。在計算單元計數(shù)之前可以進行截斷或舍入,或為表顯示和統(tǒng)計計算都使用小數(shù)單元計數(shù)。
四舍五入單元格計數(shù). 在計算任何統(tǒng)計之前,個案權(quán)重按原樣使用,但單元中的累積權(quán)重要四舍五入。
截短單元格計數(shù). 在計算任何統(tǒng)計之前,個案權(quán)重按原樣使用,但截短單元中
的累積權(quán)重。
四舍五入個案權(quán)重. 在使用之前對個案權(quán)重進行四舍五入。
截短個案權(quán)重. 在使用之前對個案權(quán)重進行截短。
無調(diào)節(jié). 個案權(quán)重按原樣使用且使用小數(shù)單元計數(shù)。但是,當需要“精確”統(tǒng)計
(僅由“精確檢驗”選項提供)時,在計算“精確”檢驗統(tǒng)計之前,單元中的累積
權(quán)重或者截短或者四舍五入。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03