
SPSS分析技術(shù):典型相關(guān)分析;化繁為簡,典型相關(guān)分析幫助分析者理清思路
之前介紹過的相關(guān)分析有兩個變量之間的線性相關(guān)關(guān)系,用的是簡單相關(guān)系數(shù)r;還有復(fù)相關(guān)系數(shù),用來表示一個變量與多個變量組成的整體之間的線性相關(guān)關(guān)系;很多人會問,如果想研究兩組變量之間的相關(guān)關(guān)系,該使用什么方法呢?今天介紹的典型相關(guān)分析就是用于解決這個問題的分析方法。
在實際生活當(dāng)中,關(guān)于兩組變量之間的相關(guān)關(guān)系研究很多。例如,某個城市的經(jīng)濟發(fā)展水平(GDP、貨物周轉(zhuǎn)量、生產(chǎn)建設(shè)投資等)與居民生活水平(居民人均年收入、居民財產(chǎn)性收入、恩格爾系數(shù)等)間的相關(guān)關(guān)系;大學(xué)生畢業(yè)時的成績(各種科目成績)和入學(xué)時成績的相關(guān)關(guān)系;公司內(nèi)不同職位與員工工作滿意度之間的相關(guān)關(guān)系;領(lǐng)導(dǎo)者的領(lǐng)導(dǎo)能力與情緒智力的相關(guān)關(guān)系等。典型相關(guān)分析在實證研究中有廣泛的運用,常常被作為結(jié)構(gòu)方程模型研究的基礎(chǔ)步驟。
上方左圖是典型相關(guān)分析的結(jié)果展示圖,這和右邊的拔河圖有異曲同工之處。兩個環(huán)境中的每個參與者(變量)都是決定結(jié)果的因子。
典型相關(guān)關(guān)系
學(xué)習(xí)過前面介紹的因子分析的朋友應(yīng)該很容易想到:是否能夠從兩組變量中提取公因子,然后用公因子之間的線性相關(guān)關(guān)系表示兩組變量之間的相關(guān)關(guān)系呢?如果能想到這一點,說明已經(jīng)擁有知識點拓展和觸類旁通的數(shù)據(jù)分析能力。典型相關(guān)分析就是借用了主成分分析的分析邏輯,通過原始變量的線性組合,找到一個或幾個綜合變量來替代原始變量,從而將兩組原始變量的相關(guān)關(guān)系研究轉(zhuǎn)換成少數(shù)幾對綜合變量的相關(guān)關(guān)系研究。
典型相關(guān)分析首先對兩組變量進行線性組合,找到一對綜合變量,使這對綜合變量具有最大相關(guān)性;然后再通過線性組合找出第二對綜合變量,它們之間的相關(guān)關(guān)系會小于第一對綜合變量;重復(fù)以上操作,直到兩組變量的數(shù)據(jù)信息提取完成為止。提取的綜合變量被稱為典型變量或典則變量,它們之間的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。與主成分分析相似,只需提取少數(shù)幾對綜合變量就可以概括兩組變量的數(shù)據(jù)信息。典型相關(guān)分析與因子分析雖然都是通過原始變量的線性組合實現(xiàn)數(shù)據(jù)信息的濃縮,但是二者還是有不同的,不同之處在于變量線性組合的標(biāo)準(zhǔn)不一樣。
因子分析的目的是簡化分析局面?;谝唤M變量的相關(guān)關(guān)系,用少數(shù)幾個公因子代替整個變量組的信息(數(shù)據(jù)的變異),實現(xiàn)變量降維,簡化數(shù)據(jù)分析局面。因此,因子分析在做原始變量線性組合時,尋找公因子的標(biāo)準(zhǔn)是數(shù)據(jù)變異或波動最大的方向。而典型相關(guān)分析的目的是研究兩組變量之間的相關(guān)關(guān)系,因此在做原始變量的線性組合時(提取公因子),考慮的重點在于尋找相關(guān)關(guān)系最強的典型變量對,簡化兩組變量之間錯綜復(fù)雜的相關(guān)關(guān)系網(wǎng)。
案例分析
我們國家是個人口大國,最近一次人口普查結(jié)果顯示我們國家的人口數(shù)達到13.3億人,農(nóng)村人口數(shù)達到50.32%,因此提高農(nóng)村居民的生活水平一直以來都是國家管理的重要內(nèi)容。農(nóng)村居民的收入和支出能夠很好地反映農(nóng)村居民的生活水平?,F(xiàn)在有一份數(shù)據(jù),收集了全國30個省市自治區(qū)直轄市的農(nóng)村居民收入和支出情況,包括四項收入數(shù)據(jù)和8項支出數(shù)據(jù):分別是勞動收入(X1)、經(jīng)營收入(X2)、轉(zhuǎn)移收入(X3)、財產(chǎn)收入(X4);食品支出(Y1)、衣著支出(Y2)、居住支出(Y3)、家庭設(shè)備和服務(wù)支出(Y4)、醫(yī)療保健支出(Y5)、交通通訊支出(Y6)、文教娛樂支出(Y7)、其它支出(Y8)。SPSS數(shù)據(jù)如下圖所示:
操作須知
SPSS沒有為典型相關(guān)分析設(shè)置專門的操作菜單,只提供了一份名為Canonical correlation.sps的宏程序文件,這個文件存放在SPSS安裝文件夾Samples文件夾內(nèi)。只需在使用時調(diào)用,并輸入?yún)?shù)語句即可調(diào)用輸出結(jié)果。
分析步驟
點擊菜單【文件】-【新建】-【數(shù)據(jù)】,跳出語法編輯器窗口,輸入以下內(nèi)容。點擊確定,輸出結(jié)果。
結(jié)果解釋
1、相關(guān)系數(shù)矩陣;結(jié)果輸出了三個相關(guān)系數(shù)矩陣,分別是第一組變量、第二組變量、第一組與第二組之間的相關(guān)系數(shù)矩陣。變量線性組合的基礎(chǔ)就是相關(guān)系數(shù)矩陣。從前兩個相關(guān)系數(shù)矩陣可以發(fā)現(xiàn),兩組變量內(nèi)部,變量之間的相關(guān)系數(shù)都非常大,說明它們反映的收入和支出因素是類似的,所以不能很好的反映影響農(nóng)民收入和支出水平的整體情況。
2、線性相關(guān)系數(shù)及顯著性檢驗。本案例中提取了4對典型變量(每組變量提取4個公因子),這四對變量之間的相關(guān)系數(shù)依次降低,從0.980減少到0.561。顯著性檢驗結(jié)果顯示只有前面兩對典型變量的相關(guān)系數(shù)有統(tǒng)計學(xué)意義。
3、典型變量系數(shù);下面有四個表格,第一行的兩個表是第一組變量抽取典型變量的結(jié)果,作圖使用標(biāo)準(zhǔn)化的原始變量數(shù)據(jù),右圖直接使用原始變量數(shù)據(jù);第二行的兩個表格則是第二組變量抽取典型變量的結(jié)果。根據(jù)這些表格的數(shù)據(jù)可以寫出典型變量的計算公式。
第二步的典型變量相關(guān)系數(shù)的檢驗結(jié)果顯示,只有前面兩對典型變量的相關(guān)系數(shù)有統(tǒng)計學(xué)意義,U1與V1的相關(guān)系數(shù)為0.980,U2與V2的相關(guān)系數(shù)為0.908,因此下面只寫出這兩對典型變量由標(biāo)準(zhǔn)化數(shù)據(jù)組成的計算公式:
可以發(fā)現(xiàn),因為兩組變量的系數(shù)很多都是負的,所以這兩對典型變量的現(xiàn)實含義不好解釋,原因就在于前面提到的兩組變量內(nèi)部的相關(guān)關(guān)系太強,無法表示農(nóng)村居民收入的綜合情況。本案例數(shù)據(jù)建立的典型相關(guān)模型的效果很差,應(yīng)該重新選擇能夠充分反映農(nóng)村居民收入水平的變量。
4、相關(guān)系數(shù)結(jié)果;下圖四個表是相關(guān)系數(shù)表,第一列是本組變量與本組產(chǎn)生的典型變量的相關(guān)系數(shù);第二列是本組變量與另一組變量產(chǎn)生的典型變量之間的相關(guān)系數(shù)。
根據(jù)相關(guān)系數(shù)數(shù)據(jù),可以做出兩對典型變量的相關(guān)系數(shù)結(jié)構(gòu)圖,由于作圖的方式是一樣的,因此用第一對典型變量為例進行說明。從結(jié)構(gòu)圖同樣可以知道,四個收入變量與公因子U1的相關(guān)系數(shù)都是負數(shù),而8個支出變量與公因子V1的相關(guān)系數(shù)也都為負數(shù),同樣說明了本案例的典型相關(guān)模型效果很差,不能用現(xiàn)實含義來解釋。
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10