
SPSS分析技術(shù):典型相關(guān)分析;化繁為簡(jiǎn),典型相關(guān)分析幫助分析者理清思路
之前介紹過(guò)的相關(guān)分析有兩個(gè)變量之間的線性相關(guān)關(guān)系,用的是簡(jiǎn)單相關(guān)系數(shù)r;還有復(fù)相關(guān)系數(shù),用來(lái)表示一個(gè)變量與多個(gè)變量組成的整體之間的線性相關(guān)關(guān)系;很多人會(huì)問(wèn),如果想研究?jī)山M變量之間的相關(guān)關(guān)系,該使用什么方法呢?今天介紹的典型相關(guān)分析就是用于解決這個(gè)問(wèn)題的分析方法。
在實(shí)際生活當(dāng)中,關(guān)于兩組變量之間的相關(guān)關(guān)系研究很多。例如,某個(gè)城市的經(jīng)濟(jì)發(fā)展水平(GDP、貨物周轉(zhuǎn)量、生產(chǎn)建設(shè)投資等)與居民生活水平(居民人均年收入、居民財(cái)產(chǎn)性收入、恩格爾系數(shù)等)間的相關(guān)關(guān)系;大學(xué)生畢業(yè)時(shí)的成績(jī)(各種科目成績(jī))和入學(xué)時(shí)成績(jī)的相關(guān)關(guān)系;公司內(nèi)不同職位與員工工作滿(mǎn)意度之間的相關(guān)關(guān)系;領(lǐng)導(dǎo)者的領(lǐng)導(dǎo)能力與情緒智力的相關(guān)關(guān)系等。典型相關(guān)分析在實(shí)證研究中有廣泛的運(yùn)用,常常被作為結(jié)構(gòu)方程模型研究的基礎(chǔ)步驟。
上方左圖是典型相關(guān)分析的結(jié)果展示圖,這和右邊的拔河圖有異曲同工之處。兩個(gè)環(huán)境中的每個(gè)參與者(變量)都是決定結(jié)果的因子。
典型相關(guān)關(guān)系
學(xué)習(xí)過(guò)前面介紹的因子分析的朋友應(yīng)該很容易想到:是否能夠從兩組變量中提取公因子,然后用公因子之間的線性相關(guān)關(guān)系表示兩組變量之間的相關(guān)關(guān)系呢?如果能想到這一點(diǎn),說(shuō)明已經(jīng)擁有知識(shí)點(diǎn)拓展和觸類(lèi)旁通的數(shù)據(jù)分析能力。典型相關(guān)分析就是借用了主成分分析的分析邏輯,通過(guò)原始變量的線性組合,找到一個(gè)或幾個(gè)綜合變量來(lái)替代原始變量,從而將兩組原始變量的相關(guān)關(guān)系研究轉(zhuǎn)換成少數(shù)幾對(duì)綜合變量的相關(guān)關(guān)系研究。
典型相關(guān)分析首先對(duì)兩組變量進(jìn)行線性組合,找到一對(duì)綜合變量,使這對(duì)綜合變量具有最大相關(guān)性;然后再通過(guò)線性組合找出第二對(duì)綜合變量,它們之間的相關(guān)關(guān)系會(huì)小于第一對(duì)綜合變量;重復(fù)以上操作,直到兩組變量的數(shù)據(jù)信息提取完成為止。提取的綜合變量被稱(chēng)為典型變量或典則變量,它們之間的相關(guān)系數(shù)稱(chēng)為典型相關(guān)系數(shù)。與主成分分析相似,只需提取少數(shù)幾對(duì)綜合變量就可以概括兩組變量的數(shù)據(jù)信息。典型相關(guān)分析與因子分析雖然都是通過(guò)原始變量的線性組合實(shí)現(xiàn)數(shù)據(jù)信息的濃縮,但是二者還是有不同的,不同之處在于變量線性組合的標(biāo)準(zhǔn)不一樣。
因子分析的目的是簡(jiǎn)化分析局面?;谝唤M變量的相關(guān)關(guān)系,用少數(shù)幾個(gè)公因子代替整個(gè)變量組的信息(數(shù)據(jù)的變異),實(shí)現(xiàn)變量降維,簡(jiǎn)化數(shù)據(jù)分析局面。因此,因子分析在做原始變量線性組合時(shí),尋找公因子的標(biāo)準(zhǔn)是數(shù)據(jù)變異或波動(dòng)最大的方向。而典型相關(guān)分析的目的是研究?jī)山M變量之間的相關(guān)關(guān)系,因此在做原始變量的線性組合時(shí)(提取公因子),考慮的重點(diǎn)在于尋找相關(guān)關(guān)系最強(qiáng)的典型變量對(duì),簡(jiǎn)化兩組變量之間錯(cuò)綜復(fù)雜的相關(guān)關(guān)系網(wǎng)。
案例分析
我們國(guó)家是個(gè)人口大國(guó),最近一次人口普查結(jié)果顯示我們國(guó)家的人口數(shù)達(dá)到13.3億人,農(nóng)村人口數(shù)達(dá)到50.32%,因此提高農(nóng)村居民的生活水平一直以來(lái)都是國(guó)家管理的重要內(nèi)容。農(nóng)村居民的收入和支出能夠很好地反映農(nóng)村居民的生活水平?,F(xiàn)在有一份數(shù)據(jù),收集了全國(guó)30個(gè)省市自治區(qū)直轄市的農(nóng)村居民收入和支出情況,包括四項(xiàng)收入數(shù)據(jù)和8項(xiàng)支出數(shù)據(jù):分別是勞動(dòng)收入(X1)、經(jīng)營(yíng)收入(X2)、轉(zhuǎn)移收入(X3)、財(cái)產(chǎn)收入(X4);食品支出(Y1)、衣著支出(Y2)、居住支出(Y3)、家庭設(shè)備和服務(wù)支出(Y4)、醫(yī)療保健支出(Y5)、交通通訊支出(Y6)、文教娛樂(lè)支出(Y7)、其它支出(Y8)。SPSS數(shù)據(jù)如下圖所示:
操作須知
SPSS沒(méi)有為典型相關(guān)分析設(shè)置專(zhuān)門(mén)的操作菜單,只提供了一份名為Canonical correlation.sps的宏程序文件,這個(gè)文件存放在SPSS安裝文件夾Samples文件夾內(nèi)。只需在使用時(shí)調(diào)用,并輸入?yún)?shù)語(yǔ)句即可調(diào)用輸出結(jié)果。
分析步驟
點(diǎn)擊菜單【文件】-【新建】-【數(shù)據(jù)】,跳出語(yǔ)法編輯器窗口,輸入以下內(nèi)容。點(diǎn)擊確定,輸出結(jié)果。
結(jié)果解釋
1、相關(guān)系數(shù)矩陣;結(jié)果輸出了三個(gè)相關(guān)系數(shù)矩陣,分別是第一組變量、第二組變量、第一組與第二組之間的相關(guān)系數(shù)矩陣。變量線性組合的基礎(chǔ)就是相關(guān)系數(shù)矩陣。從前兩個(gè)相關(guān)系數(shù)矩陣可以發(fā)現(xiàn),兩組變量?jī)?nèi)部,變量之間的相關(guān)系數(shù)都非常大,說(shuō)明它們反映的收入和支出因素是類(lèi)似的,所以不能很好的反映影響農(nóng)民收入和支出水平的整體情況。
2、線性相關(guān)系數(shù)及顯著性檢驗(yàn)。本案例中提取了4對(duì)典型變量(每組變量提取4個(gè)公因子),這四對(duì)變量之間的相關(guān)系數(shù)依次降低,從0.980減少到0.561。顯著性檢驗(yàn)結(jié)果顯示只有前面兩對(duì)典型變量的相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義。
3、典型變量系數(shù);下面有四個(gè)表格,第一行的兩個(gè)表是第一組變量抽取典型變量的結(jié)果,作圖使用標(biāo)準(zhǔn)化的原始變量數(shù)據(jù),右圖直接使用原始變量數(shù)據(jù);第二行的兩個(gè)表格則是第二組變量抽取典型變量的結(jié)果。根據(jù)這些表格的數(shù)據(jù)可以寫(xiě)出典型變量的計(jì)算公式。
第二步的典型變量相關(guān)系數(shù)的檢驗(yàn)結(jié)果顯示,只有前面兩對(duì)典型變量的相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義,U1與V1的相關(guān)系數(shù)為0.980,U2與V2的相關(guān)系數(shù)為0.908,因此下面只寫(xiě)出這兩對(duì)典型變量由標(biāo)準(zhǔn)化數(shù)據(jù)組成的計(jì)算公式:
可以發(fā)現(xiàn),因?yàn)閮山M變量的系數(shù)很多都是負(fù)的,所以這兩對(duì)典型變量的現(xiàn)實(shí)含義不好解釋?zhuān)蚓驮谟谇懊嫣岬降膬山M變量?jī)?nèi)部的相關(guān)關(guān)系太強(qiáng),無(wú)法表示農(nóng)村居民收入的綜合情況。本案例數(shù)據(jù)建立的典型相關(guān)模型的效果很差,應(yīng)該重新選擇能夠充分反映農(nóng)村居民收入水平的變量。
4、相關(guān)系數(shù)結(jié)果;下圖四個(gè)表是相關(guān)系數(shù)表,第一列是本組變量與本組產(chǎn)生的典型變量的相關(guān)系數(shù);第二列是本組變量與另一組變量產(chǎn)生的典型變量之間的相關(guān)系數(shù)。
根據(jù)相關(guān)系數(shù)數(shù)據(jù),可以做出兩對(duì)典型變量的相關(guān)系數(shù)結(jié)構(gòu)圖,由于作圖的方式是一樣的,因此用第一對(duì)典型變量為例進(jìn)行說(shuō)明。從結(jié)構(gòu)圖同樣可以知道,四個(gè)收入變量與公因子U1的相關(guān)系數(shù)都是負(fù)數(shù),而8個(gè)支出變量與公因子V1的相關(guān)系數(shù)也都為負(fù)數(shù),同樣說(shuō)明了本案例的典型相關(guān)模型效果很差,不能用現(xiàn)實(shí)含義來(lái)解釋。
推薦學(xué)習(xí)書(shū)籍
《CDA一級(jí)教材》適合CDA一級(jí)考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計(jì)已有10萬(wàn)+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03