
【連載一】spss中做相關(guān)分析
相關(guān)分析是很基礎(chǔ)的一種分析方法,接觸spss的同學(xué)很快就會學(xué)習(xí)到想相關(guān)分析。雖然他很基礎(chǔ),但是在做很多高級分析之前,都要進(jìn)行相關(guān)分析。這篇問文章就系統(tǒng)的和大家分享一下spss里如何做相關(guān)分析。
在spss中相關(guān)分析主要分為三大類,分別是雙變量相關(guān)分析,偏相關(guān)分析和距離相關(guān)分析。
1、雙變量相關(guān)分析主要研究兩個變量數(shù)量之間的相關(guān)性。它又分為pearson相關(guān)分析,kendall相關(guān)分析,kendall等級相關(guān)分析,還有spearmen等級相關(guān)分析這四種。
Pearson相關(guān)分析是應(yīng)用最最多的一種分析方法,它適用于評價兩個連續(xù)變量十是否相關(guān),常見的例子有分析體重和身高的相關(guān)性啊,分析睡眠時間和學(xué)習(xí)時間的相關(guān)性啊等等。這兩個例子里變量都是連續(xù)性的,所以用pearson相關(guān)分析。主要分析過程如下,選擇菜單分析——相關(guān)——雙變量,打開雙變量主對話框,把要分析的變量選入變量框(兩個以上哈),確定就可以了。很簡單。結(jié)果也很容易看,主要看兩個指標(biāo),一個是p值,就是sig(不要笑,雖然很簡單的一個點(diǎn),可是就是有好多人都搞不清楚),p值小于0.5,就認(rèn)為兩個變量顯著相關(guān),p值小于0.01,就認(rèn)為極其顯著。另一個是相關(guān)系數(shù),相關(guān)系數(shù)為正就是正相關(guān),為負(fù)就是負(fù)相關(guān),相關(guān)系數(shù)的絕對值越接近一就說明相關(guān)性越強(qiáng)。一般認(rèn)為0.7以上是強(qiáng)相關(guān)。注意,這里有一個事情很多人都搞不清楚,要特別說一下哈,p值很小,同時相關(guān)系數(shù)也很小這種情況是存在的。這說明兩個變量顯著相關(guān),但是是弱相關(guān),也就是說p值和相關(guān)系數(shù)沒什么關(guān)系,兩個的取值互相不影響,如果出現(xiàn)p值和相關(guān)系數(shù)都很小的情況,不要太緊張,很正常哈。
Kendall相關(guān)分析主要用來反映兩個有序分類變量的一致性,有序分類變量就是等級變量,1.2.3.這類遞進(jìn)的,時間序列也是有序分類變量,無序分類則是性別啊,是否成年啊,這種的??傊甼endall相關(guān)分析的使用范圍是用來分析兩個有序分類變量,舉個例子,如果把睡眠時間和學(xué)習(xí)時間都用等級表示出來(比如一小時一個等級),那這個分析就可以用kendall,它的結(jié)果觀察方法和pearson一樣,就不在重復(fù)了。
Kendall等級相關(guān)分析所適用的情況是另一種,它操作方法和上一個kendall的例子一樣,但是用于等級資料,是要加權(quán)的。舉個例子,比如我想分析一下一個人每天吃不吃水果和這個人的營養(yǎng)狀況的相關(guān)性,那就要用到等級分析。這個例子和上邊的例子的區(qū)別很明顯,上邊都是數(shù)值型的變量,而這個例子中是要自己定義的,比如我定義吃水果是1,不吃是2,定義營養(yǎng)狀況為差,中,強(qiáng),分別對應(yīng)1,2,3。然后我想分析的話我就定義變量水果食用情況,營養(yǎng)狀況,計(jì)數(shù),用計(jì)數(shù)進(jìn)行加權(quán)后做kendall分析,當(dāng)然可以直接輸入一大堆數(shù)據(jù),如果不嫌麻煩的話。結(jié)果分析方法同上。
Spearman等級相關(guān)分析和kendall有一點(diǎn)點(diǎn)類似,適用于分析含有等級資料的變量,舉個例子,分析努力程度和學(xué)習(xí)成績之間的關(guān)系,其中努力程度是要分等級的資料,學(xué)習(xí)成績則是數(shù)值型的,這時候就要用spearman,結(jié)果分析同上。
2、偏相關(guān)分析和雙變量相關(guān)分析的不同之處在于偏相關(guān)分析要考慮除卻分析的變量以外是否有其他變量影響到這兩個變量。比如,舉個例子,比如我現(xiàn)在有一個運(yùn)動員的身高,肺活量,和短跑成績。我想要分析身高和短跑成績的相關(guān)性的話,我就要使用偏相關(guān)分析,因?yàn)榉位盍恳灿绊懙搅松砀吆投膛艹煽?,我得剔除這個變量的影響,所以呢,我就不用雙變量,而是使用偏相關(guān)。我打開菜單分析——相關(guān)——偏相關(guān),打開主面板,把身高和短跑成績選到變量里,把肺活量選到控制里邊,然后點(diǎn)確定。輸出表的觀察方式和上邊一樣,不在重復(fù)。在輸出表里,它會顯示出沒有控制變量的時候的相關(guān)系數(shù)和有控制變量的時候的相關(guān)系數(shù),如果數(shù)據(jù)恰當(dāng)?shù)脑?,你會觀察到一個相當(dāng)有趣的現(xiàn)象,不控制肺活量的時候,身高和短跑成績是相關(guān)的,控制的時候,身高和短跑成績就不相關(guān)了。So,明白偏相關(guān)的作用了嗎?
需要特別說明一下的是,偏相關(guān)分析并不像雙變量那樣有四種方法可以供你選擇,它的適用范圍一般是一些數(shù)值型的變量,一些你能判斷到底有沒有關(guān)系的變量,你也許應(yīng)該先用雙變量兩兩測出自變量是否相關(guān),然后再考慮要不要用偏相關(guān),而且假如你的偏相關(guān)的變量是等級資料,結(jié)果有可能會很尷尬。
3、距離相關(guān)分析是一個初學(xué)者不那么常用到的分析,不過為了完整性,本文還是列了出來。它用來計(jì)算個案或變量之間距離相異性或相似性度量,和其他模塊,比如因子分析,聚類分析,多維尺度分析一起使用以助于分析復(fù)合數(shù)據(jù)集。它也分為兩種,變量距離相關(guān)分析,個案距離相關(guān)分析。
我們還是使用一個例子來進(jìn)行學(xué)習(xí)。比如我們想要分析學(xué)生的身高,肺活量,短跑成績這三個變量的親密度,我們選擇菜單分析——相關(guān)——距離,打開主面板,在變量列表選入這三個變量,下邊的計(jì)算距離選擇變量間,在下邊的標(biāo)準(zhǔn)選擇相似性,單擊度量,打開度量面板。這個面板里邊默認(rèn)為區(qū)間,pearson相關(guān)性。另外還有一個二分類,我們在這里不討論二分類到底是干嘛的(有興趣的同學(xué)可以自己去試試),就按默認(rèn)的,點(diǎn)繼續(xù),點(diǎn)確定。然后我們觀察輸出窗口,他會輸出一個近似矩陣,由于我們上邊選的是相似性,所以這個矩陣?yán)镞叺闹翟浇咏?,就說明對應(yīng)的兩個變量距離越近,就是說越親近,相關(guān)性越強(qiáng)。如果選的是不相似性,那么得出的數(shù)值越小距離越近,最小是0,最大值很可能超過1,超過了也不要緊張。它比雙變量做出來的結(jié)果要直接,它不考慮p值,所以兩個分析還是不一樣的哈。個案距離相關(guān)分析和這個類似,只是把計(jì)算距離選成了個案,假如你只想分析其中幾個個案,你需要在數(shù)據(jù)——選擇個案,里邊選擇一下你的個案。然后做距離相關(guān)分析,其他的默認(rèn)哈。
相關(guān)分析的內(nèi)容基本上就這些了。都是很淺顯的一些內(nèi)容,主要的學(xué)習(xí)內(nèi)容分為兩方面,一個是怎么看p值和相關(guān)系數(shù),一個是不同的相關(guān)分析方法在適用范圍上到底有什么不同。我呢也沒有從原理方面講為什么這個方法用于這種情況這樣講,只是簡單的羅列了一下怎么用,第一希望大家看過以后能有所收益,第二大家有什么想法,或者覺得我說的有什么不對歡迎和我交流哈CDA 數(shù)據(jù)分析師培訓(xùn)官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03