
SPSS數(shù)據(jù)分析實(shí)例_數(shù)據(jù)分析師培訓(xùn)
先從一個(gè)數(shù)據(jù)分析實(shí)例入手:當(dāng)你將這個(gè)例題做完,SPSS的基本使用方法也就已經(jīng)被你掌握了。具體的統(tǒng)計(jì)分析功能則按10.0版本講述
就讓我們開(kāi)始吧!
例1.1 某克山病區(qū)測(cè)得11例克山病患者與13名健康人的血磷值(mmol/L)如下, 問(wèn)該地急性克山病患者與健康人的血磷值是否不同(衛(wèi)統(tǒng)第三版例4.8)?
患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
讓我們把要做的事情理理順:首先要做的肯定是打開(kāi)計(jì)算機(jī)(廢話),然后進(jìn)入瘟98或瘟2000(還是廢話,以下省去廢話2萬(wàn)字),在進(jìn)入SPSS后,具體工作流程如下:
將數(shù)據(jù)輸入SPSS,并存盤以防斷電。
進(jìn)行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的檢驗(yàn)方法。
按題目要求進(jìn)行統(tǒng)計(jì)分析。
保存和導(dǎo)出分析結(jié)果。
下面就按這幾步依次講解。
當(dāng)打開(kāi)SPSS后,展現(xiàn)在我們面前的界面如下:
請(qǐng)將鼠標(biāo)在上圖中的各處停留,很快就會(huì)彈出相應(yīng)部位的名稱。
請(qǐng)注意窗口頂部顯示為“SPSS for Windows Data Editor”,表明現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個(gè)典型的Windows軟件界面,有菜單欄、工具欄。特別的,工具欄下方的是數(shù)據(jù)欄,數(shù)據(jù)欄下方則是數(shù)據(jù)管理窗口的主界面。該界面和EXCEL極為相似,由若干行和列組成,每行對(duì)應(yīng)了一條記錄,每列則對(duì)應(yīng)了一個(gè)變量。由于現(xiàn)在我們沒(méi)有輸入任何數(shù)據(jù),所以行、列的標(biāo)號(hào)都是灰色的。請(qǐng)注意第一行第一列的單元格邊框?yàn)樯钌?,表明該?shù)據(jù)單元格為當(dāng)前單元格。
對(duì)Windows操作界面不熟悉的朋友可參見(jiàn)SAS入門第一課中的相關(guān)內(nèi)容。對(duì)數(shù)據(jù)表界面操作不熟悉的朋友可先學(xué)習(xí)一下EXCEL的操作(因?yàn)樗膸椭侵形牡模?/span>
有的SPSS系統(tǒng)打開(kāi)時(shí)會(huì)出現(xiàn)一個(gè)導(dǎo)航對(duì)話框,請(qǐng)單擊右下方的Cancer按鈕,即可進(jìn)入上面的主界面。
該資料是定量資料,設(shè)計(jì)為成組設(shè)計(jì),因此我們需要建立兩個(gè)變量,一個(gè)變量代表血磷值,習(xí)慣上取名為X,另一個(gè)變量代表觀察對(duì)象是健康人還是克山病人,習(xí)慣上取名為GROUP。
對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析格式不太熟悉的朋友請(qǐng)先學(xué)習(xí)統(tǒng)計(jì)軟件第一課。
選擇菜單Data==>Define Variable。系統(tǒng)彈出定義變量對(duì)話框如下:
該變量定義對(duì)話框在SPSS 10.0版中已被取消,這里的操作只適合9.0~7.0版的用戶。
對(duì)話框最上方為變量名,現(xiàn)在顯示為“VAR00001”,這是系統(tǒng)的默認(rèn)變量名;往下是變量情況描述,可以看到系統(tǒng)默認(rèn)該變量為數(shù)值型,長(zhǎng)度為8,有兩位小數(shù)位,尚無(wú)缺失值,顯示對(duì)齊方式為右對(duì)齊;第三部分為四個(gè)設(shè)置更改按鈕,分別可以設(shè)定變量類型、標(biāo)簽、缺失值和列顯示格式;第四部分實(shí)際上是用來(lái)定義變量屬于數(shù)值變量、有序分類變量還是無(wú)序分類變量,現(xiàn)在系統(tǒng)默認(rèn)新變量為數(shù)值變量;最下方則依次是確定、取消和幫助按鈕。
好,先來(lái)建立分組變量GROUP。請(qǐng)將變量名改為GROUP,然后單擊OK按鈕。
有沒(méi)有搞錯(cuò)?!折騰了半天就改個(gè)名字!難道連變量格式、標(biāo)簽等都不改?是這樣的,在SPSS中所有的數(shù)據(jù)均以最大位數(shù)保存(好象是雙精度),也就是說(shuō),上面雖然默認(rèn)只有兩位小數(shù),但那指的是計(jì)算精度,實(shí)際保存的數(shù)據(jù)位數(shù)是非常長(zhǎng)的(可以輸入Pi值試一下)。在絕大多數(shù)情況下,SPSS給出的默認(rèn)數(shù)據(jù)類型和數(shù)據(jù)精度完全可以滿足需要,只是不太好看而已。至于標(biāo)簽等比較花哨的選項(xiàng),反正我也很少用?,F(xiàn)在我們才剛剛?cè)腴T,一切從簡(jiǎn)。以后我會(huì)詳細(xì)介紹各種設(shè)置的用法。
在第一列灰色的“var”上雙擊,同樣會(huì)彈出定義變量對(duì)話框。
現(xiàn)在SPSS的數(shù)據(jù)管理窗口如下所示:
第一列的名稱已經(jīng)改為了“group”,這就是我們所定義的新變量“group”。
現(xiàn)在我們來(lái)建立變量X。單擊第一行第二列的單元格,然后選擇菜單Data==>Define Variable,同樣,將變量名改為X,然后確認(rèn)。此時(shí)SPSS的數(shù)據(jù)管理窗口如下所示:
現(xiàn)在,第一、第二列的名稱均為深色顯示,表明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var”,表示尚未使用。同樣地,各行的標(biāo)號(hào)也為灰色,表明現(xiàn)在還未輸入過(guò)數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒(méi)有記錄。
我們先來(lái)輸入變量X的值,請(qǐng)確認(rèn)一行二列單元格為當(dāng)前單元格,棄鼠標(biāo)而用鍵盤,輸入第一個(gè)數(shù)據(jù)0.84,此時(shí)界面顯示如圖A所示:
|
|
圖A |
圖B |
請(qǐng)注意:在回車之前,你輸入的數(shù)據(jù)在數(shù)據(jù)欄內(nèi)顯示,而不是在單元格內(nèi)顯示,現(xiàn)在回車,界面如圖B所示:
首先,當(dāng)前單元格下移,變成了二行二列單元格,而一行二列單元格的內(nèi)容則被替換成了0.84;其次,第一行的標(biāo)號(hào)變黑,表明該行已輸入了數(shù)據(jù);第三,一行一列單元格因?yàn)闆](méi)有輸入過(guò)數(shù)據(jù),顯示為“.”,這代表該數(shù)據(jù)為缺失值。用類似的輸入方式,我們將患者的血磷值輸入完畢,并將相應(yīng)的變量GROUP均取值為1,此時(shí)數(shù)據(jù)管理窗口如下所示:
從第12行開(kāi)始輸入健康人的數(shù)據(jù),并將相應(yīng)的GROUP變量取值為2。最終該數(shù)據(jù)集應(yīng)該有24條記錄。
選擇菜單File==>Save,由于該數(shù)據(jù)從來(lái)沒(méi)有被保存過(guò),所以彈出Save as對(duì)話框如下:
單擊保存類型列表框,可以看到SPSS所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入Li1_1并回車,可以看到數(shù)據(jù)管理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。
為什么這里的對(duì)話框會(huì)出現(xiàn)漢字?是這樣的,需要從編程的角度來(lái)解釋:SPSS在彈出該對(duì)話框時(shí)會(huì)調(diào)用Windows系統(tǒng)的公用函數(shù),由于我們用的是中文Windows系統(tǒng),所以調(diào)用出來(lái)的就是中文。
首先我們需要知道數(shù)據(jù)的基本情況,如均數(shù)、標(biāo)準(zhǔn)差等。選擇Analyze==>Descriptive Statistics==>Descriptives菜單,系統(tǒng)彈出描述對(duì)話框如下:
如果按SPSS標(biāo)準(zhǔn)的叫法,這里應(yīng)該是調(diào)用了Descriptives過(guò)程,為了避免太生硬,我們稱為調(diào)用對(duì)話框,等大家熟悉SPSS了以后,在統(tǒng)計(jì)分析各章中可能兩種稱呼會(huì)混用。
該對(duì)話框可分為左右兩大部分,左側(cè)為所有可用的侯選變量列表,右側(cè)為選入變量列表。我們只需要描述X,用鼠標(biāo)選中X,單擊中間的,變量X的標(biāo)簽就會(huì)移入右側(cè),注意這時(shí)OK按鈕變黑,表明已經(jīng)可以進(jìn)行分析了,單擊它,系統(tǒng)會(huì)彈出一個(gè)新的界面如下所示:
該窗口上方的名稱為SPSS for Windows Viewer,即(結(jié)果)瀏覽窗口,整個(gè)的結(jié)構(gòu)和資源管理器類似,左側(cè)為導(dǎo)航欄,右側(cè)為具體的輸出結(jié)果。結(jié)果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標(biāo)準(zhǔn)差這幾個(gè)常用的統(tǒng)計(jì)量。從中可以看到,24個(gè)數(shù)據(jù)總的均數(shù)為1.2846,標(biāo)準(zhǔn)差為0.4687。
我們以上的做法對(duì)嗎?當(dāng)然有問(wèn)題!光看總的描述是不夠的,還應(yīng)當(dāng)看看分組的描述情況。這里要用到文件分割功能,請(qǐng)切換回?cái)?shù)據(jù)管理窗口,選擇Data==>Split File菜單,系統(tǒng)彈出文件分割對(duì)話框如下:
選擇單選按鈕Organize output by groups,將變量GROUP選入右側(cè)的選入變量框,單擊OK鈕,此時(shí)界面不會(huì)有任何改變,但請(qǐng)?jiān)僮鲆淮螖?shù)據(jù)描述,你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了!從描述可知兩組的均數(shù)和標(biāo)準(zhǔn)差分別為1.5209、1.0846和0.4218、0.4221。 如果定義了文件分割,則它會(huì)在以后的所有統(tǒng)計(jì)分析中起作用,直到你重新定義文件分割方式為止。
統(tǒng)計(jì)指標(biāo)只能給出數(shù)據(jù)的大致情況,沒(méi)有直方圖那樣直觀,我們就來(lái)畫個(gè)直方圖瞧瞧!選擇Graphs==>Histogram,系統(tǒng)會(huì)彈出繪制直方圖對(duì)話框如下:
將變量X選入Variable選擇框內(nèi),單擊OK按鈕。此時(shí)結(jié)果瀏覽窗口內(nèi)會(huì)繪制出如下兩個(gè)直方圖:
|
|
兩組的數(shù)據(jù)沒(méi)有特別偏的分布,也沒(méi)有十分突出的離群值,因此無(wú)須變換,可以直接采用參數(shù)分析方法來(lái)分析。綜合設(shè)計(jì)類型,最終確定采用成組設(shè)計(jì)兩樣本均數(shù)比較的t檢驗(yàn)來(lái)分析。
最后,我們還要取消變量分割,免得它影響以后的統(tǒng)計(jì)分析,再次調(diào)出變量分割對(duì)話框,選擇單選按鈕中的“Analyze all cases, do not creat group”,單擊OK按鈕就可以了。
下面我們要用SPSS來(lái)做成組設(shè)計(jì)兩樣本均數(shù)比較的t檢驗(yàn),選擇Analyze==>Compare Means==>Independent-Samples T test,系統(tǒng)彈出兩樣本t檢驗(yàn)對(duì)話框如下:
將變量X選入test框內(nèi),變量group選入grouping框內(nèi),注意這時(shí)下面的Define Groups按鈕變黑,表示該按鈕可用,單擊它,系統(tǒng)彈出比較組定義對(duì)話框如右圖所示: 該對(duì)話框用于定義是哪兩組相比,在兩個(gè)group框內(nèi)分別輸入1和2,表明是變量group取值為1和2的兩組相比。然后單擊Continue按鈕,再單擊OK按鈕,系統(tǒng)經(jīng)過(guò)計(jì)算后會(huì)彈出結(jié)果瀏覽窗口,首先給出的是兩組的基本情況描述,如樣本量、均數(shù)等(糟糕,剛才的半天工夫白費(fèi)了),然后是t檢驗(yàn)的結(jié)果如下: |
|
Independent Samples Test
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
|||
Lower |
Upper |
|||||||||
X |
Equal variances assumed |
.032 |
.860 |
2.524 |
22 |
.019 |
.4363 |
.1729 |
7.777E-02 |
.7948 |
Equal variances not assumed |
|
|
2.524 |
21.353 |
.020 |
.4363 |
.1729 |
7.716E-02 |
.7954 |
可見(jiàn)該結(jié)果分為兩大部分:第一部分為Levene's方差齊性檢驗(yàn),用于判斷兩總體方差是否齊,這里的戒嚴(yán)結(jié)果為F = 0.032,p = 0.860,可見(jiàn)在本例中方差是齊的;第二部分則分別給出兩組所在總體方差齊和方差不齊時(shí)的t檢驗(yàn)結(jié)果,由于前面的方差齊性檢驗(yàn)結(jié)果為方差齊,第二部分就應(yīng)選用方差齊時(shí)的t檢驗(yàn)結(jié)果,即上面一行列出的t= 2.524,ν=22,p=0.019。從而最終的統(tǒng)計(jì)結(jié)論為按α=0.05水準(zhǔn),拒絕H0,認(rèn)為克山病患者與健康人的血磷值不同,從樣本均數(shù)來(lái)看,可認(rèn)為克山病患者的血磷值較高。
前面我們已經(jīng)做出了分析結(jié)果,但是,可是,可但是,但可是呢?再好的結(jié)果只要一斷電就會(huì)全部消失(廢話),對(duì)于這一問(wèn)題人們?cè)缫严氤隽巳N解決辦法,他們分別是:
需要結(jié)果的時(shí)候再運(yùn)行一次分析程序。
用筆將結(jié)果抄在紙上。
直接保存結(jié)果文件。
顯然,最方便快捷、最符合信息時(shí)代特征的就是第三種方法,在結(jié)果瀏覽窗口中(注意:一定要在結(jié)果瀏覽窗口中)選擇菜單File==>Save,由于該結(jié)果也從來(lái)沒(méi)有被保存過(guò),所以彈出和前面保存數(shù)據(jù)時(shí)極為相似的一個(gè)Save as對(duì)話框,和前面相比,他唯一的區(qū)別就是文件的保存類型只有View Files(*.spo)一種。好,閑言少敘,在文件名框中鍵入“Li1_1”并回車,該結(jié)果文件就會(huì)按文件名Li1_1.spo被存儲(chǔ)。
不是文件保存類型還有一種“ALL Files(*.*)”嗎?別費(fèi)勁了,這種類型是SPSS公司放在那里哄人的,在該對(duì)話框里無(wú)論怎么折騰,都只能按SPO文件的格式來(lái)保存。
文件倒是保存了,但問(wèn)題還沒(méi)有完全解決:我們從來(lái)寫文章什么的都用的是文字處理軟件,尤其是WORD,可WORD不能直接讀取SPO格式的文件,怎么辦呢?沒(méi)關(guān)系,SPSS提供了將結(jié)果導(dǎo)出為純文本格式或網(wǎng)頁(yè)格式的功能,在結(jié)果瀏覽窗口中選擇菜單File==>Export,系統(tǒng)會(huì)彈出Exprot Output對(duì)話框如下:
最上方的Export下拉式列表可以選擇輸出的內(nèi)容,可以為含圖表的輸出文檔、無(wú)圖表的輸出文檔和只有統(tǒng)計(jì)圖表三種;中部的Exprot File對(duì)話框則填入輸出的目標(biāo)文件名;左下方的Export What單選框可以選擇輸出結(jié)果的哪些部分,可以是所有結(jié)果、所有可見(jiàn)結(jié)果或只輸出選擇的結(jié)果,一般選輸出所有可見(jiàn)結(jié)果;右下方的輸出文件類型下拉式列表已被我打開(kāi),可見(jiàn)里面有網(wǎng)頁(yè)格式和純文本格式兩種,在一切按所需選擇完畢后按OK鈕,則結(jié)果文件就會(huì)輸出為你想要的類型。
好,到這里,就象我們剛開(kāi)始所說(shuō)的一樣,你實(shí)際上已經(jīng)完全掌握了SPSS的基本使用方法。我們以后將要做的工作就是“百尺竿頭,更進(jìn)一步”,將從下一章開(kāi)始詳細(xì)介紹SPSS各個(gè)模塊的精確用法,使大家能盡快的從SPSS新手向SPSS高手過(guò)度。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03