
SPSS基礎(chǔ)教程:數(shù)據(jù)的輸入和保存
例題: 某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下, 問該地急性克山病患者與健康人的血磷值是否不同?
患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
讓我們把要做的事情理理順:首先要做的肯定是打開計算機(廢話),然后進入瘟98或瘟2000(還是廢話,以下省去廢話2萬字),在進入SPSS后,具體工作流程如下:
1、將數(shù)據(jù)輸入SPSS,并存盤以防斷電。
2、進行必要的預(yù)分析(分布圖、均數(shù)標準差的描述等),以確定應(yīng)采用的檢驗方法。
3、按題目要求進行統(tǒng)計分析。
4、保存和導(dǎo)出分析結(jié)果。
下面就按這幾步依次講解。
本章節(jié)著重講解——數(shù)據(jù)的輸入和保存
一、SPSS的界面
當打開SPSS后,展現(xiàn)在我們面前的界面如下:
請將鼠標在上圖中的各處停留,很快就會彈出相應(yīng)部位的名稱。
請注意窗口頂部顯示為“SPSS for Windows Data Editor”,表明現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個典型的Windows軟件界面,有菜單欄、工具欄。特別的,工具欄下方的是數(shù)據(jù)欄,數(shù)據(jù)欄下方則是數(shù)據(jù)管理窗口的主界面。該界面和EXCEL極為相似,由若干行和列組成,每行對應(yīng)了一條記錄,每列則對應(yīng)了一個變量。由于現(xiàn)在我們沒有輸入任何數(shù)據(jù),所以行、列的標號都是灰色的。請注意第一行第一列的單元格邊框為深色,表明該數(shù)據(jù)單元格為當前單元格。
對Windows操作界面不熟悉的朋友可參見SAS入門第一課中的相關(guān)內(nèi)容。對數(shù)據(jù)表界面操作不熟悉的朋友可先學(xué)習(xí)一下EXCEL的操作(因為它的幫助是中文的)。
在SPSS中所有的數(shù)據(jù)均以最大位數(shù)保存(好象是雙精度),也就是說,上面雖然默認只有兩位小數(shù),但那指的是計算精度,實際保存的數(shù)據(jù)位數(shù)是非常長的(可以輸入Pi值試一下)。在絕大多數(shù)情況下,SPSS給出的默認數(shù)據(jù)類型和數(shù)據(jù)精度完全可以滿足需要,只是不太好看而已。至于標簽等比較花哨的選項,反正我也很少用?,F(xiàn)在我們才剛剛?cè)腴T,一切從簡。以后我會詳細介紹各種設(shè)置的用法。
有的SPSS系統(tǒng)打開時會出現(xiàn)一個導(dǎo)航對話框,請單擊右下方的Cancer按鈕,即可進入上面的主界面。
二、定義變量
該資料是定量資料,設(shè)計為成組設(shè)計,因此我們需要建立兩個變量,一個變量代表血磷值,習(xí)慣上取名為X,另一個變量代表觀察對象是健康人還是克山病人,習(xí)慣上取名為GROUP。
選擇菜單Data==>Define Variable。系統(tǒng)彈出定義變量對話框如下:
對話框最上方為變量名,現(xiàn)在顯示為“VAR00001”,這是系統(tǒng)的默認變量名;往下是變量情況描述,可以看到系統(tǒng)默認該變量為數(shù)值型,長度為8,有兩位小數(shù)位,尚無缺失值,顯示對齊方式為右對齊;第三部分為四個設(shè)置更改按鈕,分別可以設(shè)定變量類型、標簽、缺失值和列顯示格式;第四部分實際上是用來定義變量屬于數(shù)值變量、有序分類變量還是無序分類變量,現(xiàn)在系統(tǒng)默認新變量為數(shù)值變量;最下方則依次是確定、取消和幫助按鈕。
好,先來建立分組變量GROUP。請將變量名改為GROUP,然后單擊OK按鈕。
在SPSS中所有的數(shù)據(jù)均以最大位數(shù)保存(好象是雙精度),也就是說,上面雖然默認只有兩位小數(shù),但那指的是計算精度,實際保存的數(shù)據(jù)位數(shù)是非常長的(可以輸入Pi值試一下)。在絕大多數(shù)情況下,SPSS給出的默認數(shù)據(jù)類型和數(shù)據(jù)精度完全可以滿足需要,只是不太好看而已。至于標簽等比較花哨的選項,反正我也很少用?,F(xiàn)在我們才剛剛?cè)腴T,一切從簡。以后我會詳細介紹各種設(shè)置的用法。
現(xiàn)在SPSS的數(shù)據(jù)管理窗口如下所示:
第一列的名稱已經(jīng)改為了“group”,這就是我們所定義的新變量“group”。
現(xiàn)在我們來建立變量X。單擊第一行第二列的單元格,然后選擇菜單Data==>Define Variable,同樣,將變量名改為X,然后確認。此時SPSS的數(shù)據(jù)管理窗口如下所示:
現(xiàn)在,第一、第二列的名稱均為深色顯示,表明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var”,表示尚未使用。同樣地,各行的標號也為灰色,表明現(xiàn)在還未輸入過數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒有記錄。
三、輸入數(shù)據(jù)
我們先來輸入變量X的值,請確認一行二列單元格為當前單元格,棄鼠標而用鍵盤,輸入第一個數(shù)據(jù)0.84,此時界面顯示如圖A所示:
請注意:在回車之前,你輸入的數(shù)據(jù)在數(shù)據(jù)欄內(nèi)顯示,而不是在單元格內(nèi)顯示,現(xiàn)在回車,界面如圖B所示:
首先,當前單元格下移,變成了二行二列單元格,而一行二列單元格的內(nèi)容則被替換成了0.84;其次,第一行的標號變黑,表明該行已輸入了數(shù)據(jù);第三,一行一列單元格因為沒有輸入過數(shù)據(jù),顯示為“.”,這代表該數(shù)據(jù)為缺失值。
用類似的輸入方式,我們將患者的血磷值輸入完畢,并將相應(yīng)的變量GROUP均取值為1,此時數(shù)據(jù)管理窗口如下所示:
從第12行開始輸入健康人的數(shù)據(jù),并將相應(yīng)的GROUP變量取值為2。最終該數(shù)據(jù)集應(yīng)該有24條記錄。
四、保存數(shù)據(jù)
選擇菜單File==>Save,由于該數(shù)據(jù)從來沒有被保存過,所以彈出Save as對話框如下:
單擊保存類型列表框,可以看到SPSS所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入Li1_1并回車,可以看到數(shù)據(jù)管理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。
PS:為什么這里的對話框會出現(xiàn)漢字?是這樣的,需要從編程的角度來解釋:SPSS在彈出該對話框時會調(diào)用Windows系統(tǒng)的公用函數(shù),由于我們用的是中文Windows系統(tǒng),所以調(diào)用出來的就是中文。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03