
圖解spss探索分析實(shí)例
探索分析是在對(duì)數(shù)據(jù)的基本特征統(tǒng)計(jì)量有初步了解的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行的更為深入詳細(xì)的描述性觀察分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加了有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。主要的分析如下:
(1)觀察數(shù)據(jù)的分布特征:通過繪制箱鎖圖和莖葉圖等圖形,直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律,包括考察數(shù)據(jù)中是否存在異常值等。過大或過小的數(shù)據(jù)均有可能是奇異值、影響點(diǎn)或錯(cuò)誤數(shù)據(jù)。尋找異常值,并分析原因,然后決定是否從分析中刪除這些數(shù)據(jù)。因?yàn)槠娈愔岛陀绊扅c(diǎn)往往對(duì)分析的影響較大,不能真實(shí)地反映數(shù)據(jù)的總體特征。
(2)正態(tài)分布檢驗(yàn):檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布。很多檢驗(yàn)?zāi)軌蜻M(jìn)行的前提即總體數(shù)據(jù)分布服從正態(tài)分布。因此,檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,就決定了它們是否能用只對(duì)正態(tài)分布數(shù)據(jù)適用的分析方法。
(3)方差齊性檢驗(yàn):用Levene檢驗(yàn)比較各組數(shù)據(jù)的方差是否相等,以判定數(shù)據(jù)的離散程度是否存在差異。例如在進(jìn)行獨(dú)立右邊的T檢驗(yàn)之前,就需要事先確定兩組數(shù)據(jù)的方差是否相同。如果通過分析發(fā)現(xiàn)各組數(shù)據(jù)的方差不同,還需要對(duì)數(shù)據(jù)進(jìn)行方差分析,那么就需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換使得方差盡可能相同。Levene檢驗(yàn)進(jìn)行方差齊性檢驗(yàn)時(shí),不強(qiáng)求數(shù)據(jù)必須服從正態(tài)分布,它先計(jì)算出各個(gè)觀測(cè)值減去組內(nèi)均值的差,然后再通過這些差值的絕對(duì)值進(jìn)行單因素方差分析。如果得到的顯著性水平(Significance)小于0.05,那么就可以拒絕方差相同的假設(shè)。
探索分析的具體操作步驟如下:
打開數(shù)據(jù)文件,選擇【分析】(Analyze)菜單,單擊【描述統(tǒng)計(jì)】(Descriptive Statistics)命令下的【探索】(Explore)命令,SPSS將彈出"探索"(Explore)對(duì)話框,如圖3-9所示。
在"探索"(Explore)對(duì)話框中,左邊的變量列表為原變量列表,通過單擊 按鈕可選擇一個(gè)或者幾個(gè)變量進(jìn)入右邊的"因變量列表"(Dependent List)框、"因子列表"(Factor List)框和"標(biāo)注個(gè)案"(Label Cases by)列表框。因變量是用戶所研究的目標(biāo)變量。因子變量是影響因變量的因素,例如分組變量。標(biāo)注個(gè)案是區(qū)分每個(gè)觀測(cè)量的變量,如雇員的ID等。例如,研究同一班級(jí)男生和女生的身高差距時(shí),就可將"身高"變量列入"因變量列表"(Dependent List)框中,將"性別"列入"因子列表"(Factor List)框中,同時(shí)將學(xué)生的"學(xué)號(hào)"變量列入"標(biāo)注個(gè)案"(Label Cases by)列表框中。
如果有多個(gè)分組變量進(jìn)入"因子列表"列表框中,那么會(huì)以分組變量的各種取值進(jìn)行組合分組。如兩個(gè)分組變量各有2種取值,那么輸出的結(jié)果就會(huì)有4種組合分組。
在對(duì)話框下端的"輸出"(Display)框中有三個(gè)選項(xiàng):
兩者都(Both):默認(rèn)選項(xiàng),表示同時(shí)輸出描述統(tǒng)計(jì)量的統(tǒng)計(jì)表格和圖形。選擇此項(xiàng)將激活右邊的【統(tǒng)計(jì)量】(Statistics)和【繪制】(Plots)按鈕。
統(tǒng)計(jì)量(Statistics):表示只輸出統(tǒng)計(jì)表格,不輸出圖表。選擇此項(xiàng)將激活右邊的【統(tǒng)計(jì)量】(Statistics)按鈕,【繪制】(Plots)按鈕不被激活。
圖(Plots):表示只輸出圖表,不輸出統(tǒng)計(jì)表格。選擇此項(xiàng)將激活右邊的【繪制】(Plots)按鈕,【統(tǒng)計(jì)量】(Statistics)按鈕不被激活。
單擊【統(tǒng)計(jì)量】(Statistics)按鈕,打開"探索:統(tǒng)計(jì)量(Explore:Statistics)"對(duì)話框,如圖3-10所示。
在該對(duì)話框中,4個(gè)選擇項(xiàng)分別如下:
描述性(Descriptives):選擇此項(xiàng),將生成描述性統(tǒng)計(jì)表格。表中顯示樣本數(shù)據(jù)的描述統(tǒng)計(jì)量,包括平均值、中位數(shù)、5%調(diào)整平均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最大值、最小值、組距、四分位數(shù)、峰度、偏度及峰度和偏度的標(biāo)準(zhǔn)誤。此項(xiàng)為默認(rèn)選項(xiàng),在下面的"均值的置信區(qū)間"(Confidence Interval for Mean)文本框中,用戶還可輸入數(shù)值指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)的置信度為95%。
M-估計(jì)量(M-estimators):選擇此項(xiàng),將計(jì)算并生成穩(wěn)健估計(jì)量。M估計(jì)在計(jì)算時(shí)對(duì)所有觀測(cè)量賦予權(quán)重,隨觀測(cè)量距分布中心的遠(yuǎn)近而變化,通過給遠(yuǎn)離中心值的數(shù)據(jù)賦予較小的權(quán)重來(lái)減小異常值的影響。
界外值(Outliers):選擇此項(xiàng),將輸出分析數(shù)據(jù)中的5個(gè)最大值和5個(gè)最小值作為異常嫌疑值。
百分位數(shù)(Percentiles):選擇此項(xiàng),將計(jì)算并顯示指定的百分位數(shù),包括5%、10%、25%、50%、75%、90%和95%等。
"探索:統(tǒng)計(jì)量"對(duì)話框中的4個(gè)選項(xiàng)為復(fù)選框,用戶可進(jìn)行多項(xiàng)選擇,單擊【繼續(xù)】(Continue)按鈕,即可返回"探索"主對(duì)話框。
單擊【繪制】(Plots)按鈕,打開"探索:圖"(Explore:Plots)對(duì)話框,如圖3-11所示。
"探索:圖"對(duì)話框中有如下4個(gè)選擇組:
(1)箱圖(Boxplots)欄(單選項(xiàng)組):箱圖,又稱箱鎖圖。如果用戶在"探索"主對(duì)話框的"因變量列表"(Dependent List)框中輸入了多個(gè)變量名,則在此選擇組中進(jìn)行選擇,可確定箱鎖圖的生成方式。箱鎖圖中,底部的水平線段是數(shù)據(jù)的最小值(異常點(diǎn)除外),頂部的水平線段是數(shù)據(jù)的最大值(異常點(diǎn)除外),中間矩形箱子的底所在的位置是數(shù)據(jù)的第一個(gè)四分位數(shù)(即25%分位數(shù)),箱子頂部所在位置是數(shù)據(jù)的第三個(gè)四分位數(shù)據(jù)(即75%分位數(shù))。箱子中間的水平線段刻畫的是數(shù)據(jù)的中位數(shù)(即50%分位數(shù))。
按因子水平分組(Factor levels together,系統(tǒng)默認(rèn)):選擇此項(xiàng),將為每個(gè)因變量創(chuàng)建一個(gè)箱鎖圖,在每個(gè)箱鎖圖內(nèi)根據(jù)分組變量的不同水平的取值創(chuàng)建箱形單元。
不分組(Dependents together):選擇此項(xiàng),將為每個(gè)分組變量的水平創(chuàng)建一個(gè)箱鎖圖,在每個(gè)箱鎖圖內(nèi)用不同的顏色區(qū)分不同因變量所對(duì)應(yīng)的箱形單元,方便用戶進(jìn)行比較。
無(wú)(None):選擇此項(xiàng),不創(chuàng)建箱圖。
(2)描述性(Descriptive)欄(復(fù)選項(xiàng)):選擇該組內(nèi)的選項(xiàng),可以生成莖葉圖和(或)直方圖。在箱圖(Boxplots)組內(nèi)選擇的選項(xiàng)不同,則生成的莖葉圖和直方圖也不相同。選擇"按因子水平分組"單選按鈕時(shí),在創(chuàng)建莖葉圖和(或)直方圖時(shí),首先會(huì)根據(jù)因變量的不同進(jìn)行分類,為每一個(gè)因變量對(duì)應(yīng)的不同分組變量的不同水平創(chuàng)建一個(gè)莖葉圖和(或)直方圖;選擇"不分組"單選按鈕時(shí),在創(chuàng)建莖葉圖和(或)直方圖時(shí),則首先根據(jù)不同分組變量水平的不同,為每一個(gè)因變量創(chuàng)建一個(gè)莖葉圖和(或)直方圖。
莖葉圖(Stem-and-leaf,系統(tǒng)默認(rèn)):莖葉圖主要由3個(gè)部分組成,即頻率(Frequency)、莖(Stem)和葉(Leaf),在圖中按從左到右的順序依次排列,在圖的底端,注明了莖的寬度(Stem Width)和每一葉所代表的觀測(cè)量數(shù)(Each Leaf)。莖葉圖中,莖表示數(shù)據(jù)的整數(shù)部分,葉表示數(shù)據(jù)的小數(shù)部分(小數(shù)位數(shù)只有一位,頻數(shù)的數(shù)值有多大,則對(duì)應(yīng)的小數(shù)就有多少個(gè)),將莖和葉的數(shù)值組合起來(lái)再乘以莖寬,便是該數(shù)據(jù)的值。由于莖葉圖不僅僅能表示數(shù)據(jù)的頻數(shù)分布,還能近似地表示數(shù)據(jù)的大小,因此它比直方圖表達(dá)的信息更全面。
直方圖(Histogram):直接繪制直方圖的步驟詳見第10章。
(3)帶檢驗(yàn)的正態(tài)圖(Normality plots with test,復(fù)選框):選擇此項(xiàng),將進(jìn)行正態(tài)性檢驗(yàn),并生成正態(tài)Q-Q概率圖和無(wú)趨勢(shì)正態(tài)Q-Q概率圖。
(4)伸展與級(jí)別Levene檢驗(yàn)(Spread vs level with Levene Test)欄(單選項(xiàng)組):對(duì)所有的展布-水平圖進(jìn)行方差齊性檢驗(yàn)和數(shù)據(jù)轉(zhuǎn)換,同時(shí)輸出回歸直線的斜率及方差齊性的Levene檢驗(yàn),但如果沒有指定分組變量,則此選項(xiàng)無(wú)效。
無(wú)(None):不進(jìn)行Levene檢驗(yàn),系統(tǒng)默認(rèn)。選擇此項(xiàng),SPSS將不產(chǎn)生回歸直線的斜率和方差齊性檢驗(yàn)。
冪估計(jì)(Power Estimation):對(duì)每組數(shù)據(jù)產(chǎn)生一個(gè)中位數(shù)的自然對(duì)數(shù)及四個(gè)分位數(shù)的自然對(duì)數(shù)的散點(diǎn)圖。
已轉(zhuǎn)換(Transformed):變換原始數(shù)據(jù),用戶可在后面的參數(shù)框中選擇數(shù)據(jù)變換類型。
未轉(zhuǎn)換(Untransformed):不變換原始數(shù)據(jù)時(shí)選擇此項(xiàng)。
用戶在"探索:圖"對(duì)話框中進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回"探索"主對(duì)話框。
單擊【選項(xiàng)】(Options)按鈕,打開"探索:選項(xiàng)"(Explore:Options)對(duì)話框,如圖3-12所示。
在該對(duì)話框中,可選擇缺失值的處理方式,SPSS提供了3種處理方式:
按列表排除個(gè)案(Exclude cases listwise,系統(tǒng)默認(rèn)):選擇此項(xiàng),對(duì)所有的分析過程剔除分組變量和因變量中所有帶有缺失值的觀測(cè)量數(shù)據(jù);
按對(duì)排除個(gè)案(Exclude cases pairwise):同時(shí)剔除帶缺失值的觀測(cè)量及與缺失值有成對(duì)關(guān)系的觀測(cè)量。在當(dāng)前分析過程中用到的變量數(shù)據(jù)中剔除帶有缺失值的觀測(cè)量數(shù)據(jù),在其他分析過程中可能包含缺失值;
報(bào)告值(Report values):選擇此項(xiàng),將分組變量的缺失值單獨(dú)分為一組,在輸出頻數(shù)表的同時(shí)輸出缺失值。
用戶在"探索:選項(xiàng)"對(duì)話框中進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回"探索"主對(duì)話框。
單擊【確定】(OK)按鈕,即可在結(jié)果輸出窗口中得到探索分析過程的數(shù)據(jù)概述、基本統(tǒng)計(jì)描述表、極端值列表、正態(tài)分布檢驗(yàn)、方差齊性檢驗(yàn)、莖葉圖、直方圖、箱鎖圖、正態(tài)分布Q-Q圖、離散正態(tài)分布Q-Q圖等圖表。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03