描述統(tǒng)計(jì)是通過圖表或數(shù)學(xué)方法,對(duì)數(shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計(jì)和描述的方法。目的是描述數(shù)據(jù)特征,找出數(shù)據(jù)的基本規(guī)律。描述統(tǒng)計(jì)分為集中趨勢(shì)分析和離中趨勢(shì)分析和相關(guān)分析三大部分。
(1)數(shù)據(jù)的頻數(shù)分析:在數(shù)據(jù)的預(yù)處理部分,我們?cè)?jīng)提到利用頻數(shù)分析和交叉頻數(shù)分析來檢驗(yàn)異常值。此外,頻數(shù)分析也可以發(fā)現(xiàn)一些統(tǒng)計(jì)規(guī)律。比如說,收入低的被調(diào)查者用戶滿意度比收入高的被調(diào)查者高,或者女性的用戶滿意度比男性低等。不過這些規(guī)律只是表面的特征,在后面的分析中還要經(jīng)過檢驗(yàn)。
(2)數(shù)據(jù)的集中趨勢(shì)分析:數(shù)據(jù)的集中趨勢(shì)分析是用來反映數(shù)據(jù)的一般水平,常用的指標(biāo)有平均值、中位數(shù)和眾數(shù)等。各指標(biāo)的具體意義如下:
平均值:是衡量數(shù)據(jù)的中心位置的重要指標(biāo),反映了一些數(shù)據(jù)必然性的特點(diǎn),包括算術(shù)平均值、加權(quán)算術(shù)平均值、調(diào)和平均值和幾何平均值。
中位數(shù):是另外一種反映數(shù)據(jù)的中心位置的指標(biāo),其確定方法是將所有數(shù)據(jù)以由小到大的順序排列,位于中央的數(shù)據(jù)值就是中位數(shù)。
眾數(shù):是指在數(shù)據(jù)中發(fā)生頻率最高的數(shù)據(jù)值。
如果各個(gè)數(shù)據(jù)之間的差異程度較小,用平均值就有較好的代表性;而如果數(shù)據(jù)之間的差異程度較大,特別是有個(gè)別的極端值的情況,用中位數(shù)或眾數(shù)有較好的代表性。
(3)數(shù)據(jù)的離散程度分析:數(shù)據(jù)的離散程度分析主要是用來反映數(shù)據(jù)之間的差異程度,常用的指標(biāo)有方差和標(biāo)準(zhǔn)差。方差是標(biāo)準(zhǔn)差的平方,根據(jù)不同的數(shù)據(jù)類型有不同的計(jì)算方法。
(4)數(shù)據(jù)的分布:在統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)分布,數(shù)據(jù)的正態(tài)性離群值檢驗(yàn),已知標(biāo)準(zhǔn)差Nair檢驗(yàn),未知標(biāo)準(zhǔn)差時(shí),有Grubbs檢驗(yàn),Dixon檢驗(yàn),偏度-峰度法等。其中常用偏度-峰度法需要用偏度和峰度兩個(gè)指標(biāo)來檢查樣本是否符合正態(tài)分布。偏度衡量的是樣本分布的偏斜方向和程度;而峰度衡量的是樣本分布曲線的尖峰程度。一般情況下,如果樣本的偏度接近于0,而峰度接近于3,就可以判斷總體的分布接近于正態(tài)分布。
(5)繪制統(tǒng)計(jì)圖:用圖形的形式來表達(dá)數(shù)據(jù),比用文字表達(dá)更清晰、更簡(jiǎn)明。在SPSS軟件里,可以很容易的繪制各個(gè)變量的統(tǒng)計(jì)圖形,包括條形圖、餅圖和折線圖等。








暫無數(shù)據(jù)