集中趨勢用于描述數(shù)據(jù)的平均水平,這可能是人們希望了解的基本的匯總信息,在 統(tǒng)計(jì)學(xué)中用于描述集中趨勢,或者說數(shù)據(jù)分布的中心位置的統(tǒng)計(jì)量就被稱為位置統(tǒng)計(jì)量 (Location Statistic)。針對不同的數(shù)據(jù)分布狀況,統(tǒng)計(jì)學(xué)家提供了多種統(tǒng)計(jì)量來代表原始數(shù)據(jù) 的中心趨勢,比如平均值、中位數(shù)和眾數(shù)等。
算術(shù)均數(shù)(Arithmetic Mean):是常用的描述數(shù)據(jù)分布集中趨勢的統(tǒng)計(jì)指標(biāo),往往將 其直接簡稱為均數(shù)??傮w均數(shù)用希臘字母μ表示,樣本均數(shù)常用 X 表示。對一組數(shù) 據(jù)X1,……,Xn而言,均數(shù)的算法為各數(shù)據(jù)直接相加,再除以例數(shù) n。均數(shù)是常用 的集中趨勢描述指標(biāo),但它不適用于對嚴(yán)重偏態(tài)分布的變量進(jìn)行描述,只有單峰 和基本對稱的分布資料,使用均數(shù)作為集中趨勢描述的統(tǒng)計(jì)量才是合理的。
中位數(shù)(Median):將全體數(shù)據(jù)按大小順序排列,在整個(gè)數(shù)列中處于中間位置的那個(gè) 值。它把全部數(shù)值分成兩部分,比它小和比它大的數(shù)值個(gè)數(shù)正好相等。中位數(shù)適 用于任意分布類型的資料,但由于中位數(shù)只考慮居中位置,對信息的利用不充分, 所以當(dāng)樣本量較小時(shí)數(shù)值會(huì)不太穩(wěn)定。因此對于對稱分布的資料,分析者會(huì)優(yōu)先 考慮使用均數(shù),僅僅在均數(shù)不能使用的情況下才用中位數(shù)加以描述。
幾何均數(shù)(Geometric Mean):用 G 表示,適用于原始數(shù)據(jù)分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料??梢园l(fā)現(xiàn),幾何均數(shù)實(shí)際上就是對數(shù)轉(zhuǎn)換后的數(shù)據(jù) lg X 的算術(shù)均數(shù)的反對數(shù)。
截尾均數(shù)(Trimmed Mean):由于均數(shù)較易受極端值的影響,因此可以考慮按照一定 比例去掉兩端的數(shù)據(jù),然后再計(jì)算均數(shù)。如果截尾均數(shù)和原均數(shù)相差不大,則說 明數(shù)據(jù)不存在極端值,或者兩側(cè)極端值的影響正好抵消。常用的截尾均數(shù)有 5%截 尾均數(shù),即兩端各去掉 5%的數(shù)據(jù)。
其他集中趨勢描述指標(biāo):除了上述常用的幾種指標(biāo)外,還會(huì)遇到眾數(shù)、調(diào)和均 數(shù)等,前者是指樣本數(shù)據(jù)中出現(xiàn)頻次大的那個(gè)數(shù)字,后者是指觀察值 X 倒數(shù)之 均數(shù)的倒數(shù),這些指標(biāo)的實(shí)際應(yīng)用都比較少見。








暫無數(shù)據(jù)