本篇目錄
統(tǒng)計(jì)學(xué)是一門(mén)收集、處理、分析、解釋數(shù)據(jù)并從中得出結(jié)論的科學(xué)。
一、基本符號(hào)表
符號(hào) | 含義 |
---|---|
X | 總體(隨機(jī)變量,可帶分布) |
Xi | 樣本(隨機(jī)變量,可帶分布,可組成統(tǒng)計(jì)量) |
xi | 樣本實(shí)際觀測(cè)值(實(shí)數(shù)) |
μ | 總體均值 |
π | 總體比例 |
σ | 總體標(biāo)準(zhǔn)差 |
σ2 | 總體方差 |
X | 樣本均值(統(tǒng)計(jì)量,可帶分布) |
P | 樣本比例(統(tǒng)計(jì)量,可帶分布) |
S | 樣本標(biāo)準(zhǔn)差(統(tǒng)計(jì)量,可帶分布) |
S2 | 樣本方差(統(tǒng)計(jì)量,可帶分布) |
x | 樣本均值(實(shí)數(shù),根據(jù)樣本集計(jì)算而來(lái)) |
p | 樣本比例(實(shí)數(shù),根據(jù)樣本集計(jì)算而來(lái)) |
s | 樣本標(biāo)準(zhǔn)差(實(shí)數(shù),根據(jù)樣本集計(jì)算而來(lái)) |
s2 | 樣本方差 (實(shí)數(shù),根據(jù)樣本集計(jì)算而來(lái)) |
Mo | 眾數(shù) |
Me | 中位數(shù) |
QL | 下四分位數(shù) |
QU | 上四分位數(shù) |
x | 算術(shù)平均數(shù) |
H | 調(diào)和平均數(shù) |
G | 集合平均數(shù) |
R | 極差 |
Md | 平均差 |
Vs | 變異系數(shù) |
Sk | 偏態(tài)系數(shù) |
K | 峰態(tài)系數(shù) |
二、數(shù)據(jù)的分類(lèi)
區(qū)間(分組的數(shù)值型數(shù)據(jù))仍屬于數(shù)值型
不同類(lèi)型數(shù)據(jù)之間往往可以進(jìn)行轉(zhuǎn)換(高級(jí)→低級(jí),反之不行)
低級(jí)數(shù)據(jù)的方法高級(jí)數(shù)據(jù)可以用,但高級(jí)數(shù)據(jù)的方法低級(jí)數(shù)據(jù)不可以用
三、統(tǒng)計(jì)方法之 描述性分析方法
四、統(tǒng)計(jì)方法之 推斷性分析方法
I、各類(lèi)分布
1. 0-1分布
2. 二項(xiàng)分布
3. 正態(tài)分布
4. 標(biāo)準(zhǔn)正態(tài)分布
5. 卡方分布
6. t分布
7. F分布
8. 各分布的聯(lián)系
9. 分布函數(shù)與分位點(diǎn)的聯(lián)系
II、估計(jì)
1. 選定欲估計(jì)的總體參數(shù)
2. 選定總體參數(shù)對(duì)應(yīng)的樣本統(tǒng)計(jì)量
其實(shí)此處的x,π,s2都應(yīng)該大寫(xiě),因?yàn)樗鼈兇淼氖菍?shí)際樣本計(jì)算值,而非樣本統(tǒng)計(jì)量。
3. 確定統(tǒng)計(jì)量的抽樣分布
4. 利用統(tǒng)計(jì)量的分布和實(shí)際樣本集數(shù)據(jù)來(lái)對(duì)總體參數(shù)進(jìn)行點(diǎn)估計(jì)或區(qū)間估計(jì)操作
點(diǎn)估計(jì)方法(估計(jì)總體參數(shù)的具體值):矩估計(jì)法、最大似然法和順序估計(jì)量估計(jì)法。
區(qū)間估計(jì)方法(估計(jì)總體參數(shù)的出現(xiàn)區(qū)間):置信水平(1?α)一般取90%、95%和99%。
III、假設(shè)檢驗(yàn)
1. 選擇某總體參數(shù)并對(duì)其提出假設(shè)
2. 根據(jù)總體參數(shù)確定對(duì)應(yīng)的檢驗(yàn)統(tǒng)計(jì)量
3. 規(guī)定顯著性水平值
一般取值為0.01,0.05,0.1
4. 確定檢驗(yàn)統(tǒng)計(jì)量的抽樣分布,并據(jù)此計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)際樣本值
5. 根據(jù)原假設(shè)來(lái)判斷拒絕域的位置,并利用實(shí)際樣本值是否落在拒絕域(具體值查表即可)進(jìn)行決策
α臨界值法:
P值法:
置信區(qū)間法:無(wú)
IV. 列聯(lián)分析
本質(zhì)是對(duì)每個(gè)總體的比例參數(shù)是否相等進(jìn)行假設(shè)檢驗(yàn),因此下面的每一步都可以和假設(shè)檢驗(yàn)步驟進(jìn)行對(duì)應(yīng)。
1. 提出對(duì)總體比例參數(shù)的假設(shè)(一般為雙側(cè)檢驗(yàn))
2. 構(gòu)造邊緣分布表
3. 計(jì)算期望頻數(shù)
4. 構(gòu)造總體比例對(duì)應(yīng)的統(tǒng)計(jì)量的卡方分布,并計(jì)算統(tǒng)計(jì)量的實(shí)際樣本值
5. 根據(jù)拒絕域(右側(cè)檢驗(yàn))來(lái)得出結(jié)論
一般默認(rèn)顯著性水平α為0.05,若χ2<χα2(自由度),則接受原假設(shè),否則拒絕。
7.列聯(lián)分析步驟五的改進(jìn)
為了填補(bǔ)由于樣本量的不同而影響決策結(jié)果的缺陷,因此根據(jù)?相關(guān)系數(shù)來(lái)得出結(jié)論。其中樣本總量n指的是邊緣分布表總頻數(shù)。
8. 列聯(lián)分析的拓展應(yīng)用
V. 方差分析
1. 提出對(duì)總體均值參數(shù)假設(shè)(一般為雙側(cè)檢驗(yàn))
2. 分析差異
3. 計(jì)算均方(SSE和SSA)
4. 構(gòu)造總體均值對(duì)應(yīng)的統(tǒng)計(jì)量的F分布,并計(jì)算樣本統(tǒng)計(jì)量值F=MSA/MSE
其中,k代表的是組的個(gè)數(shù),n代表的是總樣本數(shù)。
5. 根據(jù)規(guī)定的顯著性水平和F分布的自由度確定拒絕域(右側(cè)檢驗(yàn))查臨界值,并決策
VI. 相關(guān)分析
研究的是有沒(méi)有關(guān)系,關(guān)系有多大的問(wèn)題。
VII. 回歸分析
研究的是關(guān)系是什么,因此在做對(duì)關(guān)系進(jìn)行分析的研究中,需要先使用相關(guān)分析判斷有沒(méi)有關(guān)系,再考慮使用回歸分析。