本篇目錄
統(tǒng)計學是一門收集、處理、分析、解釋數(shù)據(jù)并從中得出結論的科學。
一、基本符號表
符號 | 含義 |
---|---|
X | 總體(隨機變量,可帶分布) |
Xi | 樣本(隨機變量,可帶分布,可組成統(tǒng)計量) |
xi | 樣本實際觀測值(實數(shù)) |
μ | 總體均值 |
π | 總體比例 |
σ | 總體標準差 |
σ2 | 總體方差 |
X | 樣本均值(統(tǒng)計量,可帶分布) |
P | 樣本比例(統(tǒng)計量,可帶分布) |
S | 樣本標準差(統(tǒng)計量,可帶分布) |
S2 | 樣本方差(統(tǒng)計量,可帶分布) |
x | 樣本均值(實數(shù),根據(jù)樣本集計算而來) |
p | 樣本比例(實數(shù),根據(jù)樣本集計算而來) |
s | 樣本標準差(實數(shù),根據(jù)樣本集計算而來) |
s2 | 樣本方差 (實數(shù),根據(jù)樣本集計算而來) |
Mo | 眾數(shù) |
Me | 中位數(shù) |
QL | 下四分位數(shù) |
QU | 上四分位數(shù) |
x | 算術平均數(shù) |
H | 調和平均數(shù) |
G | 集合平均數(shù) |
R | 極差 |
Md | 平均差 |
Vs | 變異系數(shù) |
Sk | 偏態(tài)系數(shù) |
K | 峰態(tài)系數(shù) |
二、數(shù)據(jù)的分類
區(qū)間(分組的數(shù)值型數(shù)據(jù))仍屬于數(shù)值型
不同類型數(shù)據(jù)之間往往可以進行轉換(高級→低級,反之不行)
低級數(shù)據(jù)的方法高級數(shù)據(jù)可以用,但高級數(shù)據(jù)的方法低級數(shù)據(jù)不可以用
三、統(tǒng)計方法之 描述性分析方法
四、統(tǒng)計方法之 推斷性分析方法
I、各類分布
1. 0-1分布
2. 二項分布
3. 正態(tài)分布
4. 標準正態(tài)分布
5. 卡方分布
6. t分布
7. F分布
8. 各分布的聯(lián)系
9. 分布函數(shù)與分位點的聯(lián)系
II、估計
1. 選定欲估計的總體參數(shù)
2. 選定總體參數(shù)對應的樣本統(tǒng)計量
其實此處的x,π,s2都應該大寫,因為它們代表的是實際樣本計算值,而非樣本統(tǒng)計量。
3. 確定統(tǒng)計量的抽樣分布
4. 利用統(tǒng)計量的分布和實際樣本集數(shù)據(jù)來對總體參數(shù)進行點估計或區(qū)間估計操作
點估計方法(估計總體參數(shù)的具體值):矩估計法、最大似然法和順序估計量估計法。
區(qū)間估計方法(估計總體參數(shù)的出現(xiàn)區(qū)間):置信水平(1?α)一般取90%、95%和99%。
III、假設檢驗
1. 選擇某總體參數(shù)并對其提出假設
2. 根據(jù)總體參數(shù)確定對應的檢驗統(tǒng)計量
3. 規(guī)定顯著性水平值
一般取值為0.01,0.05,0.1
4. 確定檢驗統(tǒng)計量的抽樣分布,并據(jù)此計算檢驗統(tǒng)計量的實際樣本值
5. 根據(jù)原假設來判斷拒絕域的位置,并利用實際樣本值是否落在拒絕域(具體值查表即可)進行決策
α臨界值法:
P值法:
置信區(qū)間法:無
IV. 列聯(lián)分析
本質是對每個總體的比例參數(shù)是否相等進行假設檢驗,因此下面的每一步都可以和假設檢驗步驟進行對應。
1. 提出對總體比例參數(shù)的假設(一般為雙側檢驗)
2. 構造邊緣分布表
3. 計算期望頻數(shù)
4. 構造總體比例對應的統(tǒng)計量的卡方分布,并計算統(tǒng)計量的實際樣本值
5. 根據(jù)拒絕域(右側檢驗)來得出結論
一般默認顯著性水平α為0.05,若χ2<χα2(自由度),則接受原假設,否則拒絕。
7.列聯(lián)分析步驟五的改進
為了填補由于樣本量的不同而影響決策結果的缺陷,因此根據(jù)?相關系數(shù)來得出結論。其中樣本總量n指的是邊緣分布表總頻數(shù)。
8. 列聯(lián)分析的拓展應用
V. 方差分析
1. 提出對總體均值參數(shù)假設(一般為雙側檢驗)
2. 分析差異
3. 計算均方(SSE和SSA)
4. 構造總體均值對應的統(tǒng)計量的F分布,并計算樣本統(tǒng)計量值F=MSA/MSE
其中,k代表的是組的個數(shù),n代表的是總樣本數(shù)。
5. 根據(jù)規(guī)定的顯著性水平和F分布的自由度確定拒絕域(右側檢驗)查臨界值,并決策
VI. 相關分析
研究的是有沒有關系,關系有多大的問題。
VII. 回歸分析
研究的是關系是什么,因此在做對關系進行分析的研究中,需要先使用相關分析判斷有沒有關系,再考慮使用回歸分析。