
R語言與顯著性檢驗學習筆記
一、何為顯著性檢驗
顯著性檢驗的思想十分的簡單,就是認為小概率事件不可能發(fā)生。雖然概率論中我們一直強調(diào)小概率事件必然發(fā)生,但顯著性檢驗還是相信了小概率事件在我做的這一次檢驗中沒有發(fā)生。
顯著性檢驗即用于實驗處理組與對照組或兩種不同處理的效應之間是否有差異,以及這種差異是否顯著的方法。
常把一個要檢驗的假設記作H0,稱為原假設(或零假設),與H0對立的假設記作H1,稱為備擇假設。
⑴在原假設為真時,決定放棄原假設,稱為第一類錯誤,其出現(xiàn)的概率通常記作α;
⑵在原假設不真時,決定接受原假設,稱為第二類錯誤,其出現(xiàn)的概率通常記作β。
通常只限定犯第一類錯誤的最大概率α,不考慮犯第二類錯誤的概率β。這樣的假設檢驗又稱為顯著性檢驗,概率α稱為顯著性水平。
我們常用的顯著性檢驗有t檢驗,卡方檢驗,相關性檢驗等,在做這一些檢驗時,有什么需要注意的呢?
二、正態(tài)性與P值
t檢驗,卡方檢驗,相關性檢驗中的pearson方法都是建立在正態(tài)樣本的假設下的,所以在假設檢驗開始時,一般都會做正態(tài)性分析。在R中可以使用shapiro.test()。來作正態(tài)性檢驗。當然在norm.test包中還提供了許多其他的方法供我們選擇。
P值是可以拒絕原假設的最小水平值。
三、四個重要的量
綜合前面的敘述,我們知道研究顯著性檢驗有四個十分重要的量:樣本大小,顯著性水平,功效,效應值。
樣本大?。哼@個顯然,樣本越多,對樣本的把握顯然越準確,但是鑒于我們不可能擁有無限制的樣本,那么多少個樣本可以達到要求?今天的分享中我們可以通過R來找到答案。
顯著性水平:犯第一類錯誤的概率,這個在做檢驗前我們會提前約定,最后根據(jù)P值來決定取舍。
功效:這個是在顯著性檢驗中一般不提及但實際十分有用的量。它衡量真實事件發(fā)生的概率。也就是說功效越大,第二類錯誤越不可能發(fā)生。雖然顯著性假設檢驗不提及它,但衡量假設檢驗的好壞的重要指標便是兩類錯誤盡可能小。
效應值:備擇假設下效應的量
四、用pwr包做功效分析
Pwr包中提供了以下函數(shù):
下面我們來介紹以上一些函數(shù)的用法。
1、 t檢驗
調(diào)用格式:
pwr.t.test(n = NULL, d = NULL, sig.level =0.05, power = NULL, type =c("two.sample", "one.sample", "paired"),alternative = c("two.sided", "less","greater"))
參數(shù)說明:
N:樣本大小
D:t檢驗的統(tǒng)計量
Sig.level:顯著性水平
Power:功效水平
Type:檢驗類型,這里默認是兩樣本,且樣本量相同
Alternative:統(tǒng)計檢驗是雙側(cè)還是單側(cè),這里默認為雙側(cè)
舉例說明:已知樣本量為60,單一樣本t檢驗的統(tǒng)計量的值為0.2(這個可以通過t.test(data)$statistic取出來),顯著水平α=0.1,那么功效是多少呢?
R中輸入命令:
得到結(jié)果:
One-sample t test power calculation
n = 60
d = 0.2
sig.level = 0.1
power = 0.4555818
alternative = two.sided
我們可以看到,犯第二類錯誤的概率在50%以上,我們應該相信這個結(jié)果嗎(無論根據(jù)P值來看是拒絕還是接受)?顯然不行,那么需要多少個樣本才能把第二類錯誤降低到10%呢?
在R中輸入:
pwr.t.test(d=0.2,power=0.9,sig.level=0.10,type="one.sample",alternative="two.sided")
得到結(jié)果:
One-sample t test power calculation
n = 215.4542
d = 0.2
sig.level = 0.1
power = 0.9
alternative = two.sided
也就是說216個樣本才可以得到滿意的結(jié)果,使得第二類錯誤概率不超過0.1.
對于兩樣本而言是類似的,我們不在贅述,我們下面再介紹另一種t檢驗的情況:兩樣本不相等。
調(diào)用格式:
pwr.t2n.test(n1 = NULL, n2= NULL, d = NULL,sig.level = 0.05, power = NULL, alternative = c("two.sided","less","greater"))
參數(shù)說明:
n1 Numberof observations in the first sample
n2 Numberof observations in the second sample
d Effectsize
sig.level Significancelevel (Type I error probability)
power Powerof test (1 minus Type II error probability)
alternative acharacter string specifying the alternative hypothesis, must be one of"two.sided" (default), "greater" or "less"
例如:兩個樣本量為90,60,統(tǒng)計量為0.6,單側(cè)t檢驗,α=0.05,為望大指標。
R中的命令:
輸出結(jié)果:
t test power calculation
n1 = 90
n2 = 60
d = 0.6
sig.level = 0.05
power = 0.9737262
alternative = greater
可以看出功效十分大,且α=0.05,我們相信這次檢驗的結(jié)論很可信。
2、 相關性
Pwr.r.test()函數(shù)對相關性分析進行功效分析。格式如下:
pwr.r.test(n = NULL, r = NULL, sig.level = 0.05, power = NULL, alternative = c("two.sided", "less","greater"))
這里和t檢驗不同的是r是線性相關系數(shù),可以通過cor(data1,data2)獲取,但需要注意的是不要輸入spearman,kendall相關系數(shù),他們是衡量等級相關的。
假定我們研究抑郁與孤獨的關系,我們的原假設和備擇假設為:
H0:r<0.25 v.s. H1:r>0.25
假定顯著水平為0.05,原假設不真,我們想有90%的信心拒絕H0,需要觀測多少呢?
下面的代碼給出答案:
pwr.r.test(r=0.25,sig.level=0.05,power=0.9,alt="greater")
approximate correlation power calculation (arctangh transformation)
n = 133.8325
r = 0.25
sig.level = 0.05
power = 0.9
alternative = greater
易見,需要樣本134個
3、 卡方檢驗
原假設為變量之間獨立,備擇假設為變量不獨立。命令為pwr.chisq.test(),調(diào)用格式:
pwr.chisq.test(w = NULL, N = NULL, df = NULL, sig.level = 0.05, power = NULL)其中w為效應值,可以通過ES.w2計算出來,df為列聯(lián)表自由度
舉例:
輸出結(jié)果:
Chi squared power calculation
w = 0.2558646
N = 200
df = 3
sig.level = 0.05
power = 0.8733222
NOTE: N is the number of observations
也就是說,這個觀測下反第二類錯誤的概率在13%左右,結(jié)果較為可信。
在R中還有不少與功效分析有關的包,我們不加介紹的把它們列舉如下:
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10