
R語言t檢驗
I.單樣本t檢驗
例1. 有原始數(shù)據(jù)的t檢驗
已知某水樣中含碳酸鈣的真值為20.7mg/L,現(xiàn)用某法重復測定該水樣12次,碳酸鈣的含量分別為..問該法測定碳酸鈣含量所得的均值與診治有無顯著差異?
x <- c(20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.42,20.90,22.99,23.12,20.89)
t.test(x, alternative = "greater", mu = 20.7 )
檢驗結果為t=1.5665,顯著性P值=0.07276>0.05,接受原假設,說明該法測定的碳酸鈣含量與總體無顯著差異。
例2. 無原始數(shù)據(jù)的t檢驗
健康成年男子脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機抽查健康成年男子25人,其脈搏均數(shù)為74.2次/分,標準差為6.5次/分。根據(jù)這個資料能否認為某山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子的不同?
#根據(jù)公式算出t值
x <- 74.2
mu <- 72
thita <- 6.5
n <- 25
t <- (x-mu) / (thita/sqrt(n)) #或者用n-1代替n
t
#用pt()函數(shù),輸入t值和自由度df(n-1),得到p值
p <- pt(t,df=24)
p
檢驗結果為t=1.692308,顯著性P值=0.9482341>0.05,接受原假設,說明該法測定的成年男子脈搏數(shù)與總體無顯著差異,認為某山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子的相同。
II.配對樣本t檢驗
上面介紹的是已知總體均數(shù)時的顯著性檢驗方法,但有時我們并不知道總體均數(shù),且醫(yī)學數(shù)據(jù)資料中更為常見的是成對資料,若一批某病病人治療前有某項測定記錄,治療后再次測定以觀察療效,這樣,觀察n例就有n對數(shù)據(jù),這即是成對資料。如果有兩種處理要比較,將每一份標本分成兩份各接受一種處理,這樣觀察到的一批數(shù)據(jù)也是成對資料。醫(yī)學科研中有時無法對同一批對象進行前后或?qū)^察,而只得將病人配成對子,盡量使同對中的兩者在性別、年齡或其他可能會影響處理效果的各種條件方面相似,然后進行處理,在觀察反應,這樣獲得的許多對不可拆散的數(shù)據(jù)同樣是成對資料。由于成對資料可控制個體差異使之較小,故檢驗效率是較高的。
在醫(yī)學研究中,常用配對設計。配對設計主要有4種情況:同一受試對象處理前后的數(shù)據(jù),同一受試對象兩個部位的數(shù)據(jù),同一樣品用兩種方法檢驗的結果,配對的兩個受試對象分別接受兩種處理后的數(shù)據(jù)。
例1. 有原始數(shù)據(jù)的配對t檢驗
判斷簡便法和常規(guī)法測定尿鉛含量的差別有無統(tǒng)計意義,對12份人尿同時用兩種方法進行測定,所得結果如下表所示,請分析兩種測定方法的測量結果是否不同?
#輸入兩組值
x <- c(2.41,2.90,2.75,2.23,3.67,4.49,5.16,5.45,2.06,1.64,1.06,0.77)
y <- c(2.80,3.04,1.88,3.43,3.81,4.00,4.44,5.41,1.24,1.83,1.45,0.92)
#配對樣本t檢驗
t.test(x,y,paired=T)
配對t檢驗的結果為:t=0.16232,顯著性p值=0.874>0.05,不能拒絕原假設H0,說明不能認為兩種方法測定尿鉛含量的結果不相同。
例2. 無原始數(shù)據(jù)的配對t檢驗
慢性支氣管炎病人血中膽堿酯酶活性常常偏高。某校藥理教研室將同性別同年齡的病人與健康人配成8對,測量該值加以比較,配對兩組人差值的均值為0.625,標準差為0.78,問可否通過這一資料得出較明確的結論?
#依次輸入配對樣本的差值d、標準差s、配對數(shù)n
d <- 0.625;s <- 0.78;n <- 8
#算t值
t <- d / (s/sqrt(n))
#輸入自由度n-1,pt()函數(shù)得到p值
df <- n-1
p <- pt(t,df)
t;p
p值為0.9711069>0.05,不能拒絕原假設,不能認為慢性支氣管炎病人與健康人血中膽堿酯酶活性不同。
III.兩獨立樣本t檢驗
在日常工作中,我們經(jīng)常要比較兩組計量資料的均數(shù)間有無顯著差別,如研究不同療法的降壓效果或兩種不同制劑對殺滅鼠體內(nèi)鉤蟲的效果等。假若事先難以找到年齡、性別等條件完全一樣的人(或動物)作配對比較,那么就不能求每對的差數(shù),而只能先算出各組的均數(shù),然后進行比較。兩組例數(shù)可以相等,也可以稍有出入。檢驗的方法同樣是先假定兩組相應的總體均數(shù)相等,看兩組均數(shù)實際相差與此假設是否靠近,近則把相差看成抽樣誤差表現(xiàn),遠到一定界限則認為由抽樣誤差造成這樣大的相差的可能性實在太小,拒絕假設而接受H1,作出兩總體不相等的結論。
成組設計資料的t檢驗與單樣本t檢驗和配對t檢驗情況不同,以上兩種情況最終都可將待分析的變量轉化為一個,并屬于同一個組(即不涉及分組變量)。而成組資料雖然分析的是同一個變量,但要設計不同組之間變量的比較,對兩組數(shù)據(jù)的均數(shù)進行差別比較的t檢驗。
兩個小樣本均數(shù)比較的t檢驗有以下應用條件:
1.兩樣本來自的總體均符合正態(tài)分布,兩樣本來自的總體方差齊性。故在進行兩小樣本均數(shù)比較的t檢驗之前,要用方差齊性檢驗來推斷兩樣本代表的總體方差是否相等,方差齊性檢驗的方法使用F檢驗,其原理是看較大樣本方差與較小樣本方差的商是否接近1。若接近1,則可認為兩樣本代表的總體方差齊性。判斷兩樣本來自的總體是否符合正態(tài)分布,可用正態(tài)性檢驗的方法。
2.若兩樣本來自的總體方差不齊,也不符合正態(tài)分布,對符合對數(shù)正態(tài)分布的資料可以用其集合均數(shù)進行t檢驗,對其他資料可以用t檢驗或秩和檢驗進行分析。
例1. 有原始數(shù)據(jù)的獨立兩樣本t檢驗
有兩組雌鼠,分別飼以高蛋白和低蛋白飼料,8周后記錄各鼠體重增加量如下,問兩組動物增重的均數(shù)差別是否顯著?
高蛋白組 134 146 104 119 124 161 107 83 113 129 97 123
低蛋白組 70 118 101 85 107 132 94
high <- c(134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123)
low <- c(70, 118, 101, 85, 107, 132, 94)
#方差齊次性檢驗
x <- c(134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123,70, 118, 101, 85, 107, 132, 94)
a <- factor(c(rep(1,12),rep(2,7)))
#bartlett.test方差齊性檢驗
bartlett.test(x~a)
#var.test方差齊性檢驗
var.test(x~a)
#levene.test方差齊性檢驗(也是SPSS的默認方差齊性檢驗方法)
library(car)
levene.test(x~a)
#前兩者是對原始數(shù)據(jù)的方差進行檢驗的,leveneTest是對方差模型的殘差進行組間齊性檢驗.一般認為是要求殘差的方差齊,所以一般的統(tǒng)計軟件都做的是leveneTest
#t檢驗
t.test(high,low,paired = FALSE)
1.方差齊次性檢驗,取var.test方差齊性檢驗的結果,F(xiàn) = 1.0755,p-value = 0.9788>0.05,說明兩獨立樣本數(shù)據(jù)方差齊性
2.我們關注的是上表中方差“等于”對應的t值,t=1.89,p值0.0757>0.05,不拒絕原假設,不能認為兩組雌鼠體重增加量不相等
例2. 無原始數(shù)據(jù)的度量兩樣本t檢驗
測量某兩個地區(qū)水中碳酸鈣的含量,分別從兩個地區(qū)隨機抽取20份樣品進行碳酸鈣檢測,分別得到兩個地區(qū)碳酸鈣含量的均數(shù)和標準差,結果見下圖。試判斷兩個地區(qū)水中碳酸鈣的含量是否有差異?
#輸入對照組實驗組均值x1,x2;組數(shù)n1,n2;方差s1,s2
x1<-20.95; x2<-21.79; n1<-20; n2<-20; s1<-5.89; s2<-3.43
#計算兩獨立樣本共同的標準差
sc <- sqrt((1/n1+1/n2)*((n1-1)*s1**2+(n2-1)*s2**2)/(n1+n2-2))
#t值,自由度df,p值
t <- (x2-x1)/sc
df <- n1+n2-2
p <- pt(t,df)
t;p
t=0.5511486,p值0.7076209>0.05,不拒絕原假設,不能認為兩個地區(qū)水中碳酸鈣的含量有差異
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10