
【R語(yǔ)言】單一樣本推斷問(wèn)題
非參數(shù)統(tǒng)計(jì)概念:
在實(shí)際問(wèn)題中,對(duì)數(shù)據(jù)的分布形式和統(tǒng)計(jì)模型難以作出比較明確的假定,最多只能對(duì)總體的分布做出類(lèi)似于連續(xù)性型分布或者對(duì)某點(diǎn)對(duì)稱(chēng)等一般性假定。這種不假設(shè)總體分布的具體形式,盡量從數(shù)據(jù)(樣本)本身獲得所需要的信息,通過(guò)估計(jì)而獲得分布的結(jié)構(gòu),并逐步建立對(duì)事物的數(shù)學(xué)描述和統(tǒng)計(jì)建模的方法稱(chēng)為非參數(shù)方法。
單一樣本的推斷問(wèn)題:
符號(hào)檢驗(yàn)
符號(hào)檢驗(yàn)所關(guān)心的就是通過(guò)符號(hào)“+”“-”的個(gè)數(shù)來(lái)進(jìn)行統(tǒng)計(jì)推斷
eg:假設(shè)某城市16座欲出售的樓盤(pán)均價(jià)(單位:百元 /平方米)
36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35
問(wèn):該地盤(pán)樓盤(pán)價(jià)格是否與媒體公布的3700元/平方米說(shuō)法相符?
分析:
總體均值的點(diǎn)估計(jì)是樣本均值,總體中位數(shù)的點(diǎn)估計(jì)是樣本中位數(shù),由于中位數(shù)的穩(wěn)健性,將37理解為總體的中位數(shù),則假設(shè)問(wèn)題為:
H0:M=37 H1: M不等于37(待檢驗(yàn)的中位數(shù)值)
假設(shè):
S+:位于37右邊的個(gè)數(shù) S-: 位于37左邊的個(gè)數(shù)
令K=min{S+,S-},且K服從p=0.5的二項(xiàng)分布
R代碼:
##1.S-為檢驗(yàn)統(tǒng)計(jì)量
sign1.test = function(x,pi,q0){
s1 = sum(x<q0) #S-的個(gè)數(shù)
s2 = sum(x>q0) #S+的個(gè)數(shù)
n = s1+s2
p1 = pbinom(s1,n,pi) ### 取檢驗(yàn)統(tǒng)計(jì)量K=S-,計(jì)算 P(K<=s1)
p2 = 1-pbinom(s1-1,n,pi) ### 計(jì)算 P(K>=s1)
if(p1 < p2){ m1 = "one tail test:H1: Q > q0"
}else{
m1 = "one tail test:H1: Q < q0"
}
p.value = min(p1,p2)
m2 = "two tails test"
p.value2 = 2*p.value
list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)
}
##以上便構(gòu)建了符號(hào)檢驗(yàn)的函數(shù),接下來(lái)可以直接調(diào)用
data=c(36,31,25,28,36,40,32,41,26,35,35,32,87,33,35,32)##賦值
x=median(data)##獲取樣本中位數(shù)
sign1.test(data,0.5,37)
結(jié)果解讀:
p=0.02127<0.05(顯著性水平),拒絕H0,認(rèn)為該地盤(pán)樓盤(pán)價(jià)格是否與媒體公布的3700元/平方米存在顯著差異。
趨勢(shì)檢驗(yàn)
對(duì)于趨勢(shì)分析,我們用一些數(shù)對(duì)來(lái)反映前后數(shù)據(jù)的變化。為保證數(shù)對(duì)同分布,前后兩個(gè)數(shù)的間隔應(yīng)該固定;為保證數(shù)對(duì)不受局部干擾,前后兩個(gè)數(shù)的間隔應(yīng)該較大。Cox-Staut趨勢(shì)檢驗(yàn),是以數(shù)列中位于中間位置的數(shù)為拆分點(diǎn),前后兩兩組成數(shù)對(duì)。
例:一個(gè)住宅小區(qū)的夜間噪音長(zhǎng)期一直保持在30分貝。后來(lái)附近有建筑工地施工。數(shù)據(jù)是連續(xù)12天夜間在該小區(qū)所測(cè)得的噪聲水平(分貝)。
30,31,33,35,31,30,68,60,65,67,66,64
請(qǐng)問(wèn):該建筑工地是否提高了小區(qū)的噪聲水平?
建立假設(shè):
Ho:該建筑工地沒(méi)有提高小區(qū)的噪聲水平
H1:該建筑工地提高了小區(qū)的噪聲水平
檢驗(yàn)統(tǒng)計(jì)量選取:
S=min{S+,S-}
S+:每一數(shù)對(duì)前后兩值之差為正的個(gè)數(shù)
S-:每一數(shù)對(duì)前后兩值之差為負(fù)的個(gè)數(shù)
R代碼:
CS.test = function(x){
m = length(x)
c = if(m/2-round(m/2)==0){m/2}else{(m+1)/2} ### 此處亦可用floor(m/2)代替round(m/2)
d = if(m/2-round(m/2)==0){x[1:c]-x[(c+1):m]}else{x[1:(c-1)]-x[(c+1):m]}
n1 = length(d[which(d > 0)]) ### n1 = length(which(d > 0))
n2 = length(d[which(d < 0)])
n = n1+n2
s1 = sum(sign(d)== 1)
s2 = sum(sign(d)== -1)
if(n1 > n2){
m1 = "one tail test:H1: decreasing"
p.value = pbinom(n2,n,0.5)
}else{
m1 = "one tail test:H1: increasing"
p.value = pbinom(n1,n,0.5)
}
m2 = "two tails test"
s = min(s1,s2)
p.value2 = 2*pbinom(s,n,0.5)
if(n1==n2){p.value = 0.5;p.value2 = 1}
list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)
}
上述就是Cox-Staut檢驗(yàn)的算法代碼
代入數(shù)據(jù):
x=c(30,31,33,35,31,30,68,60,65,67,66,64)
結(jié)果分析:
單邊檢驗(yàn)P=0.015625<0.05(顯著性水平)
故拒絕H0,認(rèn)為該建筑工地提高了小區(qū)的噪聲水平。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03