
2.假設(shè)檢驗的兩類錯誤
注意事項:拒絕或無法拒絕假設(shè),并不等于100%的正確;兩類錯誤的概率相加并不一定等于1;樣本量不變的情況下, ?與?不能同時增大或減?。ㄈ缦聢D)。
3.假設(shè)檢驗的基本思想及遵循這樣的思想、步驟等過程對業(yè)務(wù)與數(shù)據(jù)分析流程的指導(dǎo)作用
假設(shè)檢驗的基本思想為驗證性數(shù)據(jù)分析,強(qiáng)調(diào)先驗理論在數(shù)據(jù)分析中的核心地位。從提出假設(shè)理論出發(fā),到驗證假設(shè)的 過程提示,數(shù)據(jù)分析理論的先導(dǎo)作用,所以業(yè)務(wù)流與假設(shè)檢驗的步驟可以大體概括如下:
(1)建立原假設(shè)成立,確定業(yè)務(wù)需求,明確目的;
(2)確定小概率事件的界值,概率界值在不同行業(yè)中通用;
(3)獲取樣本,收集或調(diào)查數(shù)據(jù);
(4)選擇檢驗的方法。選擇具體的統(tǒng)計方法; (5)確定 P 值,根據(jù)原需求和數(shù)據(jù)得出結(jié)論,需求目的是否得到支持。 所以可以看出,業(yè)務(wù)流程的數(shù)據(jù)分析與假設(shè)檢驗的流程是一致的。
一個總體,總體均值的假設(shè)檢驗,總體正態(tài),總體方差已知,可以用樣本均值的標(biāo)準(zhǔn)誤差,按正態(tài)分布計算臨界比率。
一個總體,總體均值的假設(shè)檢驗,總體為非正態(tài)分布,總體方差未知,大樣本。原則上用非參數(shù)檢驗;n的樣本量較大 (n大于等于30 或50),服從近似正態(tài)分布(總體已知)。
t 統(tǒng)計量的函數(shù)形式
一個總體,總體均值的假設(shè)檢驗,總體正態(tài),總體方差未知,小樣本(通常是指小于30)。
利用 P 值進(jìn)行檢驗
P值是一種概率,一種在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率,可以表示對原假設(shè)的支持程度,是 用于確定是否應(yīng)該拒絕原假設(shè)的一種方法,當(dāng) P 值小于顯著性水平的時候,就需要拒絕原假設(shè),否則就無法拒絕原假設(shè)。
左側(cè)檢驗的 P 值為檢驗統(tǒng)計量 X 小于樣本統(tǒng)計值 C 的概率,即:P = P{ X < C}
1.單側(cè)檢驗
(以右側(cè)檢驗為例)P 值為樣本統(tǒng)計值 X(將樣本值代入檢驗統(tǒng)計量中的計算結(jié)果)右側(cè)的面積(概率)。
2.雙側(cè)檢驗
P值為樣本統(tǒng)計值的絕對值右側(cè)的面積的兩倍。
兩個獨(dú)立樣本t檢驗(小樣本)
用于檢驗兩樣本是否來自相同均值的總體。
1.如果沒有理論、業(yè)務(wù)向?qū)Щ蛞矝]有假設(shè)條件的情況下( )。
A. 這樣有違數(shù)據(jù)分析的邏輯,不能分析
B. 可以進(jìn)行探索性數(shù)據(jù)分析,了解數(shù)據(jù)情況
C. 需要選擇比較準(zhǔn)確的模型才可以做數(shù)據(jù)分析
D. 以上都不對
答案:B 解析:數(shù)據(jù)分析分為驗證性數(shù)據(jù)分析和探索性數(shù)據(jù)分析,驗證性數(shù)據(jù)分析是傳統(tǒng)數(shù)據(jù)分析的主要 分析方法論,但探索性數(shù)據(jù)分析在先驗假設(shè)不明確的情況下使用。
2.t檢驗統(tǒng)計量的適用條件判斷( )。
A. 樣本為小樣本,并且總體方差已知
B. 樣本為大樣本,并且總體方差已知
C. 樣本為小樣本,并且總體方差未知
D. 樣本為大樣本,并且總體方差未知
答案:C 解析:C項符合,需要記住 t 檢驗的適用條件。
3.下列適合用 t 檢驗的有( )。
A. 比較某種化肥改良后,能否有助于提高某種農(nóng)作物的產(chǎn)量
B. 判斷商品質(zhì)量(如添加劑)是否達(dá)標(biāo)
C. 判斷不同學(xué)歷(如本科、碩士、博士)的收入差別
D. 檢驗不同性別的同學(xué)在英語成績上是否有顯著差異
答案:ABD 解析:t 檢驗的應(yīng)用題,A項可以使用配對樣本t檢驗,B項可以使用單樣本t檢驗,D 項可以使用獨(dú)立樣本t檢驗,C項需要使用方差分析。本題是需要將t檢驗條件轉(zhuǎn)化成 實際問題加以解決。
4.如果原假設(shè) H0 為真,所得到的樣本結(jié)果會像實際預(yù)測結(jié)果那么極端或更極端的概率稱為( )。 A. 臨界值
B. 統(tǒng)計量
C. P 值
D. 事先給定的顯著性水平
答案:C 解析: P 值的概念理解。
5.某產(chǎn)品的次品率為0.17,現(xiàn)對此產(chǎn)品進(jìn)行新工藝試驗,從中抽取400件檢驗,發(fā)現(xiàn)有次品56件,能否認(rèn)為此項新工 藝提高了產(chǎn)品的質(zhì)量(α=0.05)。對于這個問題,正確的原假設(shè)是( )。 【注:P為次品率】
A.P≥0.17
B. P<0.17
C. P>0.17
D. P=0.17
答案:A 解析:參照假設(shè)檢驗的基本原理,一般認(rèn)為如果提高了產(chǎn)品質(zhì)量,那么我們要拒絕原假設(shè),所以原 假設(shè)因為采用新工藝后次品率大于0.17的假設(shè)。
點擊CDA題庫鏈接,獲取免費(fèi)版CDA題庫入口,??荚図樌焖倌米C!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10