
T檢驗、F檢驗和統(tǒng)計學意義(P值或sig值)-t檢驗和f檢驗
1,T檢驗和F檢驗的由來
一般而言,為了確定從樣本(sample)統(tǒng)計結果推論至總體時所犯錯的概率,我們會利用統(tǒng)計學家所開發(fā)的一些統(tǒng)計方法,進行統(tǒng)計檢定。
通過把所得到的統(tǒng)計檢定值,與統(tǒng)計學家建立了一些隨機變量的概率分布(probability distribution)進行比較,我們可以知道在多少%的機會下會得到目前的結果。倘若經比較后發(fā)現,出現這結果的機率很少,亦即是說,是在機會很少、很罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統(tǒng)計學上的意義的(用統(tǒng)計學的話講,就是能夠拒絕虛無假設null hypothesis,Ho)。相反,若比較后發(fā)現,出現的機率很高,并不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒能確定。
F值和t值就是這些統(tǒng)計檢定值,與它們相對應的概率分布,就是F分布和t分布。統(tǒng)計顯著性(sig)就是出現目前樣本這結果的機率。
2,統(tǒng)計學意義(P值或sig值)
結果的統(tǒng)計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業(yè)上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由于偶然性造成的。即假設總體中任意變量間均無關聯,我們重復類似實驗,會發(fā)現約20個實驗中有一個實驗,我們所研究的變量關聯將等于或強于我們的實驗結果。(這并不是說如果變量間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變量存在關聯,重復研究和發(fā)現關聯的可能性與設計的統(tǒng)計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。
3,T檢驗和F檢驗
至於具體要檢定的內容,須看你是在做哪一個統(tǒng)計程序。
舉一個例子,比如,你要檢驗兩獨立樣本均數差異是否能推論至總體,而行的t檢驗。
兩樣本(如某班男生和女生)某變量(如身高)的均數并不相同,但這差別是否能推論至總體,代表總體的情況也是存在著差異呢?
會不會總體中男女生根本沒有差別,只不過是你那麼巧抽到這2樣本的數值不同?
為此,我們進行t檢定,算出一個t檢定值。
與統(tǒng)計學家建立的以「總體中沒差別」作基礎的隨機變量t分布進行比較,看看在多少%的機會(亦即顯著性sig值)下會得到目前的結果。
若顯著性sig值很少,比如<0.05(少於5%機率),亦即是說,「如果」總體「真的」沒有差別,那麼就只有在機會很少(5%)、很罕有的情況下,才會出現目前這樣本的情況。雖然還是有5%機會出錯(1-0.05=5%),但我們還是可以「比較有信心」的說:目前樣本中這情況(男女生出現差異的情況)不是巧合,是具統(tǒng)計學意義的,「總體中男女生不存差異」的虛無假設應予拒絕,簡言之,總體應該存在著差異。
每一種統(tǒng)計方法的檢定的內容都不相同,同樣是t-檢定,可能是上述的檢定總體中是否存在差異,也同能是檢定總體中的單一值是否等於0或者等於某一個數值。
至於F-檢定,方差分析(或譯變異數分析,Analysis of Variance),它的原理大致也是上面說的,但它是透過檢視變量的方差而進行的。它主要用于:均數差別的顯著性檢驗、分離各有關因素并估計其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗等情況。
3,T檢驗和F檢驗的關系
t檢驗過程,是對兩樣本均數(mean)差別的顯著性進行檢驗。惟t檢驗須知道兩個總體的方差(Variances)是否相等;t檢驗值的計算會因方差是否相等而有所不同。也就是說,t檢驗須視乎方差齊性(Equality of Variances)結果。所以,SPSS在進行t-test for Equality of Means的同時,也要做Levene’s Test for Equality of Variances 。
1.
在Levene’s Test for Equality of Variances一欄中 F值為2.36, Sig.為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。
2.
在t-test for Equality of Means中,第一排(Variances=Equal)的情況:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99
既然Sig=.000,亦即,兩樣本均數差別有顯著性意義!
3.
到底看哪個Levene’s Test for Equality of Variances一欄中sig,還是看t-test for Equality of Means中那個Sig. (2-tailed)啊?
答案是:兩個都要看。
先看Levene’s Test for Equality of Variances,如果方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故接著的t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。
反之,如果方差齊性檢驗「有顯著差異」,即兩方差不齊(Unequal Variances),故接著的t檢驗的結果表中要看第二排的數據,亦即方差不齊的情況下的t檢驗的結果。
4.
你做的是T檢驗,為什么會有F值呢?
就是因為要評估兩個總體的方差(Variances)是否相等,要做Levene’s Test for Equality of Variances,要檢驗方差,故所以就有F值。
另一種解釋:
t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。
單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。
配對t檢驗:是采用配對設計方法觀察以下幾種情形,1,兩個同質受試對象分別接受兩種不同的處理;2,同一受試對象接受兩種不同的處理;3,同一受試對象處理前后。
F檢驗又叫方差齊性檢驗。在兩樣本t檢驗中要用到F檢驗。
從兩研究總體中隨機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t檢驗,若不等,可采用t’檢驗或變量變換或秩和檢驗等方法。
其中要判斷兩總體方差是否相等,就可以用F檢驗。
若是單組設計,必須給出一個標準值或總體均值,同時,提供一組定量的觀測結果,應用t檢驗的前提條件就是該組資料必須服從正態(tài)分布;若是配對設計,每對數據的差值必須服從正態(tài)分布;若是成組設計,個體之間相互獨立,兩組資料均取自正態(tài)分布的總體,并滿足方差齊性。之所以需要這些前提條件,是因為必須在這樣的前提下所計算出的t統(tǒng)計量才服從t分布,而t檢驗正是以t分布作為其理論依據的檢驗方法。數據分析培訓
簡單來說就是實用T檢驗是有條件的,其中之一就是要符合方差齊次性,這點需要F檢驗來驗證。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03