
SPSS生存函數(shù)-Kaplan-Meier
一、Kaplan-Meier生存分析(分析-生存函數(shù)-Kaplan-Meier)
1、概念:在多數(shù)情況下,您都會希望考察兩個事件之間的時間分布,比如雇用時長(員工從雇用到離開公司的時間)。但是,這種數(shù)據(jù)通常包含一些已審查的個案。已審查的個案是沒有記錄其第二次事件的個案(例如,在調(diào)查結(jié)束后仍然為公司工作的員工)。Kaplan-Meier過程是已審查的個案出現(xiàn)時估計時間事件模型的一種方法。Kaplan-Meier模型的依據(jù)是估計事件發(fā)生的每個時間點的條件概率,并取這些概率的乘積限估計每個時間點的生存率。
2、示例。新的AIDS療法在延長壽命方面是否具有治療優(yōu)勢?您可以對兩組AIDS患者進(jìn)行研究,一組接受傳統(tǒng)療法,另一組接受實驗性療法。從數(shù)據(jù)構(gòu)造Kaplan-Meier模型將允許您比較兩組的整體生存率,以確定實驗性療法是否是傳統(tǒng)療法的改進(jìn)。還可以用圖來表示生存或風(fēng)險函數(shù)并對其進(jìn)行直觀比較,以獲得更詳細(xì)的信息。
3、統(tǒng)計量。生存表,包括時間、狀態(tài)、累積生存和標(biāo)準(zhǔn)誤、累積事件和剩余數(shù);以及均值和中位數(shù)生存時間,帶有標(biāo)準(zhǔn)誤和95%置信區(qū)間。圖:生存、風(fēng)險、對數(shù)生存和1減生存。
4、數(shù)據(jù)。時間變量應(yīng)為連續(xù)變量,狀態(tài)變量可以是分類變量或連續(xù)變量,因子和層次變量應(yīng)為分類變量。
5、假設(shè)。所關(guān)心事件的概率應(yīng)只取決于初始事件之后的時間(假設(shè)絕對時間下的概率不變)。即,從不同時間開始研究的個案(比如,從不同時間開始接受治療的患者)應(yīng)有相似的行為。已審查的個案和未審查的個案之間也不應(yīng)存在系統(tǒng)性差別。例如,如果許多已審查的個案都是情況更為嚴(yán)重的患者,則得到的結(jié)果可能會存在偏差。
6、相關(guān)過程。Kaplan-Meier過程使用的計算壽命表的方法估計每個事件發(fā)生時的生存或風(fēng)險函數(shù)?!皦勖怼边^程使用保險精算方法進(jìn)行生存分析,該方法依賴于將觀察期劃分為較小的時間區(qū)間,可能對處理大樣本有用。如果您懷疑變量與要控制的生存時間或變量(協(xié)變量)相關(guān),則應(yīng)使用“Cox回歸”過程。如果同一個個案中協(xié)變量在不同的時間點可以具有不同的值,則應(yīng)使用帶有“依時協(xié)變量”的“Cox回歸”。
二、比較因子水平(分析-生存函數(shù)-Kaplan-Meie-比較因子)
您可以請求統(tǒng)計量以檢驗因子不同水平的生存分布的等同性??捎媒y(tǒng)計量包括對數(shù)秩、Breslow和Tarone-Ware。選擇一個選項指定要進(jìn)行的比較:跨層整體檢驗、分層檢驗、跨層成對檢驗或分層成對檢驗?!?qū)?shù)秩.比較生存分布的等同性的檢驗。在此檢驗中,所有時間點均賦予相同的權(quán)重?!駼reslow.比較生存分布的等同性的檢驗。在每個時間點用帶風(fēng)險的個案數(shù)對時間點加權(quán)?!騎arone-Ware.比較生存分布的等同性的檢驗。在每個時間點用歷險的個案數(shù)的平方根對時間點加權(quán)?!蛟趯由媳容^所有因子水平.在單次檢驗中比較所有因子水平,以檢驗生存曲線的相等性?!蛟趯由铣蓪Ρ容^因子水平.比較每一個相異的因子水平對。不提供成對趨勢檢驗。◎?qū)τ诿繉?對每層的所有因子水平的相等性執(zhí)行一次單獨(dú)的檢驗。如果您沒有分層變量,則不執(zhí)行檢驗?!驗槊繉映蓪Ρ容^因子水平.比較每一層的每一個相異的因子水平對。不提供成對趨勢檢驗。如果您沒有分層變量,則不執(zhí)行檢驗。
因子級別的線性趨勢。允許您檢驗跨因子級別的線性趨勢。此選項僅可用于因子水平的整體(而不是成對)比較。
三、保存(分析-生存函數(shù)-Kaplan-Meie-保存)
您可以將Kaplan-Meier表的信息保存為新變量,新變量可在以后的分析中用于檢驗假設(shè)或檢查假設(shè)。您可以將生存函數(shù)、生存函數(shù)的標(biāo)準(zhǔn)誤、危險函數(shù)和累積事件保存為新變量?!蛏?累積生存概率估計。默認(rèn)變量名為前綴sur_加上順序號。例如,如果已存在sur_1,Kaplan-Meier就分配變量名sur_2?!蛏婧瘮?shù)的標(biāo)準(zhǔn)誤.累積生存估計的標(biāo)準(zhǔn)誤。默認(rèn)變量名為前綴se_加上順序號。例如,如果已存在se_1,Kaplan-Meier就分配變量名se_2。◎危險函數(shù).累積風(fēng)險函數(shù)估計。默認(rèn)變量名為前綴haz_加上順序號。例如,如果已存在haz_1,Kaplan-Meier就分配變量名haz_2。◎累積事件.當(dāng)個案按其生存時間和狀態(tài)代碼進(jìn)行排序時的事件累積頻率。默認(rèn)變量名為前綴cum_加上順序號。例如,如果已存在cum_1,Kaplan-Meier就分配變量名cum_2
四、選項(分析-生存函數(shù)-Kaplan-Meie-選項)
1、統(tǒng)計量。您可以選擇為計算的生存函數(shù)顯示統(tǒng)計量,包括生存分析表、均值和中位數(shù)生存時間以及四分位數(shù)。如果包含因子變量,則會為每組生成單獨(dú)的統(tǒng)計量。
通過圖可以直觀地檢查生存函數(shù)、1減去生存函數(shù)、危險函數(shù)和取生存函數(shù)的對數(shù)。如果包含因子變量,則會為每組繪制函數(shù)圖?!蛏?在線性刻度上顯示累積生存函數(shù)?!?減去生存函數(shù).以線性尺度繪制1減生存函數(shù)。◎危險函數(shù).在線性刻度上顯示累積風(fēng)險函數(shù)?!蛉∩婧瘮?shù)的對數(shù).在對數(shù)刻度上顯示累積生存函數(shù)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11