99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀SPSS缺失值得分析處理
SPSS缺失值得分析處理
2016-12-05
收藏

SPSS缺失值得分析處理

在資料收集的過程中,由于各種原因可能導(dǎo)致數(shù)據(jù)收集不全,就會(huì)產(chǎn)生缺失值,且這種情況往往無(wú)法避免。如果缺失值處理不當(dāng),就會(huì)導(dǎo)致分析結(jié)果精度降低,出現(xiàn)偏倚甚至是錯(cuò)誤的理論,因此缺失值的分析顯得尤為重要。數(shù)據(jù)的缺失經(jīng)常會(huì)存在著一定的規(guī)律,為了認(rèn)識(shí)和研究缺失數(shù)據(jù),按照數(shù)據(jù)缺失形式,我們常將其分為單元缺失與項(xiàng)目缺失兩種。

(1)單元缺失:只針對(duì)需調(diào)查的個(gè)案進(jìn)行調(diào)查而沒有得到個(gè)案信息。如對(duì)整個(gè)班級(jí)進(jìn)行調(diào)查,發(fā)放60分調(diào)查表,部分調(diào)查對(duì)象未交回調(diào)查表導(dǎo)致的資料缺失。這種缺失在數(shù)據(jù)分析階段常常無(wú)能為力。

(2)項(xiàng)目缺失:指在調(diào)查內(nèi)容中某些變量的觀測(cè)結(jié)果有缺失。如對(duì)整個(gè)班級(jí)進(jìn)行調(diào)查后,收回的調(diào)查表中,部分女生因?yàn)椤氨C堋倍刺顚戵w重一項(xiàng),造成資料缺失。

無(wú)論缺失數(shù)據(jù)的形式是單元缺失還是項(xiàng)目缺失,從缺失機(jī)制與方式上又可將其分為完全隨機(jī)缺失、隨機(jī)缺失與非隨機(jī)缺失。

(1)完全隨機(jī)缺失(Missing Completely at Random,MCAR)指已評(píng)價(jià)的結(jié)果或即將要進(jìn)行的評(píng)價(jià)結(jié)果中,研究對(duì)象的缺失率是獨(dú)立的。即缺失現(xiàn)象完全隨機(jī)發(fā)生,與自身或其他變量取值無(wú)關(guān)。如調(diào)查進(jìn)行中,因被調(diào)查對(duì)象接到電話,或緊急事件馬上離開,調(diào)查無(wú)完成導(dǎo)致缺失。

(2)隨機(jī)缺失(Missing at Random,MAR)指缺失數(shù)據(jù)的發(fā)生與數(shù)據(jù)庫(kù)中其他無(wú)缺失變量的取值有關(guān)。某一觀察值缺失的概率僅依賴已有的觀察結(jié)果。比如,研究某新藥對(duì)高血壓患者的療效,但一些血壓過高的患者,根據(jù)納入標(biāo)準(zhǔn)予以排除。MAR是最常見的缺失機(jī)制。

(3)非隨機(jī)缺失(MIssing Not at Random,MNAR)指數(shù)據(jù)的缺失不僅與其他變量的取值有關(guān),缺失率與缺失數(shù)據(jù)有關(guān),也和自身有關(guān)。這種缺失大都不是偶然因素所造成的,常常是不可忽略的,比如在調(diào)查收入時(shí),收入高的人出于各種原因不愿意提供家庭年收入值。對(duì)于MNAR此種缺失機(jī)制,目前尚無(wú)特別有效的方法能進(jìn)行處理。

識(shí)別缺失數(shù)據(jù)的產(chǎn)生機(jī)制是極其重要的,首先這涉及到代表性問題,從統(tǒng)計(jì)上說,非隨機(jī)缺失的數(shù)據(jù)會(huì)產(chǎn)生偏估計(jì),因此不能很好地代表總體。其次,它決定數(shù)據(jù)插補(bǔ)方法的選擇。隨機(jī)缺失數(shù)據(jù)處理相對(duì)比較簡(jiǎn)單,但非隨機(jī)缺失數(shù)據(jù)處理比較困難,原因在于偏差的程度難以把握。

面對(duì)不同的數(shù)據(jù)缺失情況,那我們?cè)撊绾翁幚砟??大致上我們把處理方法歸為以下幾類。

1、刪除缺失值

最常見、最簡(jiǎn)單的處理缺失數(shù)據(jù)的方法,使用這種方法時(shí),如果任何個(gè)案在某一變量含有缺失數(shù)據(jù)的話,就把相對(duì)應(yīng)的個(gè)案從分析中剔除。如果缺失值所占比例較小 的話,這一方法十分有效。然而,這種方法卻有很大的局限性,它是以減少樣本量來(lái)?yè)Q取信息的完備,會(huì)造成資源的大量浪費(fèi),丟棄了大量隱藏在這些對(duì)象中的信息。

2、缺失值代替

即“轉(zhuǎn)換”選項(xiàng)卡中“替換缺失值”菜單過程。此過程將所有的記錄看成一個(gè)序列,然后采用某種指標(biāo)對(duì)缺失值進(jìn)行填充,它實(shí)際上專門用于解決時(shí)間序列模型中的缺失值問題。雖然其中的一些填充方法也可以用于普通數(shù)據(jù),但相比之下,如果在序列數(shù)據(jù)中使用該過程可能得不償失,應(yīng)當(dāng)謹(jǐn)慎使用。常用的填充方式由算術(shù)均數(shù)、缺失值鄰近點(diǎn)的算術(shù)均數(shù)、中位數(shù)以及線性插入等。

3、缺失值分析

此過程是SPSS專門針對(duì)缺失值分析而提供的模塊,他提供了對(duì)缺失值問題全面而強(qiáng)大的分析能力,主要功能有以下3種:

(1)缺失值的描述和快速診斷:用靈活的診斷報(bào)告來(lái)評(píng)估缺失值問題的嚴(yán)重性,用戶可以觀察到它們?cè)谀男┳兞恐谐霈F(xiàn),比例為多少,是否與其他變量取值有關(guān),從而得知這些缺失值出現(xiàn)是否會(huì)影響分析結(jié)論。

(2)得到更精確的統(tǒng)計(jì)量:提供了多種方法用于估計(jì)含缺失值數(shù)據(jù)的均值、相關(guān)矩陣或協(xié)方差矩陣,通過這些方法計(jì)算出的統(tǒng)計(jì)量將更加可靠。

(3)用估計(jì)值替換缺失值:使用EM或回歸法,用戶可以從未缺失數(shù)據(jù)的分布情況中推算出缺失數(shù)據(jù)的估計(jì)值,從而能有效地使用所有數(shù)據(jù)進(jìn)行分析,來(lái)提高統(tǒng)計(jì)結(jié)果的可信度。

在前述的3種缺失機(jī)制中,非隨機(jī)缺失很難得到有效的統(tǒng)計(jì)學(xué)處理,SPSS的缺失值分析模塊主要是對(duì)MCAR和MAR的情形進(jìn)行分析,尤其是后者。


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }