99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀SPSS教程:做多重線性回歸,方差不齊怎么辦
SPSS教程:做多重線性回歸,方差不齊怎么辦
2017-06-20
收藏

SPSS教程:做多重線性回歸,方差不齊怎么辦

一、殘差方差齊性判斷

1. 殘差方差齊性

回顧一下前面介紹過的殘差方差齊性,即殘差ei的大小不隨預(yù)測值水平的變化而變化。我們在進行殘差分析時,可以通過繪制標準化殘差和標準化預(yù)測值的散點圖來進行判斷。若殘差滿足方差齊性,則標準化殘差的散點會在一定區(qū)域內(nèi),圍繞標準化殘差ei=0這條直線的上下兩側(cè)均勻分布,不隨標準化預(yù)測值的變化而變化,如圖1所示。

圖1. 標準化殘差散點圖方差齊性)

2. 殘差方差不齊

但有時殘差不滿足方差齊性的假設(shè),其標準化殘差散點圖顯示,殘差的變異程度隨著變量取值水平的變化而發(fā)生變化,如圖2(a)顯示標準化殘差的分布隨變量取值的增大而呈現(xiàn)擴散趨勢,圖2(b)顯示標準化殘差的分布隨變量取值的增大而呈現(xiàn)收斂趨勢,說明殘差不滿足方差齊性的條件。

圖2. 標準化殘差散點圖方差不齊)

二、加權(quán)最小二乘

在多重線性回歸模型中,我們采用的是普通最小二乘法(Ordinary Least Square,OLS)來對參數(shù)進行估計,即要求每個觀測點的實際值與預(yù)測值之間的殘差平方和最小,對于模型中的每個觀測點是同等看待的,殘差滿足方差齊性的假設(shè)。

但是在有些研究問題中,例如調(diào)查某種疾病的發(fā)病率,以地區(qū)為觀測單位,很顯然地區(qū)人數(shù)越多,所得到的率就越穩(wěn)定,變異程度越小,而地區(qū)人數(shù)越少,所得到的率的變異就越大。在這種情況下,因變量的變異程度會隨著自身數(shù)值或其他變量的變化而變化,殘差不滿足方差齊性的條件。此時如果繼續(xù)采用OLS方法進行模型估計,則擬合結(jié)果就會受到變異程度較大的數(shù)據(jù)的影響,在這種情況下構(gòu)建的回歸模型就會發(fā)生偏差,預(yù)測精度降低,甚至預(yù)測功能失效。

為了解決這一問題,我們可以采用加權(quán)最小二乘法(Weighted Least Squares,WLS)的方法來進行模型估計,即在模型擬合時,根據(jù)數(shù)據(jù)變異程度的大小賦予不同的權(quán)重,對于變異程度較小、測量更精確的數(shù)據(jù)賦予較大的權(quán)重,對于變異程度較大、測量不穩(wěn)定的數(shù)據(jù)賦予較小的權(quán)重,從而使得加權(quán)后回歸直線的殘差平方和最小,保證擬合的模型具有更好的預(yù)測價值。

三、SPSS操作

1. 研究問題

某研究人員擬研究PM2.5濃度與癌癥發(fā)病率之間的關(guān)聯(lián)性,以地區(qū)為觀測單位,收集了40個地區(qū)的癌癥發(fā)病率(/10萬),PM2.5年平均濃度(μg/m3),人口數(shù)量(萬),地區(qū)來源(0=農(nóng)村,1=城市)等信息。(注:數(shù)據(jù)為模擬數(shù)據(jù),不代表真實情況)

2. 判斷殘差是否滿足方差齊性

參考多重線性回歸的SPSS操作步驟,結(jié)果顯示采用普通最小二乘法方法擬合的線性回歸模型具有統(tǒng)計學意義(P<0.001),決定系數(shù)R Square為0.798,PM2.5平均濃度、不同地區(qū)來源(District)和不同人口數(shù)量對癌癥發(fā)病率的影響有統(tǒng)計學顯著性(P<0.05)。

殘差散點圖顯示,標準化殘差的變異程度會隨著標準化預(yù)測值的增大而增大,呈現(xiàn)擴散趨勢,表明殘差不滿足方差齊性的假設(shè)。

3. 權(quán)重估計

根據(jù)專業(yè)知識和經(jīng)驗判斷,人口數(shù)量(Population)可能為導(dǎo)致殘差不滿足方差齊性的一個重要因素,下面對人口數(shù)量進行權(quán)重估計。

(1)選擇Analyze → Regression → Weight Estimation,在Weight Estimation對話框中,將Cancer選入Dependent,將District和PM2.5選入Independent(s)中。

(2)將擬加權(quán)的變量Population選入Weight Variable中,系統(tǒng)將按照1/(權(quán)重變量)的power次冪對每條記錄進行加權(quán)。

(3)Power range用于定義權(quán)重變量的指數(shù),默認為-2~2,步長為0.5,即將擬合指數(shù)分為-2、-1.5、-1、-0.5、0、0.5、1、1.5和2一共構(gòu)建9個方程中,并從中選取效果最佳的一個擬合指數(shù)。本例中標準化殘差隨著標準化預(yù)測值的增大而增大,因此Power range為正值,此處設(shè)定Power range的范圍為0~5,步長為0.5。

(4)點擊Option,選擇Save best weight as new variable,生成一個新的變量用以保存效果最佳的權(quán)重。最后點擊Continue回到Weight Estimation主對話框,點擊OK完成操作。

(5)結(jié)果匯總

Log-Likelihood Values表中輸出了在給定步長下每個指數(shù)值對應(yīng)的對數(shù)似然值,選取對數(shù)似然值最大的一項為最優(yōu)指數(shù),因此本例中最終確定的最優(yōu)指數(shù)值為3,即權(quán)重按照1/population3的函數(shù)關(guān)系來計算權(quán)重。同時系統(tǒng)會在確定最優(yōu)指數(shù)的情況下,自動生成一個名為WGT_1的變量用于保存權(quán)重系數(shù)。

4. 最小二乘法操作

(1)選擇Analyze → Regression → Linear,在Linear Regression對話框中,將Cancer選入Dependent,將District、PM2.5、Population選入Independent(s)中,將新生成的變量Weight for Cancer from WLS(WGT_1)選入WLS Weight中。

(2)點擊Save選項,在Predicted Values和Residuals框下均選擇Unstandardized。最后點擊Continue回到Linear Regression主對話框,點擊OK完成操作。


(3)繪制殘差散點圖

由于在SPSS中使用WLS模型無法直接繪制加權(quán)殘差散點圖,SPSS會給出相應(yīng)的警示(如下圖所示),因此我們需要按照SPSS提示中提供的計算公式,對加權(quán)預(yù)測值和加權(quán)殘差值進行一定的轉(zhuǎn)換,然后再繪制轉(zhuǎn)換后的加權(quán)殘差散點圖

選擇Transform → Compute Variable,利用前幾步操作生成的權(quán)重值(WGT_1)、加權(quán)預(yù)測值(PRE_1)和加權(quán)殘差值(RES_1)來計算生成兩個新變量,即轉(zhuǎn)換的加權(quán)預(yù)測值wgtpred = PRE_1 * sqrt(WGT_1)和轉(zhuǎn)換的加權(quán)殘差值wgtresid = RES_1 * sqrt(WGT_1)。

然后選擇Graphs → Legacy Dialogs → Scatter/Dot → Simple Scatter,將wtgpred選入X Axis,將wtgresid選入Y Axis,點擊OK繪制散點圖

5. 結(jié)果匯總

(1)結(jié)果顯示,采用加權(quán)最小二乘法擬合的線性回歸模型仍具有統(tǒng)計學意義(P<0.001),決定系數(shù)R Square為0.779。由于決定系數(shù)計算方法本身的問題,在加權(quán)線性回歸里會出現(xiàn)一定的偏差,導(dǎo)致加權(quán)方法計算得到的R2往往要小于普通最小二乘法的R2,但這并不代表加權(quán)的模型比普通模型的擬合效果差,兩者不能簡單相比。

(2)模型結(jié)果顯示,PM2.5平均濃度、不同地區(qū)來源(District)和不同人口數(shù)對癌癥發(fā)病率的影響有統(tǒng)計學顯著性(P<0.05),且偏回歸系數(shù)較普通最小二乘法更為穩(wěn)健。

(3)轉(zhuǎn)換后的加權(quán)殘差散點圖顯示,殘差的散點圍繞ei=0這條直線的上下兩側(cè)均勻分布,不隨預(yù)測值的變化而變化,說明經(jīng)過加權(quán)校正后,殘差已滿足方差齊性的條件,達到了加權(quán)校正的目的。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }