99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀用R進行多元線性回歸分析建模

用R進行多元線性回歸分析建模

2018-05-21

用R進行多元線性回歸分析建模

概念：多元回歸分析預測法，是指通過對兩個或兩個以上的自變量與一個因變量的相關分析，建立預測模型進行預測的方法。當自變量與因變量之間存在線性關系時，稱為多元線性回歸分析。
下面我就舉幾個例子來說明一下
例一：謀殺率與哪些因素有關
變量選擇
[plain] view plain copy

    states<-as.data.frame(state.x77[,c('Murder','Population','Illiteracy','Income','Frost')])
    cor(states)#查看變量相關系數(shù)
                   Murder Population Illiteracy     Income      Frost
    Murder      1.0000000 0.3436428 0.7029752 -0.2300776 -0.5388834
    Population 0.3436428 1.0000000 0.1076224 0.2082276 -0.3321525
    Illiteracy 0.7029752 0.1076224 1.0000000 -0.4370752 -0.6719470
    Income     -0.2300776 0.2082276 -0.4370752 1.0000000 0.2262822
    Frost      -0.5388834 -0.3321525 -0.6719470 0.2262822 1.0000000

我們可以明顯的看出謀殺率與人口，文盲率相關性較大

將它們的關系可視化
[plain] view plain copy

    library(car)
    scatterplotMatrix(states,spread=FALSE)

還可以這么看
[plain] view plain copy

    fit<-lm(Murder~Population+Illiteracy+Income+Frost,data = states)
    summary(fit)

    Call:
    lm(formula = Murder ~ Population + Illiteracy + Income + Frost,
        data = states)

    Residuals:
        Min      1Q Median      3Q     Max
    -4.7960 -1.6495 -0.0811 1.4815 7.6210

    Coefficients:
                 Estimate Std. Error t value Pr(>|t|)
    (Intercept) 1.235e+00 3.866e+00   0.319   0.7510
    Population 2.237e-04 9.052e-05   2.471   0.0173 *
    Illiteracy 4.143e+00 8.744e-01   4.738 2.19e-05 ***
    Income      6.442e-05 6.837e-04   0.094   0.9253
    Frost       5.813e-04 1.005e-02   0.058   0.9541
    ---
    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 2.535 on 45 degrees of freedom
    Multiple R-squared: 0.567, Adjusted R-squared: 0.5285
    F-statistic: 14.73 on 4 and 45 DF, p-value: 9.133e-08

還可以這么看
[plain] view plain copy

    #install.packages('leaps')
    library(leaps)
    leaps<-regsubsets(Murder~Population+Illiteracy+Income+Frost,data = states,nbest = 4)
    plot(leaps,scale = 'adjr2')

最大值0.55是只包含人口，文盲率這兩個變量和截距的。
還可以這樣，比較標準回歸系數(shù)的大小
[plain] view plain copy

    zstates<-as.data.frame(scale(states))#scale()標準化
    zfit<-lm(Murder~Population+Illiteracy+Income+Frost,data = zstates)
    coef(zfit)
     (Intercept)    Population    Illiteracy        Income         Frost
    -2.054026e-16 2.705095e-01 6.840496e-01 1.072372e-02 8.185407e-03
通過這幾種方法，我們都可以明顯的看出謀殺率與人口，文盲率相關性較大，與其它因素相關性較小。
回歸診斷
[plain] view plain copy

    > confint(fit)
                        2.5 %       97.5 %
    (Intercept) -6.552191e+00 9.0213182149
    Population   4.136397e-05 0.0004059867
    Illiteracy   2.381799e+00 5.9038743192
    Income      -1.312611e-03 0.0014414600
    Frost       -1.966781e-02 0.0208304170

標記異常值
[plain] view plain copy

    qqPlot(fit,labels = row.names(states),id.method = 'identify',simulate = T)

圖如下，點一下異常值然后點finish就可以了

查看它的實際值11.5與擬合值3.878958，這條數(shù)據(jù)顯然是異常的，可以拋棄
[plain] view plain copy

    > states['Nevada',]
           Murder Population Illiteracy Income Frost
    Nevada   11.5        590        0.5   5149   188
    > fitted(fit)['Nevada']
      Nevada
    3.878958
    > outlierTest(fit)#或直接這么檢測離群點
           rstudent unadjusted p-value Bonferonni p
    Nevada 3.542929         0.00095088     0.047544

car包有多個函數(shù)，可以判斷誤差的獨立性，線性，同方差性
[plain] view plain copy

    library(car)
    durbinWatsonTest(fit)
    crPlots(fit)
    ncvTest(fit)
    spreadLevelPlot(fit)

綜合檢驗
[plain] view plain copy

    #install.packages('gvlma')
    library(gvlma)
    gvmodel<-gvlma(fit);summary(gvmodel)
檢驗多重共線性
根號下vif>2則表明有多重共線性
[plain] view plain copy

    > sqrt(vif(fit))
    Population Illiteracy     Income      Frost
      1.115922   1.471682   1.160096   1.443103

都小于2所以不存在多重共線性
例二：女性身高與體重的關系
[plain] view plain copy

    attach(women)
    plot(height,weight)

通過圖我們可以發(fā)現(xiàn)，用曲線擬合要比直線效果更好

那就試試唄
[plain] view plain copy

    fit<-lm(weight~height+I(height^2))#含平方項
    summary(fit)

    Call:
    lm(formula = weight ~ height + I(height^2))

    Residuals:
         Min       1Q   Median       3Q      Max
    -0.50941 -0.29611 -0.00941 0.28615 0.59706

    Coefficients:
                 Estimate Std. Error t value Pr(>|t|)
    (Intercept) 261.87818   25.19677 10.393 2.36e-07 ***
    height       -7.34832    0.77769 -9.449 6.58e-07 ***
    I(height^2)   0.08306    0.00598 13.891 9.32e-09 ***
    ---
    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 0.3841 on 12 degrees of freedom
    Multiple R-squared: 0.9995,    Adjusted R-squared: 0.9994
    F-statistic: 1.139e+04 on 2 and 12 DF, p-value: < 2.2e-16

效果是很不錯的，可以得出模型為

把擬合曲線加上看看
[plain] view plain copy

    lines(height,fitted(fit))

非常不錯吧

還可以用car包的scatterplot()函數(shù)
[plain] view plain copy

    library(car)
    scatterplot(weight~height,spread=FALSE,pch=19)#19實心圓，spread=FALSE刪除了殘差正負均方根在平滑曲線上
    展開的非對稱信息，聽著就不像人話，你可以改成TRUE看看到底是什么，我反正不明白。

例三：含交互項
[plain] view plain copy

    <strong>attach(mtcars)
    fit<-lm(mpg~hp+wt+hp:wt)
    summary(fit)
    Call:
    lm(formula = mpg ~ hp + wt + hp:wt)

    Residuals:
        Min      1Q Median      3Q     Max
    -3.0632 -1.6491 -0.7362 1.4211 4.5513

    Coefficients:
                Estimate Std. Error t value Pr(>|t|)
    (Intercept) 49.80842    3.60516 13.816 5.01e-14 ***
    hp          -0.12010    0.02470 -4.863 4.04e-05 ***
    wt          -8.21662    1.26971 -6.471 5.20e-07 ***
    hp:wt        0.02785    0.00742   3.753 0.000811 ***
    ---
    Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    Residual standard error: 2.153 on 28 degrees of freedom
    Multiple R-squared: 0.8848,    Adjusted R-squared: 0.8724
    F-statistic: 71.66 on 3 and 28 DF, p-value: 2.981e-13</strong>
其中的hp:wt就是交互項，表示我們假設hp馬力與wt重量有相關關系，通過全部的三個星可以看出響應/因變量mpg（每加侖英里）與預測/自變量都相關，也就是說mpg（每加侖英里）與汽車馬力/重量都相關，且mpg與馬力的關系會根據(jù)車重的不同而不同。

CDA數(shù)據(jù)分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

線性回歸

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇用R語言進行關聯(lián)分析

下一篇數(shù)據(jù)治理應用流程人機共同運轉(zhuǎn)

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

用R進行多元線性回歸分析建模

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

用R進行多元線性回歸分析建模

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...