99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數據時代【干貨】7類常見的統(tǒng)計分析錯誤
【干貨】7類常見的統(tǒng)計分析錯誤
2025-02-02
收藏

作者:CDA持證人 余治國

一般各平臺出薪資報告,都會哀嚎遍野。舉個例子,去年某招聘平臺發(fā)布《中國女性職場現狀調查報告》,報告中說,從薪酬來看,女性的平均薪酬為8689元/月,與男性的9942元/月相差1253元,報告發(fā)布后,立馬引起網友熱議。

大部分民眾對平均工資、平均年終獎、人均GDP是不買賬的,為什么?這就是犯了統(tǒng)計上濫用平均值的錯誤。

01濫用平均值

問題

  • 對于偏態(tài)數據大多數樣本達不到/或遠超過平均值水平;

  • 平均值沒有代表意義;只看平均值會忽略波動。

原因

  • 平均值的信息量有限;不能告訴你分布形態(tài)和波動;

  • 平均值容易被極端值拉偏;

  • 不同性質的數據被放一起機械的被平均了(需要分層進行分析)。

應對策略

  • 明確平均值使用的前提條件;正確的應用平均值;

  • 除了關注平均值外,還要搞清楚數據的分布形態(tài);

  • 結合其它指標一起分析(如中位數,極差,標準差等)

濫用平均值的其他案例

    1. 專家說,今年全國平均降雨量和去年同期相同,氣候正常。(但專家不告訴你北方大旱南方大澇);
    1. 武漢常年平均溫度17.2°C,昆明常年平均溫度17°C,所以武漢和昆明一樣氣候宜人;
    1. A產品不良率為2%,B產品的不良率為0%;AB兩個產品的平均不良率是1%?
    1. 去年我們一共有50個客訴,平均結案時間是58天,公司規(guī)定的目標是60天內要結案;所以我們的結案很準時。

對于偏態(tài)分布,平均值不等于中位數

某產品壽命服從正態(tài)分布,平均值為10000小時,有50%的產品壽命會大于10000小時。

某產品壽命服從指數分布,平均值為10000小時,只有36.79%的產品壽命會大于10000小時。

計算平均值不要忽略權重

例:已知某產品每個季度的不良率,求全年度平均不良率。

錯誤答案1:(1.25%+1.14%+1.15%+1.05)/4

錯誤答案2:(1.25%*1.14%*1.15%*1.05%)^1/4

正確答案1: (250+240+300+199)/(20000+21000+26000+19000)

正確答案2: (1.25%*20000+1.14%*21000+1.15%*2 6000+1.05%*19000)/ (20000+210000+26000+19000)

02直接拿樣本統(tǒng)計量代替總體參數

問題

  • 直接拿樣本統(tǒng)計量代替總體參數可能會得出錯誤結論。

分析

  • 由于抽樣誤差存在,樣本統(tǒng)計量和總體參數之間通常會存在差異;

  • 樣本均值通常不會剛好等于總體均值,樣本不良率通常不會剛好等于總體不良率

  • 樣本標準差通常不會剛好等于總體標準差……

應對策略

  • 根據樣本來推斷總體時通常需要用到置信區(qū)間或假設檢驗。

案例一

案例二

03樣本量不足

樣本量較小時樣本均值或比率波動較大

QE:你看,7號這天原材料不良率太高了,達到停線標準了!你必須把庫存都退給供應商!

SQE:這幾天使用的原材料都是同一供應商同一批次的,平均不良率為0.13%,質量沒問題!

案例

現象

  • 在美國,腎癌發(fā)生率最低的縣往往位于中西部、南部和西部的農村地區(qū);但腎癌發(fā)生率最高的縣也往往位于中西部、南部和西部的農村地區(qū)。

真實原因

  • 美國中西部、南部、西部的區(qū)域的縣的人數很少,以縣為單位統(tǒng)計腎癌發(fā)生率時樣本量較小,發(fā)生率波動很大。

04p>0.05就接受原假設

案例

20世紀70年代,美國為減少紅燈時汽車在路口等待造成的汽油浪費,決定評估是否允許紅燈時右轉。弗吉尼亞公路與運輸局研究后報告聲稱,允許紅燈右轉后事故發(fā)生率沒有顯著增加(p>0.05)。若干年后研究發(fā)現,允許紅燈右轉后汽車撞毀的頻率比以前提高了20%,行人被撞的頻率比以前提高了60%。

05盲目套用正態(tài)分布

場景

問題

原因

  • 有很多原因導致數據不服從正態(tài)分布;

  • 數據不正態(tài)不等于過程不受控;

  • 數據不正態(tài)不等于數據造假。

應對對策

數據不正態(tài)的常見原因

正態(tài)分布數據過程能力分析

06錯把相關當因果

相關不等于因果,但因果必相關;因果關系是相關關系的子集;相關關系可以為尋找因果關系提供指引和線索;采取改善措施要針對真正的原因來改善,而不是針對相關關系采取措施。

07回歸分析過度外推

錯誤案例

  • 剛出生的嬰兒一個月可以長5cm;如果按這個速度預測,他30歲時可以長到多高?

  • 某公司前年銷量增長了10%;去年增長了10%,今年也增長了10%;你能用這個增長速度去預測它20年后的銷量嗎?

抓住機遇,狠狠提升自己

隨著各行各業(yè)進行數字化轉型,數據分析能力已經成了職場的剛需能力,這也是這兩年CDA數據分析師大火的原因。和領導提建議再說“我感覺”“我覺得”,自己都覺得心虛,如果說“數據分析發(fā)現……”,肯定更有說服力。想在職場精進一步還是要學習數據分析的,統(tǒng)計學、概率論、商業(yè)模型、SQL,Python還是要會一些,能讓你工作效率提升不少。備考CDA數據分析師的過程就是個自我提升的過程。

CDA 考試官方報名入口:https://www.cdaglobal.com/pinggu.html

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數1:配置參數 // 參數2:回調,回調的第一個參數驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式,包括:float,popup width: "280px", https: true // 更多配置參數說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }