99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù):無意義的顯著性_數(shù)據(jù)分析師
大數(shù)據(jù):無意義的顯著性_數(shù)據(jù)分析師
2014-11-07
收藏
大數(shù)據(jù):無意義的顯著性_數(shù)據(jù)分析師

  IT從來是寂寞的,它沒有鮮亮的外表和跌宕的故事供人消費(fèi)。但借著大數(shù)據(jù)的東風(fēng),IT變得火熱起來。各行各業(yè)都開始用大數(shù)據(jù)告訴你來造句。順著所有公司都是IT公司的邏輯,那么,說什么都是在說大數(shù)據(jù)。

  大數(shù)據(jù)在受到熱捧的同時(shí),受到的批評(píng)也不少。近日,一篇《大數(shù)據(jù)、大安利》的文章總結(jié)了幾點(diǎn)國(guó)外對(duì)大數(shù)據(jù)濫用的批評(píng),原文附錄如下:

  1,無意義的顯著性:沒有理論的大數(shù)據(jù)是皮毛,只看到顯著相關(guān)性,但不經(jīng)檢驗(yàn),沒有理論,這樣的相關(guān)是沒有意義的,或許是虛假。關(guān)鍵是:大數(shù)據(jù)的data point太多,在計(jì)算上找到兩個(gè)矢量的顯著關(guān)系極其容易,但正是因?yàn)閿?shù)據(jù)量大,控制虛假關(guān)系反而更難,這是一個(gè)兩難。我有一篇文章投出去,匿名評(píng)審說:樣本很大,當(dāng)然能找到顯著相關(guān),但是看不出意義。

  2,采樣方法問題:統(tǒng)計(jì)學(xué)家方凱撒總結(jié)了一個(gè)現(xiàn)象,谷歌、facebook等網(wǎng)絡(luò)收集的數(shù)據(jù),往往不具有同質(zhì)性,是在不同的時(shí)間用不同的資源收集,隨后把整個(gè)數(shù)據(jù)合并起來,結(jié)果大數(shù)據(jù)內(nèi)部許多部分的數(shù)據(jù)根本不是用同樣的方法收集的,統(tǒng)計(jì)抽樣的基本假設(shè)都被推翻了。而且網(wǎng)絡(luò)數(shù)據(jù)和線下數(shù)據(jù)的內(nèi)容不一致,比如華爾街郵報(bào)的電子版和紙版就不一樣,而且用戶可以自定義內(nèi)容。

  3,機(jī)器語言不穩(wěn)定:谷歌最開始用關(guān)鍵字預(yù)測(cè)感冒流行地區(qū),開始說比疾控中心預(yù)測(cè)的還準(zhǔn),但后來越來越不準(zhǔn)。有人認(rèn)為這是谷歌的搜索算法在不停地改進(jìn),所以自動(dòng)收集數(shù)據(jù)不穩(wěn)定了。另外機(jī)器語言一旦被誤導(dǎo)會(huì)越錯(cuò)越離譜,比如谷歌翻譯是根據(jù)真實(shí)的文章總結(jié)的,但是有些網(wǎng)絡(luò)的真實(shí)翻譯其實(shí)是谷歌翻的,于是谷歌會(huì)把自己的翻譯基于這些真實(shí)文章上

  當(dāng)企業(yè)提到大數(shù)據(jù)的時(shí)候,往往希望把全部數(shù)據(jù)收集起來,加以分析,這也是理想場(chǎng)景下的大數(shù)據(jù)分析應(yīng)用。但很多時(shí)候,企業(yè)會(huì)受到技術(shù)和成本的掣肘,仍然采用抽樣分析。實(shí)際抽樣中往往需要分層,分層抽樣的情況下,后期統(tǒng)計(jì)運(yùn)算都必須一個(gè)權(quán)重,權(quán)重是和該層被選擇的概率成反比的。一個(gè)分層的權(quán)重高,在分析中就不可忽視。大數(shù)據(jù)的問題是它只能收集到權(quán)重低的數(shù)據(jù)。

  現(xiàn)實(shí)生活中也是這樣,最容易研究的對(duì)象往往最無聊,心理學(xué)經(jīng)常上課找大學(xué)生做實(shí)驗(yàn),所以現(xiàn)在以大學(xué)生為樣本的文章很難發(fā)表了。因此,有時(shí)大數(shù)據(jù)雖然大,卻往往不重要。

  無獨(dú)有偶,《黑天鵝》一書也說到,決定社會(huì)變革的大部分是帕累托分布,并不是鐘形分布,這表面上看來暗合了數(shù)據(jù)越大越不重要的觀點(diǎn)。但實(shí)際上是對(duì)大數(shù)據(jù)的使用者有了更高的要求,怎樣在海量的數(shù)據(jù)里挑選出看似風(fēng)馬牛不相及的變量聯(lián)系在一起得出結(jié)論。

  大數(shù)據(jù)因?yàn)楦拍钏缮?,理論欠缺,被填充進(jìn)了太多的假象。如何結(jié)合具體的應(yīng)用場(chǎng)景,滿足業(yè)務(wù)需求才是企業(yè)內(nèi)大數(shù)據(jù)技術(shù)落地的正確方向。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }