99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀大數(shù)據(jù)的五大誤區(qū)及其破解之道 _數(shù)據(jù)分析師
大數(shù)據(jù)的五大誤區(qū)及其破解之道 _數(shù)據(jù)分析師
2014-11-05
收藏
大數(shù)據(jù)的五大誤區(qū)及其破解之道 


有些人認為,“大數(shù)據(jù)”這一詞匯不過是企業(yè)營銷時的大肆炒作。但即使是那些接受大數(shù)據(jù)概念的人,也需要消除某些大數(shù)據(jù)誤區(qū)。
        全球領(lǐng)先的信息技術(shù)研究和咨詢公司Gartner指出,大肆宣傳大數(shù)據(jù)概念,使企業(yè)在選擇適當(dāng)?shù)男袆臃桨笗r,受到更多困擾,但對消除一些仍存在的誤區(qū)卻毫無幫助。
        例如,80%的數(shù)據(jù)是非結(jié)構(gòu)化的,這是錯誤的;又如高級分析功能只是更復(fù)雜形式的普通分析,分析公司Gartner指出,這也是不正確的。
        Gartner公司在已發(fā)布的兩篇報告《大數(shù)據(jù)對分析功能影響中的主要誤區(qū)》和《大數(shù)據(jù)對信息基礎(chǔ)設(shè)施影響中的主要誤區(qū)》中,集中探討大數(shù)據(jù)對分析功能及信息基礎(chǔ)設(shè)施影響中的相關(guān)誤區(qū),希望展示大數(shù)據(jù)相關(guān)的更多真實情況。以下摘取大數(shù)據(jù)概念的五大誤區(qū)。
誤區(qū)一:在大數(shù)據(jù)技術(shù)部署中,其他人都領(lǐng)先我們

        雖然越來越多的企業(yè)開始關(guān)注大數(shù)據(jù)技術(shù)和服務(wù),Gartner公司測算結(jié)果顯示,73%的企業(yè)正在投入或策劃大數(shù)據(jù)技術(shù),但大多數(shù)企業(yè)才剛剛開始接受這一技術(shù)。
        因此,擔(dān)心競爭對手運用大數(shù)據(jù)技術(shù)快速發(fā)展實在是杞人憂天。實際上,只有13%的受訪企業(yè)真正開始部署大數(shù)據(jù)相關(guān)技術(shù)。
大數(shù)據(jù)的五大誤區(qū)及其破解之道
        Gartner公司表示:“企業(yè)面臨的最大挑戰(zhàn)是怎樣通過大數(shù)據(jù)獲得價值以及怎樣入手部署大數(shù)據(jù)技術(shù)。大多數(shù)企業(yè)在試點階段就遇到困難,因為他們并沒有在業(yè)務(wù)過程或?qū)嶋H用例中運用該技術(shù)?!?br />         Gartner公司的結(jié)論是:你并沒有落后。為實際的任務(wù)制定策略,并與IT及業(yè)務(wù)部門合作。
誤區(qū)二:數(shù)據(jù)量很大,而小缺陷無關(guān)緊要

        有人認為,根據(jù)大數(shù)定律(Law of Large Numbers),獨立的數(shù)據(jù)缺陷無關(guān)緊要,不會影響分析結(jié)果。
        與更小規(guī)模的數(shù)據(jù)集相比,獨立的數(shù)據(jù)缺陷對整個數(shù)據(jù)集的影響的確要小很多,但目前,數(shù)據(jù)量不斷增長,數(shù)據(jù)缺陷與以往相比也越來越多。
        Gartner公司表示:“因此,低質(zhì)量數(shù)據(jù)對整個數(shù)據(jù)集的整體影響仍保持不變。此外,企業(yè)在大數(shù)據(jù)環(huán)境下使用的大部分數(shù)據(jù)來自外部數(shù)據(jù)源,其數(shù)據(jù)結(jié)構(gòu)和來源未知?!?br />         “這意味著數(shù)據(jù)質(zhì)量問題的風(fēng)險比以往更高。因此,在大數(shù)據(jù)部署中,數(shù)據(jù)質(zhì)量實際上更加重要?!?br />         Gartner公司的結(jié)論是:設(shè)計出新的數(shù)據(jù)質(zhì)量管理方式,并選擇數(shù)據(jù)質(zhì)量級別。嚴格遵守數(shù)據(jù)質(zhì)量保障的核心原則。
誤區(qū)三:大數(shù)據(jù)將取代數(shù)據(jù)整合能力

        企業(yè)希望通過讀時模式(Schema on Read)處理信息,使用多個數(shù)據(jù)模型靈活地讀取同一個數(shù)據(jù)源。這種靈活性將幫助最終用戶決定怎樣按需解釋任意數(shù)據(jù)信息,并實現(xiàn)個體用戶數(shù)據(jù)訪問的定制化能力。然而,大多數(shù)用戶實際上使用寫時模式(Schema on Write)。寫時模式下用戶可描述數(shù)據(jù)并制定內(nèi)容,而數(shù)據(jù)完整性也能保持一致。
誤區(qū)四:將數(shù)據(jù)倉庫用于高級分析是毫無意義的

        有些人認為,高級分析功能可使用新的數(shù)據(jù)類型時,部署數(shù)據(jù)倉庫則浪費時間。實際上,大多數(shù)高級分析項目在分析時都使用數(shù)據(jù)倉庫。
        新的數(shù)據(jù)類型還可能需要提煉,使其適于數(shù)據(jù)分析。此外,哪些是相關(guān)數(shù)據(jù)、怎樣聚合數(shù)據(jù)以及必要的數(shù)據(jù)質(zhì)量級別等都需要企業(yè)做出決策。
        Gartner公司的結(jié)論是:盡可能使用數(shù)據(jù)倉庫存儲經(jīng)人工收集檢查的數(shù)據(jù)集,用于高級分析功能。
誤區(qū)五:數(shù)據(jù)湖將取代數(shù)據(jù)倉庫

        數(shù)據(jù)湖解決方案通常被當(dāng)作企業(yè)級平臺銷售,用于分析原生格式下的各種不同的數(shù)據(jù)源。但Gartner公司認為,數(shù)據(jù)湖取代數(shù)據(jù)倉庫,或作為分析基礎(chǔ)設(shè)施中的重要組件是錯誤的觀點。
        與已經(jīng)成型的數(shù)據(jù)倉庫技術(shù)相比,數(shù)據(jù)湖技術(shù)尚未成熟,其功能不夠全面?!?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉庫已具備支持多種用戶群體的能力?!币虼?,企業(yè)無需等待數(shù)據(jù)湖技術(shù)的成熟。
        Gartner公司的結(jié)論是:在現(xiàn)有數(shù)據(jù)倉庫中運用Hadoop數(shù)據(jù)湖技術(shù)。只有在元數(shù)據(jù)管理技術(shù)、工具及培訓(xùn)上投入,才能通過數(shù)據(jù)湖技術(shù)創(chuàng)造業(yè)務(wù)價值。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }