99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀五個(gè)大數(shù)據(jù)執(zhí)行中應(yīng)當(dāng)避免的錯(cuò)誤_數(shù)據(jù)分析師
五個(gè)大數(shù)據(jù)執(zhí)行中應(yīng)當(dāng)避免的錯(cuò)誤_數(shù)據(jù)分析師
2014-12-05
收藏

五個(gè)大數(shù)據(jù)執(zhí)行中應(yīng)當(dāng)避免的錯(cuò)誤_數(shù)據(jù)分析師

近幾年,有些名詞由于使用過度或者是遭到誤解而被認(rèn)為是“大數(shù)據(jù)”。從用谷歌流感趨勢(shì)解析器來預(yù)測(cè)大規(guī)模流感的爆發(fā),到追蹤人們購物的趨勢(shì),從引導(dǎo)消費(fèi)者如何省錢,到制定能夠?qū)Φ讓庸竞蛡€(gè)人產(chǎn)生影響的實(shí)時(shí)交易決策——數(shù)據(jù)已經(jīng)成為今天全球經(jīng)濟(jì)中保持競(jìng)爭(zhēng)力的關(guān)鍵。要想理解產(chǎn)業(yè)大數(shù)據(jù)的意義,以及為什么大數(shù)據(jù)能夠受到如此多的關(guān)注,我們需要將數(shù)據(jù)庫產(chǎn)業(yè)劃分成幾個(gè)部分來分析,這些產(chǎn)業(yè)在我們今天處理和分析數(shù)據(jù)的時(shí)候也為我們帶來了不小的挑戰(zhàn)。

大數(shù)據(jù)

  為了充分了解大數(shù)據(jù)以達(dá)到我寫這篇文章的目的,我會(huì)盡力從一個(gè)幫助公司了解大數(shù)據(jù)對(duì)其有何種意義的公司管理人員的角度,對(duì)大數(shù)據(jù)的定義予以闡明。大數(shù)據(jù)簡單來說就是目前的一代人,他們有處理數(shù)據(jù)庫和科學(xué)技術(shù)的需要以此來滿足數(shù)據(jù)市場(chǎng)的需求。在與高德納公司和其他公司結(jié)成同盟的今天,在談?wù)摂?shù)據(jù)庫的不同時(shí)我聽到過這樣一種解釋:數(shù)量,種類,速度和難度。

  這種數(shù)據(jù)包括復(fù)雜的文章,大容量的視頻和錄音文件,即時(shí)信息和多變的商業(yè)進(jìn)程,這些都需要來自不同渠道的靈活的數(shù)據(jù)綱要。技術(shù)專家意識(shí)到遺留系統(tǒng)和傳統(tǒng)的關(guān)系上的數(shù)據(jù)庫處理系統(tǒng)的解決方案無法控制和處理數(shù)據(jù)的類型,因?yàn)樗鼈兪且砸环N直接趨向商業(yè)結(jié)果的方式呈現(xiàn)的,這時(shí)候問題就來了。這已經(jīng)不再僅僅是儲(chǔ)存信息的問題了。技術(shù)專家和商業(yè)領(lǐng)導(dǎo)者應(yīng)當(dāng)充分利用現(xiàn)有數(shù)據(jù),存取,處理并在實(shí)際中使用它們。為了滿足新的需要,新的使用者現(xiàn)正處于一種必須應(yīng)對(duì)某些挑戰(zhàn)的狀態(tài),因?yàn)殡S著數(shù)據(jù)的不斷增加,新的問題也隨之出現(xiàn)。

  因此,當(dāng)某些企業(yè)想要用大數(shù)據(jù)執(zhí)行某些計(jì)劃但是失敗的時(shí)候,我們最常見的錯(cuò)誤是什么呢?最近的一份調(diào)查顯示在更廣泛的領(lǐng)域內(nèi)超過百分之七十五的大數(shù)據(jù)或者說是IT項(xiàng)目都是不完善的。我們應(yīng)該清楚的看到,在找到最有效的解決方法使大數(shù)據(jù)能夠被充分利用開發(fā)并為我們所用的道路上仍然有許多困難和挑戰(zhàn)。

  讓我們來列舉一部分。

  首先,你沒有充分利用你的數(shù)據(jù)。

  也許,讓很多企業(yè)都不得不面臨大數(shù)據(jù)的挑戰(zhàn)的一個(gè)很明顯的原因,是缺乏一種通過使用大數(shù)據(jù)來推動(dòng)支持決策形成商業(yè)智慧的能力。

  如果一個(gè)線上出版者能夠更好地理解讀者會(huì)在什么時(shí)候以及為什么瀏覽他出版的內(nèi)容并在他的頁面上停留很久,他便能夠根據(jù)現(xiàn)在和未來的瀏覽者的需要對(duì)內(nèi)容進(jìn)行改進(jìn)。在現(xiàn)存的數(shù)據(jù)中,驅(qū)動(dòng)價(jià)值是產(chǎn)業(yè)中最常見的難題之一。雖然眾多的科技產(chǎn)品可以幫助克服這些困難,但是大部分的數(shù)據(jù)庫產(chǎn)品都缺乏快速有效解決的這一問題的能力,因?yàn)樗鼈儧]有進(jìn)行大規(guī)模的數(shù)據(jù)轉(zhuǎn)換,在精確衡量商業(yè)智慧上往往會(huì)制定一些不符合實(shí)際的過高目標(biāo)。

  如果大部分的數(shù)據(jù)庫技術(shù)在一開始的時(shí)候并不了解和滿足數(shù)據(jù)的某些特殊要求,那么它們便需要某種數(shù)據(jù)定義或者是數(shù)據(jù)綱要來減緩項(xiàng)目進(jìn)程。還有要順便提一句,這里描述的都是我在過去的15年來有著愉快的工作經(jīng)歷的IT項(xiàng)目。

  NoSQL關(guān)系型數(shù)據(jù)庫有效地解決了這個(gè)問題。如果執(zhí)行了NoSQL關(guān)系型數(shù)據(jù)庫(通常情況下可以行得通),那么綱要便不再需要了,或者是需要的程度降低了。這是NoSQL關(guān)系型數(shù)據(jù)庫的主要價(jià)值所在,也是在關(guān)系市場(chǎng)上直接增加在使用者的知名度的一個(gè)主要的推動(dòng)力。

  復(fù)雜的數(shù)據(jù)建模,中間層的目標(biāo)規(guī)劃和不斷返工,這些與更早的RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)有諸多聯(lián)系的特點(diǎn),為探索一種新的充分利用大數(shù)據(jù)的方式開辟了一條新路。

第二點(diǎn)是,你已經(jīng)將公司賭在了免費(fèi)軟件上

  通過過去幾年的促銷循環(huán)系統(tǒng),每一個(gè)組織都在考慮有效利用最新最好的解決方案,像Apache和Pig這樣的,都是感覺過去的RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)已經(jīng)過時(shí)而力求創(chuàng)新。事實(shí)的確如此,關(guān)系型數(shù)據(jù)庫本身無法滿足NoSQL數(shù)據(jù)庫能夠達(dá)到的要求。在源頭開放的大數(shù)據(jù)生態(tài)系統(tǒng)中,持續(xù)增長的失敗案例已經(jīng)能夠防止大象試圖飛行—許多公司已經(jīng)感受到了小范圍失敗帶來的損失。

  免費(fèi)軟件運(yùn)動(dòng)已經(jīng)因?yàn)槠洳徽鎸?shí)性而備受批判,主要由哪些抱著不切實(shí)的幻想,守望著自己的產(chǎn)品能夠成為下一個(gè)最暢銷的產(chǎn)品或者只有他們自己可以做到這種程度的這種沒有什么經(jīng)驗(yàn)的軟件開發(fā)者共享。

  產(chǎn)業(yè)在過去的幾十年里已經(jīng)盡力去克服公司軟件中的一些現(xiàn)實(shí)的不穩(wěn)定因素(完整的版本是“你得到的永遠(yuǎn)不會(huì)多于你應(yīng)得的——但是不要忘記后續(xù),如果這看起來太美好而讓人無法相信其真實(shí)性的話……”)

  現(xiàn)實(shí)是大部分的開放源數(shù)據(jù)軟件在滿足公司的需要上都并不可行。大部分的開放源安裝包的存在都是為了吸引那些尋求簡單客戶基礎(chǔ)的網(wǎng)絡(luò)開發(fā)者。這些產(chǎn)品都具有一些很典型的特點(diǎn),不能物盡其用,不安全而且眾所周知它們會(huì)丟失數(shù)據(jù)。是的它們會(huì)丟失數(shù)據(jù),因?yàn)樗鼈冊(cè)谝婚_始被設(shè)計(jì)研發(fā)時(shí),就沒有可以核對(duì)每一個(gè)自主數(shù)據(jù)的處理器。

第三點(diǎn)是,你徹底的放棄了昂貴的遺留下來的數(shù)據(jù)系統(tǒng)

  我相信數(shù)據(jù)倉庫將會(huì)有一個(gè)長遠(yuǎn)的未來。這并不是一個(gè)非常大膽的猜想,但是RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的未來又會(huì)怎樣?當(dāng)然不久之后我們將看不到Oracle數(shù)據(jù)庫的終結(jié)。

  我的數(shù)據(jù)顯示,邏輯型數(shù)據(jù)倉庫(LDW)正在呈上漲趨勢(shì)。一個(gè)倉庫是建于由兩個(gè)或者多個(gè)現(xiàn)實(shí)數(shù)據(jù)庫合成的單一的接入視圖之上的。同樣的原因,產(chǎn)業(yè)未來應(yīng)用的發(fā)展也正在采集使用NoSQL數(shù)據(jù)庫,這便需要一種新的方式來構(gòu)建和儲(chǔ)存數(shù)據(jù)倉庫。使用RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的話,一開始會(huì)很難去駕馭它,反復(fù)做又會(huì)花費(fèi)大量的時(shí)間和金錢。

  一個(gè)邏輯性數(shù)據(jù)倉庫(LDW)擁有一種獨(dú)特的功能,能夠加強(qiáng)幾乎所有來自各種數(shù)據(jù)源的數(shù)據(jù)和索引,并構(gòu)建一種客制化的時(shí)間系統(tǒng),使所有客戶進(jìn)行交易和分析問題成為可能。雖然RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)已經(jīng)成為一種舊的派別,但是放棄現(xiàn)有的數(shù)據(jù)執(zhí)行手段的代價(jià)是非常巨大的。邏輯型數(shù)據(jù)倉庫LDW允許公司在關(guān)于遺留系統(tǒng)的沉沒成本的問題時(shí)可以盡量減少損失,并轉(zhuǎn)向一個(gè)更有效率,更多面的,更有伸縮性的數(shù)據(jù)平臺(tái)。一個(gè)公司的NoSQL關(guān)系型數(shù)據(jù)庫可以成為舊有的RDBMS關(guān)系型數(shù)據(jù)庫管理系統(tǒng)和失敗的用以處理結(jié)構(gòu)性數(shù)據(jù),文件內(nèi)容,檔案和媒體的實(shí)戰(zhàn)項(xiàng)目之間的整合點(diǎn)。這對(duì)過去長期一直與錯(cuò)誤軟件作斗爭(zhēng)的不穩(wěn)定的IT行業(yè)意義重大。

第四點(diǎn)是你不了解你的數(shù)據(jù)

  對(duì)于任何產(chǎn)業(yè)來說,一種進(jìn)化必然會(huì)很快的產(chǎn)生一種知識(shí)代溝:你對(duì)迎面而來的挑戰(zhàn)和解決方法的了解遠(yuǎn)遠(yuǎn)落后于那些在特定企業(yè)中呆過的人。

  一些人認(rèn)為大數(shù)據(jù)產(chǎn)生了一些新的社會(huì)角色的需要。就在最近,我看到了首席數(shù)據(jù)官CDO和數(shù)據(jù)科學(xué)家的出現(xiàn)。很多人嘲笑過將專家?guī)нM(jìn)企業(yè)帶來的成本和需求,但是缺乏正確的專業(yè)知識(shí)的企業(yè)是無法理解自己的數(shù)據(jù)的,這意味著,他們也就不會(huì)知道最好的使用自身數(shù)據(jù)的方法。據(jù)高德納公司預(yù)測(cè),到2015年全球百分之二十五的大型企業(yè)都將聘請(qǐng)首席數(shù)據(jù)官CDO。

  但是坦白說,你們真的不需要數(shù)據(jù)科學(xué)家,你們需要的是更好的軟件。

第五點(diǎn)是你總是貪得無厭

  也許在你突襲進(jìn)入大數(shù)據(jù)領(lǐng)域中最容易避開的錯(cuò)誤就是不要吸收太多的數(shù)據(jù)。大部分情況下,科技方面的原因?qū)е铝诉@種現(xiàn)象的出現(xiàn)。奇怪的是,從大數(shù)據(jù)的角度處理整個(gè)公司的事情基本上是不可能的,那么為什么不從最底層開始,逐漸積累成功的經(jīng)驗(yàn)從而使項(xiàng)目一點(diǎn)一點(diǎn)發(fā)展起來呢?使用靈活的科學(xué)技術(shù),像公司中的 NoSQL關(guān)系型數(shù)據(jù)庫。迭代數(shù)據(jù)倉庫的發(fā)展會(huì)很快出現(xiàn),同時(shí)能夠減少重復(fù)作業(yè)和預(yù)付工程成本。

  曾經(jīng)有一段時(shí)間,以能力為基礎(chǔ)的公司成功的帶著所有的可用數(shù)據(jù)快速果斷地實(shí)現(xiàn)了轉(zhuǎn)移,若要增加每一個(gè)公司的競(jìng)爭(zhēng)優(yōu)勢(shì)其壓力也是十分大的。太多企業(yè)吸收過多自身無法成功處理的數(shù)據(jù)。有一種錯(cuò)誤的觀念是,所有的大數(shù)據(jù)問題在某種程度上都可以一起解決,就像一個(gè)需要唯一解決辦法的集成問題一樣。帶著游戲總會(huì)結(jié)束的思想,IT管理者和主要的信息人員應(yīng)當(dāng)問清楚自己嘗試去施加影響的商業(yè)決策到底是什么樣的,而不是一味考慮怎樣把新技術(shù)和舊有技術(shù)融為一體。能否獲得正確的答案將直接決定一切數(shù)據(jù)項(xiàng)目的成敗。

  團(tuán)隊(duì)?wèi)?yīng)從小處著眼,快速的縮小比例,并能夠適應(yīng)擺在面前相關(guān)的模式和解決方法將會(huì)有利于使未來的項(xiàng)目不超出預(yù)算并按時(shí)完成,最重要的一點(diǎn)是,達(dá)到預(yù)期的結(jié)果。

  無論你正在處理的是金融數(shù)據(jù),特定的保健數(shù)據(jù)和購物分析還是出版工作和政府情報(bào),這些數(shù)據(jù)的一致性就在于他們的多變性,復(fù)雜性和多樣化以及它們不斷增加的數(shù)量和需求。要想以一種驅(qū)動(dòng)商業(yè)價(jià)值的方式來處理大量的不斷匯集的數(shù)據(jù),企業(yè)必須要明白眾多大數(shù)據(jù)項(xiàng)目失敗的原因,從而避免已經(jīng)出現(xiàn)過的錯(cuò)誤導(dǎo)致的失敗。知道不應(yīng)該做什么和知道應(yīng)該做什么同樣重要,有了這些基本的知識(shí),企業(yè)才能快速實(shí)現(xiàn)他們短期和長期的各種目標(biāo)。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }