99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀7個(gè)步驟讓大數(shù)據(jù)開口說(shuō)話
7個(gè)步驟讓大數(shù)據(jù)開口說(shuō)話
2014-09-03
收藏
      “讓大數(shù)據(jù)開口說(shuō)話”,并不是一件容易的事。下面7個(gè)步驟能讓大數(shù)據(jù)開口說(shuō)話,如同人類要想開口說(shuō)話,信息的輸入、儲(chǔ)存、加工、處理,最終把思想以一種合適的方式表達(dá)出來(lái),需要經(jīng)過(guò)一個(gè)復(fù)雜的化學(xué)反應(yīng)過(guò)程。對(duì)計(jì)算機(jī)系統(tǒng)而言,要想讓大數(shù)據(jù)開口說(shuō)話,也要經(jīng)過(guò)一個(gè)復(fù)雜的電子信息處理過(guò)程。在數(shù)據(jù)量呈爆炸式增長(zhǎng),數(shù)據(jù)類型呈多樣化表現(xiàn),數(shù)據(jù)價(jià)值日益受到重視的大數(shù)據(jù)時(shí)代,這個(gè)過(guò)程會(huì)變得更加復(fù)雜,應(yīng)用也會(huì)更加廣泛。
      我們知道,看似或零碎、或雜亂的數(shù)據(jù),要想變成對(duì)企業(yè)業(yè)務(wù)有價(jià)值的決策參考信息或營(yíng)銷建議,需要經(jīng)歷數(shù)據(jù)采集、存儲(chǔ)、處理、加工、管理、監(jiān)控、分析、展現(xiàn)等多道工序。

大數(shù)據(jù)

     大數(shù)據(jù)火熱的時(shí)代,我們來(lái)看看如何一步步讓那些枯燥的大數(shù)據(jù)開始說(shuō)話的。將其歸納為7個(gè)步驟:


第一步:數(shù)據(jù)采集


      把數(shù)據(jù)采集上來(lái),這是首要基礎(chǔ),無(wú)論是網(wǎng)站的用戶訪問(wèn)日志,運(yùn)營(yíng)商網(wǎng)絡(luò)設(shè)備端口信息,銀行的交易記錄,高爐里的溫度數(shù)據(jù)等等,只有采集起來(lái),才有進(jìn)行下一步的可能。東方國(guó)信提供的Dprobe大數(shù)據(jù)采集設(shè)備從網(wǎng)絡(luò)接口采集數(shù)據(jù),可以為運(yùn)營(yíng)商的智能管道應(yīng)用、政府的網(wǎng)絡(luò)安全監(jiān)管等領(lǐng)域?qū)崿F(xiàn)海量數(shù)據(jù)的實(shí)時(shí)采集,通過(guò)硬件加速和軟件相結(jié)合的方式,可以實(shí)現(xiàn)單臺(tái)設(shè)備每秒10G的采集速度,遠(yuǎn)遠(yuǎn)高于傳統(tǒng)x86方案的每秒3G,而且功耗只有1/8,體積只有1/6。


第二步:數(shù)據(jù)存儲(chǔ)


      在硬件層面,根據(jù)不同應(yīng)用環(huán)境對(duì)于計(jì)算能力和存儲(chǔ)能力的不同要求,東方國(guó)信推出了三種大數(shù)據(jù)專用設(shè)備:計(jì)算存儲(chǔ)均衡型、計(jì)算密集型和存儲(chǔ)密集型。比如對(duì)于銀行環(huán)境中身份證掃描圖像這種非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),由于容量大,業(yè)務(wù)流轉(zhuǎn)過(guò)程中也需要在線存取,就需要一種高性比、可擴(kuò)展的方案來(lái)支撐。


第三步:數(shù)據(jù)處理


      今天對(duì)于大數(shù)據(jù)的存儲(chǔ)和處理,一般會(huì)想到使用Hadoop技術(shù)。Hadoop也已發(fā)展成為繼Linux之后最成功的開源軟件之一,成本低廉,擴(kuò)展靈活。但問(wèn)題在于,這種原生于互聯(lián)網(wǎng)生態(tài)環(huán)境中的技術(shù),要想用到傳統(tǒng)企業(yè)計(jì)算環(huán)境,卻并非易事。開源的Hadoop之所以不能直接用于企業(yè)信息系統(tǒng),就在于其需求、服務(wù)、研發(fā)和運(yùn)維體系都不同于互聯(lián)網(wǎng)應(yīng)用,比如訪問(wèn)網(wǎng)頁(yè)時(shí)允許一定程度上的出錯(cuò)和數(shù)據(jù)丟失,但在銀行轉(zhuǎn)帳時(shí)如果出錯(cuò),其后果就可能是災(zāi)難性的了。據(jù)中科院計(jì)算所副研究員查禮博士介紹,要想在企業(yè)環(huán)境中使用Hadoop,必須滿足幾個(gè)條件:兼容關(guān)系模型和SQL語(yǔ)言,完善關(guān)系模型產(chǎn)品與Hadoop“混搭”的架構(gòu),增強(qiáng)系統(tǒng)運(yùn)維和數(shù)據(jù)處理工具,軟硬一體優(yōu)化配置硬件效能,集成開源社區(qū)Hadoop最新版本等。


第四步:數(shù)據(jù)加工

      數(shù)據(jù)加工的關(guān)鍵在于找到數(shù)據(jù)之間的關(guān)聯(lián)性,這些零散的信息關(guān)聯(lián)在一起才能產(chǎn)生價(jià)值。比如在運(yùn)營(yíng)商環(huán)境中的“用戶畫像”,就是把某個(gè)用戶的上網(wǎng)行為數(shù)據(jù)、關(guān)系鏈、交易信息、搜索數(shù)據(jù)等關(guān)聯(lián)在一起,才得以實(shí)現(xiàn),進(jìn)而可以為這個(gè)用戶提供更精準(zhǔn)的個(gè)性能服務(wù)。李云峰談到,東方國(guó)信解決方案的核心點(diǎn)在于通過(guò)云化ETL(提取-轉(zhuǎn)換-加載)平臺(tái)實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一規(guī)范,并可實(shí)現(xiàn)橫向擴(kuò)展,滿足對(duì)PB級(jí)數(shù)據(jù)的加工處理。

      顯然,統(tǒng)一數(shù)據(jù)管理對(duì)于擁有多家子公司、多個(gè)系統(tǒng)的企業(yè)來(lái)說(shuō)更為關(guān)鍵,否則即便是一個(gè)最簡(jiǎn)單的KPI指標(biāo),從不同的系統(tǒng)調(diào)出來(lái)都會(huì)大相徑庭,導(dǎo)致企業(yè)領(lǐng)導(dǎo)無(wú)法決策。通過(guò)ETL工具來(lái)整合這些來(lái)自不同“孤島”系統(tǒng)的數(shù)據(jù),經(jīng)過(guò)轉(zhuǎn)換、清洗等步驟,讓數(shù)據(jù)具備了開口說(shuō)話的能力。

      除了ETL工具,元數(shù)據(jù)管理工具則可以弄清楚數(shù)據(jù)的來(lái)源、含義、類型等,進(jìn)一步提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量平臺(tái)可以實(shí)現(xiàn)全生命周期的質(zhì)量監(jiān)控和審核,保障數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和及時(shí)性。正是通過(guò)數(shù)據(jù)的加工,進(jìn)而讓數(shù)據(jù)建模數(shù)據(jù)分析挖掘成為可能,大數(shù)據(jù)也才能正常說(shuō)話,而不是胡言亂語(yǔ)。
第五步:數(shù)據(jù)分析

      數(shù)據(jù)分析的目的是在海量的數(shù)據(jù)中挖掘出有價(jià)值的信息。李云峰談到,東方國(guó)信的探索式分析工具,可以將幾十億條明細(xì)數(shù)據(jù)用思維導(dǎo)圖的方式進(jìn)行分析,以更直觀的豐富視圖來(lái)展示結(jié)果,從而深入洞察數(shù)據(jù)之間的關(guān)聯(lián)性及潛在影響。在這一方面,東方國(guó)信的首眼點(diǎn)是,速度要快,而且分析的結(jié)果要方便共享,以展現(xiàn)給不同需要的人。至此,大數(shù)據(jù)平臺(tái)已經(jīng)準(zhǔn)備好了要說(shuō)的內(nèi)容了。


第六步:數(shù)據(jù)展現(xiàn)

      數(shù)據(jù)分析出來(lái)的結(jié)果往往會(huì)用于決策參考或輔助營(yíng)銷。東方國(guó)信通過(guò)自助報(bào)表的方式來(lái)構(gòu)建展現(xiàn)過(guò)程,允許業(yè)務(wù)端的用戶在終端對(duì)數(shù)據(jù)進(jìn)行存取和個(gè)性化展現(xiàn),這可以理解為大數(shù)據(jù)說(shuō)話時(shí)非常靈活的表達(dá)方式。其中三個(gè)最典型的應(yīng)用是統(tǒng)計(jì)報(bào)表、即席查詢、OLAP分析,比如按時(shí)間、地域來(lái)關(guān)聯(lián)分析以找到有用的信息。

      當(dāng)然,針對(duì)不同的人,大數(shù)據(jù)要說(shuō)的話也是不一樣的。以東方國(guó)信的一大重要客戶中國(guó)聯(lián)通為例,針對(duì)內(nèi)部的公司高層、分析人員、一線客戶經(jīng)理,以及外部的行業(yè)客戶、咨詢機(jī)構(gòu),大數(shù)據(jù)平臺(tái)所呈現(xiàn)出來(lái)的內(nèi)容也是豐富多彩,各不相同。正是基于東方國(guó)信的個(gè)性化定制工具以及自助報(bào)表,使得大數(shù)據(jù)在中國(guó)聯(lián)通獲得了極為廣泛的實(shí)際應(yīng)用價(jià)值。


第七步:移動(dòng)應(yīng)用


      在移動(dòng)互聯(lián)網(wǎng)時(shí)代,如果能把數(shù)據(jù)分析的結(jié)果推送到手機(jī)或iPad上面,顯然會(huì)進(jìn)一步提高業(yè)務(wù)效率。東方國(guó)信已經(jīng)將自助分析能力擴(kuò)展到了移動(dòng)設(shè)備,方便用戶快速的看到自己喜歡的各種分析圖表。

      比如,中國(guó)聯(lián)通位于各地的一些一線客戶經(jīng)理,可能之前的職業(yè)是幼兒園的老師、護(hù)士,甚至不會(huì)使用EXCEL表,而“掌上營(yíng)銷”這樣一款應(yīng)用,無(wú)疑是為她們配上了一個(gè)“貼身的分析師”,隨時(shí)隨地查看自己客戶的動(dòng)態(tài),根據(jù)分析結(jié)果判斷哪些客戶可能會(huì)流失,哪些客戶需要生日問(wèn)候,從而更快速地采取行動(dòng)。

      可見,“讓大數(shù)據(jù)開口說(shuō)話”,看似簡(jiǎn)單,卻是個(gè)復(fù)雜的系統(tǒng)工程。不同于其他廠商針對(duì)于單一產(chǎn)品的發(fā)力,東方國(guó)信此次推出的是一站式的解決方案,涉及產(chǎn)品眾多。其實(shí)在筆者看來(lái),今天的大數(shù)據(jù)領(lǐng)域并不缺乏技術(shù)層面的創(chuàng)新,市場(chǎng)上已經(jīng)有很多不錯(cuò)的產(chǎn)品或技術(shù)出現(xiàn),但能用好的并不多,真正缺乏的是應(yīng)用層面的創(chuàng)新和落地。東方國(guó)信的大數(shù)據(jù)產(chǎn)品線聚合了很多先進(jìn)的技術(shù),如Hadoop、ARM服務(wù)器、流式計(jì)算、數(shù)據(jù)建模、移動(dòng)計(jì)算等等,但其生命力還在于跟電信、金融等各行業(yè)業(yè)務(wù)實(shí)踐的深度結(jié)合。畢竟,一個(gè)人要想說(shuō)話,光有嘴巴是不行的,還需要耳朵、腦袋……以及源源不斷的信息輸入。大數(shù)據(jù)系統(tǒng)要想發(fā)揮出自身的價(jià)值,實(shí)時(shí)、準(zhǔn)確地說(shuō)得有見地的話,亦然!


                                                                                                                   數(shù)據(jù)分析師

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }