99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀大數(shù)據(jù)僅僅是概念__還是有實(shí)用性工具?
大數(shù)據(jù)僅僅是概念__還是有實(shí)用性工具?
2014-09-03
收藏

     從去年開始,進(jìn)入大數(shù)據(jù)時(shí)代,不管是互聯(lián)網(wǎng)行業(yè)還是其他行業(yè),“大數(shù)據(jù)”一詞開始頻繁出現(xiàn)。大數(shù)據(jù)僅僅是概念,還是有實(shí)用性工具?

  “概念”性質(zhì)的東西在中國的互聯(lián)網(wǎng)圈子總是可以快速傳播,這里面有很多原因,其中就有整體氛圍所致:大多數(shù)互聯(lián)網(wǎng)的創(chuàng)業(yè)者都是希望通過前瞻性的 創(chuàng)新來改變世界,受到資本追捧,最終套現(xiàn)。在這個(gè)過程中,概念飛快的傳播、包裝,成為各種打著標(biāo)簽的產(chǎn)品。而實(shí)用主義者只被動(dòng)接受,缺乏正確認(rèn)知深刻的探 索。


  從下圖可以看出,2008年大數(shù)據(jù)概念開始傳播后,在百度和Google的“大數(shù)據(jù)”和“Big Data”的檢索趨勢(shì)(下圖數(shù)據(jù)中Baidu的PV加權(quán)處理,和Google相等同來體現(xiàn)趨勢(shì)對(duì)比):


  大數(shù)據(jù)這詞,百度的中文檢索的爆炸性遠(yuǎn)遠(yuǎn)高出英文的Google檢索。

  這就是硅谷臭名昭著的技術(shù)成熟度曲線(炒作周期),而在國內(nèi)互聯(lián)網(wǎng)行業(yè)被傳承和發(fā)揚(yáng)的更厲害。

  開個(gè)玩笑:“目前的大數(shù)據(jù)在國內(nèi),就好比是一堆青春期的孩子在談?wù)摗靶浴?,每個(gè)人都喜歡談,如果不談就好像自己不正常,但只是很少人真正有經(jīng)驗(yàn)。真正有經(jīng)驗(yàn)的,卻又閉口不言,笑笑而已”。互聯(lián)網(wǎng)行業(yè)發(fā)展迅速,這些孩子早晚都會(huì)成人,但是目前為止,絕大多數(shù)受益者只是那些打著標(biāo)簽的廠商,就好比賣給青春期孩子非法出版物的商販。


大數(shù)據(jù)到底是什么?

  那到底什么是大數(shù)據(jù)呢?大數(shù)據(jù)僅僅是個(gè)概念還是有真正的未來呢?

  首先,所有的數(shù)據(jù)的作用,都是尋找規(guī)律。

  唯物主義辯證法說:世界是物質(zhì)的,物質(zhì)是運(yùn)動(dòng)的,運(yùn)動(dòng)是有規(guī)律的,而規(guī)律是可以掌握的。不管是最早的統(tǒng)計(jì)學(xué),計(jì)算機(jī)出現(xiàn)后的數(shù)據(jù)分析,數(shù)據(jù)挖掘,以及到現(xiàn)在的大數(shù)據(jù)。我們都是在探索世界中的規(guī)律,試圖通過規(guī)律來了解這個(gè)世界。


  在沒有出現(xiàn)計(jì)算機(jī)和互聯(lián)網(wǎng)的時(shí)代,前輩科學(xué)家奠定了數(shù)學(xué)和統(tǒng)計(jì)學(xué)的基礎(chǔ)。計(jì)算機(jī)出現(xiàn)后,對(duì)數(shù)據(jù)的存儲(chǔ)和計(jì)算能力大幅度增加,整理和分析數(shù)據(jù)的能力也在大大增加。而互聯(lián)網(wǎng)的出現(xiàn)和發(fā)展,讓搜集的手段進(jìn)一步豐富,數(shù)據(jù)量大大增加。通過數(shù)據(jù)找規(guī)律的這個(gè)游戲也在不斷的豐富。


  這個(gè)過程,數(shù)據(jù)一方面越來越大,另一方面越來越“小”的,怎么說呢:這個(gè)過程的進(jìn)化可以簡單的說成“對(duì)整體樣本的覆蓋” 和“對(duì)微觀數(shù)據(jù)價(jià)值的發(fā)掘”。數(shù)據(jù)的精髓在于抽樣和模型,因?yàn)榧夹g(shù)手段不可能獲取所有的對(duì)象特征,只能通過部分模擬全部,通過抽象模型來描述對(duì)象。而計(jì)算 機(jī)和互聯(lián)網(wǎng)出現(xiàn)后,對(duì)信息獲取能力,和對(duì)數(shù)據(jù)的分析和挖掘能力大大加強(qiáng),對(duì)試圖探索的樣本覆蓋越來越大,而對(duì)對(duì)象本身的描述越來越細(xì)致。


  好比我們想知道這一車蘋果的質(zhì)量。以前只隨機(jī)抽樣100個(gè),看看外觀有沒有生蟲壞損;現(xiàn)在抽樣7000個(gè),每一個(gè)蘋果用30多項(xiàng)數(shù)據(jù)來描述蘋果特征和質(zhì)量。以后不需要抽樣了100%的都獲取數(shù)據(jù),然后每個(gè)蘋果100多項(xiàng)數(shù)據(jù)描述特征和質(zhì)量,甚至整個(gè)生長周期數(shù)據(jù)。


  但是不管是統(tǒng)計(jì)學(xué),數(shù)據(jù)分析,數(shù)據(jù)挖掘,還是現(xiàn)在的大數(shù)據(jù)。我們的任務(wù)自始至終沒有變化:通過收集、整理、分析數(shù)據(jù)等手段,來尋找規(guī)律、推斷本質(zhì)、甚至預(yù)測(cè)未來。



     不管在任何一個(gè)階段,這個(gè)任務(wù)都是有局限的,我們僅僅可以推測(cè)對(duì)象本質(zhì)的一部分而不是全部。在技術(shù)手段發(fā)展到一定階段可以產(chǎn)生新的技術(shù)和方法論,也可以在推測(cè)和預(yù)測(cè)上更近一步,走出的這一步可以大大提高生產(chǎn)力,這也是大數(shù)據(jù)的價(jià)值所在。


具體的行業(yè)中舉例

  接下來我們選擇一個(gè)更容易抽象舉例的行業(yè)來說明:籃球(NBA)。

  在NBA的早期,由于商業(yè)化程度不夠,對(duì)一場(chǎng)比賽的數(shù)據(jù)統(tǒng)計(jì)非常有限,不管是球員、教練、或者球隊(duì)經(jīng)理對(duì)球員的認(rèn)識(shí)都是在一種直覺上,或是最基礎(chǔ)的一些統(tǒng)計(jì)。


  1986年NBA開始了完整的數(shù)據(jù)統(tǒng)計(jì)。所以現(xiàn)在的新聞都愛用:“自從1986有統(tǒng)計(jì)以來,這是第N個(gè)球員單場(chǎng)打出xxx數(shù)據(jù)……”NBA的統(tǒng)計(jì)正式進(jìn)入了現(xiàn)代,數(shù)據(jù)庫技術(shù)的成功應(yīng)用,讓你可以從www.nba.com 隨意找到歷史數(shù)據(jù)。


  也從這一天起,另一個(gè)話題浮現(xiàn)了。正如我們喜歡把武俠小說人物武藝列高低、列座次,數(shù)據(jù)完整化之后,大量的數(shù)據(jù)引用成了媒體的新愛好。于是, “得分利器”、“防守悍將”、“投籃大師”這些詞匯,逐漸被“每場(chǎng)能得多少分”、“完成多少個(gè)籃板+封蓋”、“投籃命中率”等覆蓋了。所有的球迷都開始喜 歡數(shù)據(jù)了。


  但是只看數(shù)據(jù),又會(huì)很難理解:年輕時(shí)的馬布里,一個(gè)場(chǎng)均20分7.6助攻的人,怎么會(huì)被叫做獨(dú)狼?看數(shù)據(jù),會(huì)難以理解,鮑文這個(gè)數(shù)據(jù)平淡無奇, 搶斷毫不華麗的家伙,防守卻遠(yuǎn)比兩屆搶斷王魔術(shù)師強(qiáng)大得多?又怎么能理解, 斯塔德邁爾職業(yè)生涯場(chǎng)均8.8籃板1.4蓋帽,加內(nèi)特在凱爾特人也就場(chǎng)均8.9籃板1.4蓋帽,但KG的防守和斯塔德邁爾,那就是天壤之別呢?


  實(shí)際上,就是因?yàn)閿?shù)據(jù)太單一,對(duì)球員的微觀數(shù)據(jù)的描述太少,根本無法只用數(shù)據(jù)來描述一個(gè)球員在球場(chǎng)上發(fā)揮的作用或者特點(diǎn)。

  21世紀(jì),細(xì)節(jié)化微觀數(shù)據(jù)越來越多的被融入NBA,專業(yè)的NBA數(shù)據(jù)挖掘公司Synergy Sports出現(xiàn)了?!禨I》披露過一份籃球之神喬丹的專業(yè)統(tǒng)計(jì):公牛80.2%的進(jìn)攻要經(jīng)他之手; 83.9%的投籃是跳投;54.3%的投籃來自于球場(chǎng)右側(cè);17%的進(jìn)攻來自拉開單打;單打時(shí)運(yùn)2.67步后拔起跳投;對(duì)手干擾到位情況下,命中率是 46.3%;等等。


  到了這一地步,數(shù)據(jù)開始進(jìn)入到新的時(shí)代。而今年的NBA季后賽,美國媒體開始把場(chǎng)均奔跑距離,速度,最快速度等等也加入到了分析的維度。新的技術(shù)手段加大了微觀數(shù)據(jù)價(jià)值的發(fā)掘。也許我們可以稱之為:大數(shù)據(jù)。


正確的看待大數(shù)據(jù)

  數(shù)據(jù)的確不會(huì)說謊。但要精準(zhǔn)說明一件事,需要足夠多的數(shù)據(jù),和足夠微觀的挖掘。但數(shù)據(jù),永遠(yuǎn)不會(huì)足夠多。例如籃球比賽,數(shù)據(jù)與感知,會(huì)永遠(yuǎn)的交 織下去。越來越多的數(shù)據(jù)模型,會(huì)給出無限接近印象的結(jié)果;但是當(dāng)數(shù)據(jù)或感知任何一方一統(tǒng)天下時(shí),談?wù)摶@球,也就不復(fù)有樂趣了。而不論對(duì)數(shù)據(jù)多么了解,也需 要教練設(shè)計(jì)戰(zhàn)術(shù)、發(fā)揮球員特定,激勵(lì)團(tuán)隊(duì)士氣,才能贏得比賽,數(shù)據(jù)本身不會(huì)“贏球”。


  大數(shù)據(jù)是一種進(jìn)步,但是我們完全沒有必要神話,更沒有必要妖魔化。大數(shù)據(jù)是一種概念,也只是我們認(rèn)知世界發(fā)展到目前階段順理成章的產(chǎn)物。理智的看待大數(shù)據(jù),讓好的為生產(chǎn)和研究服務(wù),更多的發(fā)揮我們自己的創(chuàng)新性和主觀能動(dòng)性,會(huì)更有價(jià)值。

                                                                                                                                       數(shù)據(jù)分析師

  

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }