99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀大數(shù)據(jù)引論
大數(shù)據(jù)引論
2014-08-04
收藏
  表面上來看,“大數(shù)據(jù)”概念的火爆可以歸結(jié)到邁爾-舍恩伯格寫的《大數(shù)據(jù)時(shí)代》和涂子沛寫的《大數(shù)據(jù)》。前者引爆了“大數(shù)據(jù)”的概念,并著重從社會變革的角度闡釋了數(shù)據(jù)思維的重要性。后者則更像是一部信息開放史,闡述了信息對于社會發(fā)展的影響程度。
 
  其實(shí),在很大程度上,“大數(shù)據(jù)”更像是一種以迎合方式制造的概念,好似生產(chǎn)中的定制化一樣,數(shù)據(jù)使用單位覺察到數(shù)據(jù)在決策和治理方面的重要性,又不知道該如何表達(dá)與之前的“信息社會”、“商業(yè)智能”等概念的區(qū)隔,“大數(shù)據(jù)”的登場對他們而言可謂是久旱逢甘霖,他鄉(xiāng)遇故知。
 
  客觀來看,這兩位作者都沒有把大數(shù)據(jù)的概念清晰地闡述出來。在這里,之所以強(qiáng)調(diào)概念的重要性并非要教條化,而是出于對目前國內(nèi)各行業(yè)對大數(shù)據(jù)的理解出現(xiàn)了亂象。幾乎所有企業(yè)都握著自己手里那些數(shù)據(jù),躍躍欲試地說要迎接大數(shù)據(jù)時(shí)代。而他們中的大部分尚不知道自己的數(shù)據(jù)成色到底如何,更不知道如何分析與使用。
 
  信息化社會的表征
 
  倫敦大學(xué)社會學(xué)教授韋伯斯特眼中的“信息社會”并非僅僅是信息產(chǎn)量猛增的社會。他認(rèn)為如果把信息從人類社會圖景中抹去的話,并不會有什么與過往社會圖景根本的區(qū)別。韋伯斯特說的并非毫無道理,因?yàn)楫?dāng)我們被各種符號包裹著的時(shí)候,總會希望它們能遠(yuǎn)離自己。
 
  因此,韋伯斯特認(rèn)為“語義“是識別信息社會的重要標(biāo)志,也就是信息本身所承載的意義。在韋伯斯特的眼里,語義是一個(gè)人文詞匯,對于信息的質(zhì)量只能依靠一種精英式的直覺來判斷。比如,鮑德里亞就會認(rèn)為信息變成了無意義的符號,我們最后所面對的不過是一個(gè)符號社會。但是,鮑德里亞所描述的就真的僅僅是消費(fèi)社會而不是意義社會嗎?
 
  2007年在哈佛大學(xué)舉行的“計(jì)算社會科學(xué)”研討會確立了“社會化計(jì)算”的地位。社會化計(jì)算源于社會化軟件的興起,如今,這類計(jì)算是基于社交網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)。用戶之間的聯(lián)系程度,誰和誰的關(guān)系近了多少還是遠(yuǎn)了多少,這是無法在第一時(shí)間用數(shù)據(jù)體現(xiàn)出來的。
 
  社會化計(jì)算的功能就是把我們憑借意識判斷的過程數(shù)據(jù)化,但這一計(jì)算方式并沒有得到更多人的關(guān)注。社會化計(jì)算把韋伯斯特的“語義說”進(jìn)行了科學(xué)量化,從而很好地彌補(bǔ)了人文與科學(xué)的縫隙。毫不夸張地說,信息社會的到來,應(yīng)該是伴隨著社交網(wǎng)絡(luò)的崛起和社會化計(jì)算的應(yīng)用。
 
  從目前我們看到的關(guān)于大數(shù)據(jù)的各種描述,大數(shù)據(jù)與之前數(shù)據(jù)分析的很大不同是對于非結(jié)構(gòu)性數(shù)據(jù)的重視與分析。所謂非結(jié)構(gòu)性數(shù)據(jù),恰恰更多地是以社交網(wǎng)絡(luò)為載體。哈爾濱工業(yè)大學(xué)專門從事社會化計(jì)算研究的丁效告訴筆者,他們小組最近基于社交網(wǎng)絡(luò)上的用戶情緒反應(yīng),做了一個(gè)預(yù)測首周電影票房的模型,準(zhǔn)確率達(dá)到80%。而此前,他和他的導(dǎo)師同樣利用社會化計(jì)算的方式,畫出了一個(gè)新浪微博的消息樹,將信息引爆的路徑用圖形的方式展現(xiàn)了出來。顯然,社會化計(jì)算的預(yù)測功能更加符合人們對于大數(shù)據(jù)的期待。
 
  如果說在社交網(wǎng)絡(luò)崛起之前,所謂的“工業(yè)社會”與“后工業(yè)社會”的區(qū)別是因?yàn)樾畔⒌募ぴ鰧?dǎo)致了社會結(jié)構(gòu)的方方面面出現(xiàn)了巨變,且呈現(xiàn)出了符號化的特征,那么在社交網(wǎng)絡(luò)崛起之后,社會化計(jì)算得以將各種符號背后的意義深度挖掘,尤其是用符號學(xué)無法合理闡釋的因果性在這里變成了網(wǎng)絡(luò)之下的相關(guān)性。進(jìn)一步說,社會化計(jì)算讓信息社會的概念走出了實(shí)質(zhì)性的一步。
 
  大數(shù)據(jù)時(shí)代正是信息社會從“量”走向“質(zhì)”的表征,或者說信息化社會在大數(shù)據(jù)時(shí)代才算是真正到來。
 
  殊途同歸
 
  革命性科學(xué)理念的推廣,往往離不開商業(yè)應(yīng)用,因?yàn)樯虡I(yè)化是實(shí)現(xiàn)技術(shù)閉環(huán)的最有效方式。前文提到的信息社會在大數(shù)據(jù)之前是處于“量”的時(shí)代,這還是一種概括性描述。在局部的商業(yè)領(lǐng)域,數(shù)據(jù)的價(jià)值分析早已經(jīng)在上個(gè)世紀(jì)末展開,那時(shí)人們將其命名為“商業(yè)智能”(BI)。
 
  數(shù)據(jù)分析的職能始終圍繞著“客戶關(guān)系管理”(CRM)搭建模型,主要解決兩個(gè)問題:客戶細(xì)分和預(yù)測。一位在國內(nèi)較早為企業(yè)提供數(shù)據(jù)挖據(jù)和分析的工程師表示,數(shù)據(jù)分析是“商業(yè)智能”規(guī)劃中的一個(gè)部分,大數(shù)據(jù)只不過是豐富了“商業(yè)智能”的主題,也就是“商業(yè)智能”可以較以前做更多的事情了。他認(rèn)為,“大數(shù)據(jù)”有別于之前的數(shù)據(jù)分析,是因?yàn)閿?shù)據(jù)源越來越多,數(shù)據(jù)量越來越大。
 
  除了傳統(tǒng)具有數(shù)據(jù)積累習(xí)慣的行業(yè),比如電信業(yè)、銀行業(yè),當(dāng)下數(shù)據(jù)量的激增更多是基于電子商務(wù)的興起,而目前對數(shù)據(jù)挖掘和分析需求更多的也是電子商務(wù)公司。
 
  這種直接面對客戶端的數(shù)據(jù)挖掘和分析,是企業(yè)最直接用到的。通過對既往消費(fèi)行為的分析,從而劃分客戶群體,做精準(zhǔn)營銷。他們的數(shù)據(jù)依據(jù)是用戶以往行為記錄,也可以說是結(jié)構(gòu)型數(shù)據(jù)。比如某人消費(fèi)了多少次,每次多少錢。那位國內(nèi)較早從事數(shù)據(jù)挖掘的工程師目前就在為淘寶上的幾位大賣家提供第三方的數(shù)據(jù)挖掘服務(wù)。賣家在擁有用戶行為分析的數(shù)據(jù)前提下,可以更加精確地指定品牌推廣計(jì)劃。
 
  數(shù)據(jù)源的擴(kuò)容則是偏向于社交網(wǎng)絡(luò)和未來的物聯(lián)網(wǎng)應(yīng)用,用戶提供非結(jié)構(gòu)型數(shù)據(jù)的入口會越來越多。
 
  為了與社會化計(jì)算相區(qū)別,我們可以將其這種直接面對客戶端的結(jié)構(gòu)型數(shù)據(jù)挖掘稱為傳統(tǒng)的數(shù)據(jù)挖掘。而事實(shí)上,傳統(tǒng)數(shù)據(jù)挖掘和社會化計(jì)算是一個(gè)殊途同歸的過程。最后都要回歸到聚類問題,分類問題,描述性問題,關(guān)聯(lián)問題,序列問題,異常性問題這六大主流問題之中,雖然在過程中的算法各有不同。
 
  大數(shù)據(jù)的目的
 
  大數(shù)據(jù)解決的是心物間隔的問題。
 
  這個(gè)結(jié)論正是由上述的基于客戶的傳統(tǒng)數(shù)據(jù)挖掘和社會化計(jì)算得出。傳統(tǒng)的數(shù)據(jù)挖掘方法是以確定性數(shù)據(jù)為主,假設(shè)了數(shù)字可以準(zhǔn)確地表達(dá)人的需求。比如連續(xù)買了一年這個(gè)牌子的產(chǎn)品,就會假設(shè)這個(gè)用戶是該品牌的忠實(shí)消費(fèi)者。在哲學(xué)上,這是一種物化的體現(xiàn)。
 
  社會化計(jì)算則充分利用了社交圈子中的關(guān)系強(qiáng)弱來預(yù)測用戶的需求,這是更多地利用了表面的相關(guān)性,比如從我對好友說喜歡寶馬車來推測我可能喜歡某個(gè)牌子的手表。這就是邁爾-舍恩伯格說的相關(guān)性。
 
  以Facebook為代表的社交網(wǎng)絡(luò)所形成的數(shù)據(jù)更多指向用戶的內(nèi)心表達(dá),在哲學(xué)上就是“心”的體現(xiàn)。之所以說,后現(xiàn)代經(jīng)濟(jì)較之現(xiàn)代經(jīng)濟(jì)具有了“濕”的特征,正是因?yàn)楹蟋F(xiàn)代經(jīng)濟(jì)中多了很多“心”的要素。大數(shù)據(jù)的哲學(xué)意義正在于此。從這個(gè)角度看阿里巴巴入股新浪微博,可以看做是在打通結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)之間的通路。
 
  Google代表的算法和Facebooke的算法到底有什么不同,哪一個(gè)更能代表未來?Google的算法是基于關(guān)聯(lián)性,比如它的廣告推薦系統(tǒng),就是利用用戶的使用痕跡進(jìn)行精準(zhǔn)推薦。Facebook的算法則是基于關(guān)系圖譜,當(dāng)然最近Facebook認(rèn)識到了關(guān)系的脆弱性,它又開始打造興趣圖譜。這兩種算法的應(yīng)用場景不同,很難說到底哪個(gè)更具備未來性。
 
  定義大數(shù)據(jù)
 
  從廣義來說,大數(shù)據(jù)是一種基于數(shù)據(jù)量越來越大、信息源越來越多而實(shí)現(xiàn)管理智能的思維形態(tài)。從狹義來說,大數(shù)據(jù)就是一種特殊的IT平臺。按照傳統(tǒng)的IT架構(gòu),數(shù)據(jù)處理能力是有上限的。Google在2003年和2004年公布了關(guān)于GFS、MapReduce和BigTable的三篇技術(shù)論文,這也成為后來云計(jì)算發(fā)展的重要基石。隨后,著名的Hadroop基于這三篇論文誕生,其創(chuàng)始人Doug Cutting帶著這項(xiàng)技術(shù)轉(zhuǎn)投Yahoo!,并將其打造成了一個(gè)易于開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺。
 
  這種基于模塊化搭建起來的開源IT架構(gòu),使得數(shù)據(jù)量的處理能力無限上漲。這是大數(shù)據(jù)得以實(shí)現(xiàn)的硬前提。
 
  在思維層面上,大數(shù)據(jù)在三個(gè)方面具有顛覆性的意義:
 
  可視化思維:大數(shù)據(jù)的一個(gè)重要功能就是把抽象問題直觀化,也就是可視化。哲學(xué)在這里是否要發(fā)生一個(gè)質(zhì)變,還不得而知。如果,Google或者百度的神經(jīng)網(wǎng)絡(luò)算法成功的話,也許哲學(xué)就不復(fù)存在了。
 
  數(shù)據(jù)化思維:這也是中國人思維里最缺少的東西,更是中國企業(yè)在大數(shù)據(jù)時(shí)代伊始階段四處抓瞎的原因。
 
  心物合一:這是最高級的問題。主體和客體哪個(gè)更真實(shí)的爭論也許可以到此為止,大數(shù)據(jù)可以利用社會化計(jì)算和行為數(shù)據(jù)分析,得出一個(gè)精準(zhǔn)的結(jié)論。
 
  不過,對于企業(yè)管理者而言,看待大數(shù)據(jù)時(shí)應(yīng)該避免高估數(shù)據(jù)挖掘和低估數(shù)據(jù)挖掘,只要把它作為正常企業(yè)業(yè)務(wù)流程中的一個(gè)重要環(huán)節(jié)即可。
 
  在使用大數(shù)據(jù)時(shí)可以嘗試如下思路:
 
  先判斷數(shù)據(jù)能不能在某個(gè)環(huán)節(jié)產(chǎn)生價(jià)值;規(guī)劃和選擇大數(shù)據(jù)方案;大處著眼,小處著手。切忌在伊始階段就上馬大系統(tǒng),大格局。

 ?。▉碓矗篒T經(jīng)理世界)

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }