
陳宇新:大數(shù)據(jù)下的營銷變革和創(chuàng)新
今天是關(guān)于轉(zhuǎn)型的一天,我印象最深的是早上蔣教授講到,看看外面的霧我們就應(yīng)該知道中國的經(jīng)濟非轉(zhuǎn)型不可了,中國的經(jīng)濟要轉(zhuǎn)型必然就需要依靠我們的營銷,我們的營銷要轉(zhuǎn)型,今天大家也聽到了,每一場都講到了數(shù)據(jù),營銷的轉(zhuǎn)型必然會依靠到我們大數(shù)據(jù)的應(yīng)用,這就是我今天想講的內(nèi)容。大家可能在網(wǎng)上看到,這是經(jīng)常被引用到的圖像,大家為什么會喜歡這個圖像?我琢磨了一下,這個圖像反映了三件事情,首先是非常復(fù)雜,其次是非常曲折,再有就是非常光明,這就像大數(shù)據(jù),有復(fù)雜性,我們的應(yīng)用發(fā)展也會遇到一些挑戰(zhàn),最后給我們帶來的會是一個機遇,隧道的盡頭是光明。
很快的講一下大數(shù)據(jù)的特點,這是老生常談,大家都知道3V,體量巨大、多樣性,從數(shù)字、文本、音頻到視頻等等,我們大數(shù)據(jù)運用要做出實時的反映,是3V的概念。大數(shù)據(jù)到底有多大?給大家稍微提一下,大家都可能知道1GB是多少,我們U盤都是以1GB來做單位的,1000個G是1TB,1000TB是1EB,1000EB是1ZB,大家能不能算一下1個ZB是多少個GB?是1萬億GB的量級,2011年全球的數(shù)量總量是1.8Z,2015年預(yù)計會到8個ZB,到本世紀末是天文數(shù)字,演講結(jié)束的時候我會給大家一個答案,數(shù)據(jù)到了極限是什么情況,我先留個懸念。
什么叫真正的大數(shù)據(jù)運用?真正大數(shù)據(jù)運用一般來說是做到幾百個TB的量級,一些大型的企業(yè),一點小的零售企業(yè)電商都是在幾百個TB的數(shù)據(jù),這樣我們才真的是玩大數(shù)據(jù),大家可以用這個做一個簡單的判斷我們是不是用了大數(shù)據(jù),玩了大數(shù)據(jù)。數(shù)據(jù)形態(tài)有很多變化,真正要玩大數(shù)據(jù)我們要從結(jié)構(gòu)化的,標(biāo)準化的單渠道的數(shù)據(jù)轉(zhuǎn)向非結(jié)構(gòu)化,非標(biāo)準化,多渠道的,多種來源,多種形態(tài),這個大家都知道,大數(shù)據(jù)對營銷的挑戰(zhàn)大家都有所體會,IBM幾年前做過一個調(diào)研,全球首席營銷管調(diào)研,把數(shù)據(jù)爆炸列為五年的挑戰(zhàn),第二大是社交媒體,第三是可選渠道和設(shè)備增加,可選渠道設(shè)備增加數(shù)據(jù)就多了,社交媒體也里帶來的數(shù)據(jù)爆炸。一方面是大一方面是小,一方面我們數(shù)據(jù)越來越多,我們營銷也可以做的越來越細,現(xiàn)在營銷進入了大數(shù)據(jù)微時代,為什么這么說?網(wǎng)絡(luò)和大數(shù)據(jù)的技術(shù)使得我們能夠在個體的顧客層面上做到測量、優(yōu)化和傳播,這個營銷一下子進入了個體層面,一方面是幾百TB的數(shù)據(jù),在這個時代,大數(shù)據(jù)微時代,我們的營銷有哪些特征?當(dāng)然是個體,連續(xù)性,還有一個實時性,互動性,可測性,可試驗性這個講不太多,我們可以通過試驗找到最優(yōu)的解決方案,另外就是基于顧客的行為,而非想法的營銷,我們以前更多問的是想法。最后的還有是對我們的產(chǎn)業(yè)結(jié)構(gòu)會產(chǎn)生很大的影響,數(shù)據(jù)本身有一個積累的正反饋效應(yīng),數(shù)據(jù)越多可以做的越準,做的越準顧客的體驗越好,來的顧客越多我的數(shù)據(jù)越多,數(shù)據(jù)越積越多,顧客也越積越多,這樣就形成了進入的屏障,像阿里、騰訊這樣的企業(yè),美國的谷歌、Facebook,可以把數(shù)據(jù)作為壟斷性的來源,這些企業(yè)就會越做越大,越做越強,以前我們都說大和強是兩種事情,可能是大而不強,現(xiàn)在在大數(shù)據(jù)的時代做大了往往就會做強,大了數(shù)據(jù)多,做的更精準更強。今天演講主要不是講這些,這些都是大家知道的,更加多的想講一下我們現(xiàn)在大數(shù)據(jù)營銷應(yīng)用的現(xiàn)狀,怎么改變這個應(yīng)用的現(xiàn)狀,怎么提高應(yīng)用現(xiàn)狀?在大數(shù)據(jù)時代怎樣改變我們營銷的思維,什么是大數(shù)據(jù)營銷應(yīng)用的現(xiàn)狀呢?第一是說的比投的多,大家都在談很多企業(yè),投的錢比說要少。第二是投的比做的多,我碰到一些很大的企業(yè),投了很多錢搞大數(shù)據(jù)事業(yè)部,一年多下來怎么樣了?他說我等著你來給我做呢,為什么先投呢?有了這個概念之后在股票市場上就會得到追捧,大家說你進入大數(shù)據(jù)了,但是沒有開始做。第三個是開始做了,做的比懂的多,為什么這么做,這樣做有什么好處,具體的回報在什么地方,這是另外一回事。第四個是懂的比賺的多,這也是一個現(xiàn)狀,這些都是負面的,最后給大家一個光明的結(jié)尾,今后賺的可能比你們現(xiàn)在想的要多,現(xiàn)在沒賺到錢,但是數(shù)據(jù)有個溢出效應(yīng),想像錢就這么點可以賺,我給大家舉一些例子,實際上未來會發(fā)現(xiàn)這個利潤往往超出你現(xiàn)在的想像,超出你現(xiàn)在的本業(yè)。
看看大數(shù)據(jù)應(yīng)用的現(xiàn)狀,總結(jié)了一下,大概有這么四層應(yīng)用的境界,頭兩個歸成一個大類,第一個境界是測量的境界,理解Marketing
Metrics,營銷的一些指標(biāo),顧客的滿意度,市場份額等,這是一個很熱門的話題,前任的AMA的主席曾經(jīng)寫過一本暢銷書,這是測量層面,我告訴你這些數(shù)據(jù),但是我并不告訴你該怎么做,我告訴你少了怎么樣,該怎么反映,這是你們管理人或者營銷人自己的事情,但是這也是有用的,我知道這么多信息可以幫助我決策。第二個是統(tǒng)計層面,在上面加了一層,不光我知道顧客滿意度,我還知道這個滿意度大概是怎樣的分布,大概有多少不確定性,多了一點,為什么這兩層是放在一起的,因為這個實際上都是在于總結(jié)過去,或者是描述現(xiàn)在,告訴你過去做的怎么樣,現(xiàn)在是什么狀態(tài),根據(jù)這個做未來的決策,這是頭兩層運用的數(shù)據(jù),大多數(shù)的應(yīng)用數(shù)據(jù)還停留在這兩層,特別是第一層,測的更加準確,得到更多的變量的測量。后面有兩類,預(yù)測和優(yōu)化,這兩類是關(guān)于到未來的,不光是對過去和現(xiàn)代的總結(jié),而且是對未來的描述,對未來的影響,預(yù)測實際上是基于一種對相關(guān)性的理解,但是優(yōu)化相關(guān)性是不夠的,我們要知道因果性,大家可能看過大數(shù)據(jù)的書籍,大數(shù)據(jù)來了因果性不重要,又對又不對,關(guān)鍵是我們做預(yù)測還是優(yōu)化,預(yù)測的意思就是我告訴你明天可能會下雨,但是下了雨怎么辦,這是你的事情,但是這是很有有用的,我知道下雨我知道帶雨衣。優(yōu)化是更高級的,我知道這個雨是怎么形成的,能不能發(fā)各炮彈打掉。一個地方冰激凌的銷量跟那個地方的火災(zāi)數(shù)量是成正比的,根據(jù)火災(zāi)發(fā)生就可以預(yù)測一個地方以后的冰激凌的市場需求是多大,有道理,因為天熱,火災(zāi)容易發(fā)生,大家就愿意吃冰激凌,但是這不能優(yōu)化,不能放火才能增加冰激凌的銷量,什么樣的品牌,什么口味,為什么會選你這樣的冰激凌,怎么樣定價,是一種決策,要知道這個決策的因果性,這里面是兩層不同的境界,更多的我們還是在預(yù)測的境界,所以優(yōu)化的境界這個是最難達到的,但是我覺得是未來肯定要走到的方向。
根據(jù)這些現(xiàn)狀的描述,在今天特別給大家分享一下,我認為怎么樣建立大數(shù)據(jù)時代的思維方式,我們在互聯(lián)網(wǎng)時代講過,怎么樣用互聯(lián)網(wǎng)的方式思維,互聯(lián)網(wǎng)的思想,互聯(lián)網(wǎng)的思考方式,大數(shù)據(jù)的思考方式、思維方式應(yīng)該是怎么樣的?這里面有幾個,一個是定量思維,一切皆可測,雖然說不是一切都可測,但是要抱有這樣的信念。第二個是跨界思維,一切皆可聯(lián),一切都有聯(lián)系,一切發(fā)揮想像力,關(guān)聯(lián)起來。第三個是執(zhí)行思維,一切皆可用,最后我們不是說數(shù)據(jù)放那兒一堆浪費我們的資源,我們要落到實處,執(zhí)行下去,實時做出反映。最后一點很重要,一切皆可試,要有懷疑思維,數(shù)據(jù)來了之后往往有的時候是我們的決策產(chǎn)生更加大的偏差,因為我們所謂的有圖有真相,看了圖之后就這么回事,看了數(shù)據(jù)就覺得這是千真萬確的,我們不做思考了,往往有的時候數(shù)據(jù)也會欺騙我們,所以不能盲目相信數(shù)據(jù),要有一個懷疑試驗的思想。給大家舉幾個例子,什么叫定量思維,一切皆可測。
傳統(tǒng)的營銷數(shù)據(jù)采集做電視收視率調(diào)查、數(shù)據(jù),在現(xiàn)代營銷我們可能就變掉了,以前是這樣測量,現(xiàn)在我們就更加多的采用各種卡,個體層面的測量,這種卡的測量里面如果發(fā)揮我們的想像力我們就會發(fā)現(xiàn),很多時候我們做的還是非常不夠的,給大家舉中外兩個例子,中國我曾經(jīng)跟一個非常大的高端餐飲連鎖企業(yè)打過交道,他們有消費卡。學(xué)問他你消費卡干嘛,他說我們積分,消費金額都記下來了,我說每個消費者點的菜有沒有記下來,變化多端的菜名很難分析所以沒記,我說至少可以把每個在名編個碼記下來,每個客人來了你知道他吃什么東西,可以推薦一下,一切皆可測的思維,要具有這個東西,怎樣盡量測出來。也有一些國外企業(yè)的例子,是非常著名的高端的五星級酒店連鎖,我跟他們聊,他說你們中國比較有意思,酒店都要用身份證登記,中國身份證里面包含了出生地、年齡、性別、生日等等信息,但是我們都不記下來,只要把這個東西掃一下傳到公安局去了,他說我們國際通用的數(shù)據(jù)庫標(biāo)準的格式接受不了中國的身份證代碼,為中國專門弄一套數(shù)據(jù)庫系統(tǒng)要再投資,我們要一筆錢,沒這個錢,這樣就把數(shù)據(jù)浪費掉了,很多時候很多有用的信息我們要想到怎么把它給用上。另外,測量并不在于簡單的信用卡等等,有各種各樣的測量方法,這是眼球的識別儀,貨架上可以裝很多探頭,探頭可以識別人臉的表情,看你對哪個包裝感興趣,復(fù)旦就有剛進來的年輕教授就是這方面的專家,專門研究人臉識別的。還有廣告,我們可以用眼球的測速儀測,還有網(wǎng)上的搜索可以看面部表情,甚至現(xiàn)在有些在做的研究,進商店的時候用紅外線是不是能夠掃描大家的腦子熱成像,看大家是沖動型購物的還是冷靜型購物的,這是生物物理方面的研究,已經(jīng)進行這方面的研究了。另外還有監(jiān)視錄像,這是很有趣的故事,這套系統(tǒng)陸總的萬寶龍以前運用了這個系統(tǒng),使單店的銷售額增加了20%,怎么做法呢?我裝了這些攝像頭,攝像頭可以看人進店的表現(xiàn),有的人應(yīng)該銷售人員上去跟他攀談一下,有些人要慢慢讓他挑,不要打擾他,怎么反映呢?不是每個銷售員都這么有經(jīng)驗,把這個拍下來找有經(jīng)驗的銷售員看,機器學(xué)習(xí)軟件知道怎么應(yīng)對,下次沒有經(jīng)驗的銷售員在店里面我就可以通過手機告訴他這個人應(yīng)該談,這個人應(yīng)該放下,這樣就把一個人的經(jīng)驗變成連鎖店的經(jīng)驗,把銷售額提高了20%,而且不用雇傭這么多有經(jīng)驗的銷售人員了,沒有經(jīng)驗一樣可以看這個事情。這都是大數(shù)據(jù)下的營銷信息獲取,不管是簡單的數(shù)據(jù),視頻、監(jiān)控錄像都可以發(fā)揮很大的作用。定量思維,一切皆可測。
第二個是跨界思維,一切皆可聯(lián)。我們現(xiàn)在最熱門的O2O,這是跨界,比如上網(wǎng)上和網(wǎng)下的跨界,移動和PC端的跨界等等,包括微信、社交網(wǎng)絡(luò)跟電子商務(wù)的跨界,二維碼也是O2O的反映,很多都是通過跨界的應(yīng)用,跨界不光是這樣的,也是可以跨不同的產(chǎn)業(yè),不同數(shù)據(jù)的用途,打個比方,剛才我們講到,傳統(tǒng)的問卷調(diào)查,覺得這沒什么了不起,但是有家企業(yè)大家可能聽說過,SoloMo,14個人的公司做了10幾年,去年被另外一家投資集團給收購了,12億美元的估值,為什么呢?它免費的網(wǎng)上問卷調(diào)查,它10幾年當(dāng)中做了一件很有聰明的事情,把問卷和調(diào)查結(jié)果的答案記下來了,10幾年來積累了4000多萬份問卷,還有上億人對那些問題的回答,這個可以用到各行各業(yè),新產(chǎn)品開發(fā)了,你做的問卷可能不準確,可以跟原先新產(chǎn)品開發(fā)的問卷對比,一對比出來相關(guān)性算出來預(yù)測就準確了,大數(shù)據(jù)的思維是非常不一樣的。一個人回答問題永遠是錯誤的,永遠是相反的,這個人把他說的話反過來就可以了。另外還有很多其他的跨界思維方式,超越了營銷,很有意思的故事,可以啟發(fā)大家的想像力。中國醫(yī)藥界,這一百年來對全球最大的貢獻是下面這個植物,這個植物是青蒿,專門治療瘧疾的,當(dāng)時中國為了抗美援越,越南人得瘧疾,找特效藥,把中國古代中醫(yī)的方子看了一遍,全部試,最后試出了這個東西,這個解救了全世界五百多萬人的生命,被認為是一個世紀以來中國醫(yī)藥最大的成就。上面的東西是害人的,上面那個是礦石,做原子彈的鈾礦,我父親帶領(lǐng)隊伍找的這個礦,在文革期間設(shè)備非常簡陋,沒有那么多錢,怎么辦?中國各個縣都養(yǎng)了很多文史館員,發(fā)動他們讀地方志,讓他們找歷史上的鬼村,把鬼村的地點跟地質(zhì)構(gòu)造帶擬合,這個有可能產(chǎn)生鈾礦,又有可能有鬼村存在,就到那個地方查,用這個辦法很快找到中國最大的鈾礦,滿足原子彈制造的需要,這也是大數(shù)據(jù)跨界的思維,這么多古跡每個都是碎片的,合起來發(fā)現(xiàn)了很大的礦產(chǎn)。這是很好的例子,我們做營銷也是,一個數(shù)據(jù)一擁有,不光是對你的企業(yè)有用,還有可能產(chǎn)生其他的好處。
第三個是執(zhí)行思維,一切皆可用。這個可能比較數(shù)學(xué)化,但是給大家簡單的感覺一下,我們用的最多的像亞馬遜推薦,這都是用協(xié)同過濾算法,這個基本原理很簡單,有六個人,每個人對每本書,四本數(shù)書個分,讀完之后有個評語,打分,5分是好的,4分是差的,兩個人對最后一本書說4分5分,這個人也會覺得書好,推薦給他,這是基本原理,為什么說這是可用性很重要?執(zhí)行思維重要,等你把評語都打上了這個書肯定出來很久了,把這個書讀完才能寫評語,時間過了,改進了一下,不看評語了,光看購買,通過購買之間的相關(guān)性做個推薦,這是個做法,進一步了,怎么算相關(guān)性呢?最科學(xué)的方法是回歸分析,把這個人的數(shù)據(jù)跟其他人做個回歸,做個預(yù)測,這個是科學(xué),但是不可行,為什么?回歸分析大家想想看,亞馬遜有上千萬,上百萬的用戶,做回歸分析有一百多萬人預(yù)測另外一個人,一百萬人做回歸分析,你就要有一個舉正求逆,所以要算到幾個月去了,計算機都算的燒掉了也不一定能算得出來,推薦是什么?我上網(wǎng)即刻實時算給你,這也不行,大數(shù)據(jù)是相關(guān)系數(shù)算法,只是加減乘除,這個筆記快,這個算法沒有科學(xué)性,數(shù)據(jù)上證明不了這個算法是對的。有沒有關(guān)系?沒有關(guān)系,為什么?大數(shù)據(jù)時代我們有個可試驗性,我用這種相關(guān)性求權(quán)重,加權(quán)平均,這個權(quán)重對不對我不管,這批人用這種權(quán)重算法,另外一批人用另外的算法,5分鐘我就知道亞馬遜這樣大的數(shù)據(jù)量哪種權(quán)重好,雖然沒有科學(xué)性,但是我可以很快試驗算法,很快找到最優(yōu)的解決方案,這就是大數(shù)據(jù)時代分析的魅力,不是嚴格,科學(xué)上不嚴格,但是速度很快,很快會找到優(yōu)化的方案,大體邏輯是對的,相關(guān)性高表明這兩個人跟你比較相似,從原理上、感覺上是對的,科學(xué)上證明不了,但是我們可以做試驗把它解決,這是執(zhí)行思維的想法,一切都是從可用的角度出發(fā),不可用的話就不行了。
第四個,懷疑思維,一切皆可試,為什么要懷疑呢?數(shù)據(jù)可能有的時候是欺騙你的眼睛的,數(shù)據(jù)特別多的時候,你覺得有這么多數(shù)據(jù)出來一定很準,往往不一定是這樣,數(shù)據(jù)多不一定全,這是我給一個著名銀行做過的研究,也算是咨詢,銀行里面怎么判斷顧客的價值?一年刷卡金額,刷卡金額高的價值就高,根據(jù)這個來判斷顧客的價值,決定營銷,第一個人要更多獎勵,第二個人也要去做更多的事情,第三個人不用管他了,很差的顧客,明天張教授也會講到管理顧客的組合,有的時候你搞不清顧客真的價值好壞,一般來說銀行就是用這個辦法做的。后來我們就做了咨詢研究,通過大數(shù)據(jù)的方法推算出來,再通過調(diào)研核實了這一點,通過大數(shù)據(jù)方法大家看到了全面的信息,結(jié)合其他的數(shù)據(jù),全面信息是怎么樣的呢?第一個顧客總的年度消費額是5萬多,不光刷你的卡,還刷別人的卡,第二個顧客實際上也是花了5萬多塊錢,你只不過占了他荷包份額的6%,第三個你占它荷包份額90%,這樣就改變了你對顧客的印象,要有一個懷疑的精神,要想想看這個數(shù)據(jù)是不是全,不能盲目說我有數(shù)據(jù),數(shù)據(jù)就是準的,這是需要破除的思維。
另外還有我目前在做的跟北大的幾位同事做的研究,看網(wǎng)上推薦的有效性,在亞馬遜30%的銷量是通過推薦來的,在中國號稱10%的銷量電商是推薦來的,有個問題,我如果不推薦還是不是同樣買這個東西,你覺得要買這個東西我推薦給你,不推薦我買同樣的東西,推薦到底有效性在哪?我們就用了懷疑的態(tài)度,我們用大數(shù)據(jù)試驗,那幾天一半到這個電商來的人我們給他展示本來給他推薦的東西,另一半的人有推薦的東西給他,但是我們算法里面有,知道應(yīng)該推薦什么東西,但是我們故意不推薦,就這么一次,下一次就正常了,我們最終這兩批人,但是是大數(shù)據(jù),差不多有數(shù)十萬人,最終他們用半年多的時間看他們今后的表現(xiàn),最后我們發(fā)現(xiàn)很有趣的現(xiàn)象,那一次的網(wǎng)站訪問屏蔽不屏蔽推薦沒有什么太大的差別,最后的銷量是持平的,更有趣的是什么呢?短期沒有作用,長期有很明顯的作用,半年之后你會發(fā)現(xiàn),這半年之內(nèi)看到推薦的人來的更勤,買的更多,沒有看到那一次推薦的人,以后來的沒有那么勤,買的也沒有那么多了,我們發(fā)現(xiàn),實際上推薦這里的有效性在于增加了你的體驗,我雖然沒有買你推薦的東西,但是不等于說推薦沒有效果,我沒買你的東西,我發(fā)現(xiàn)你推薦的東西都很對我的胃口,說明你的產(chǎn)品品類選擇,你的網(wǎng)站的口味,品位等等跟我相似,我喜歡你,雖然我也買了這個東西,但是這個東西都是我喜歡的,下次我就來的更多,我的忠誠度和黏性就提高了,這個同時改變了推薦軟件提供方的定價方式,本來他們都是每次銷售抽個成,經(jīng)過推薦買了我提成,現(xiàn)在可以考慮什么呢?考慮是不是要收取年費,我沒有買你推薦的東西,但是還是帶來了價值,我可以通過年費的方法把這個東西拿回來,這就是試驗帶來的好處。
這是我跟中歐商學(xué)院的兩位創(chuàng)業(yè)同學(xué)還有幾位老師一起做的研究,關(guān)于微博營銷,我們現(xiàn)在可以實時監(jiān)控微博,你到了靜安寺附近,馬上可以把靜安寺的飯店推薦給你,很快的反映,微博上一旦提到靜安寺或者簽到我們就給你靜安寺的飯店,有個問題是什么呢?到底多快做這個營銷,反應(yīng)速度多快是最優(yōu)的,是不是剛進靜安寺一秒鐘一個消息和評論就來了,您到靜安寺,波特曼酒店很好,我們推薦?;蛘哌^了一天,昨天到了靜安寺,今天要不要到波特曼來,這可能就沒用了。多久有用?5分鐘、30分鐘?60分鐘?我們做試驗,可以隨機選取一些做法,分不同時間,看怎樣介入是最優(yōu)的對顧客的介入,這就是大數(shù)據(jù)帶來的可試驗性,同時也是懷疑的精神,本來他們就感覺一個小時之內(nèi)要反應(yīng)就反應(yīng)了,現(xiàn)在我們把一切定量化了,這就是大數(shù)據(jù)的思維方式。
最后給大家推薦一本書,這本書我非常喜歡,是個著名大數(shù)據(jù)方面的專家寫的,他本來是雅虎研究院的院長,現(xiàn)在是微軟研究院的首席專家,著名學(xué)者,所有的事情都是很顯然,一旦你知道結(jié)果。戰(zhàn)略思考的時候,案例法的戰(zhàn)略思考,數(shù)據(jù)案例思考,這兩者的區(qū)別,案例思考,你成功了總能找到理由,這個做的好那個做的好,這個東西是不是用到下一個企業(yè)能用,只有一個點,說要用數(shù)據(jù)的方法看分析,不要用案例法,也是提倡數(shù)據(jù)思維的東西,非常有意思的。我覺得我們應(yīng)該從3V到3I,3I就是三個結(jié)合,分析與優(yōu)化的結(jié)合,數(shù)據(jù)分析最后我們要落到執(zhí)行,落到優(yōu)化上面,還有是商業(yè)與技術(shù)的結(jié)合,最后我們還是要賺錢的,還有就是數(shù)據(jù)與戰(zhàn)略的結(jié)合,數(shù)據(jù)不能做所有的事情,有的時候在未來很多不確定的情況下我們還是依靠戰(zhàn)略的思考。
我最后說一個好玩的事情,大數(shù)據(jù)的極限在哪?是不是過幾年就是8個Z,100個Z,1萬個Z,大數(shù)據(jù)的極限最后在什么地方呢?在于能源,現(xiàn)在整個IT數(shù)據(jù)行業(yè)已經(jīng)用掉了世界10%的能源了,數(shù)據(jù)是非常耗能的,數(shù)據(jù)的儲存和分析都非常耗能,最后數(shù)據(jù)的極限在于世界的能源,為什么這么說呢?我以前是復(fù)旦物理系畢業(yè)的,物理系有著名的熱力學(xué)定律,世界是越來越混亂的,要使世界有序必須注入能量,大數(shù)據(jù)是使世界變成有序的做法,這么混亂當(dāng)中抽出數(shù)據(jù)分析出來,從混沌走向有序必須注入能量,但是能量是有限度的,我們大數(shù)據(jù)不可能無限增長,到每一步,過去一些舊的沒用的數(shù)據(jù)我們要果斷扔掉,這也是以后一個熱門的學(xué)科,什么數(shù)據(jù)是沒用的我們不該記錄,什么數(shù)據(jù)該記錄,這也是未來的方向。最后作為一點心得給大家分享一下,希望沒有影響到大家的食欲和胃口,謝謝大家。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11