99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù)應(yīng)用:大數(shù)據(jù)就是非相關(guān)數(shù)據(jù)的相關(guān)性
大數(shù)據(jù)應(yīng)用:大數(shù)據(jù)就是非相關(guān)數(shù)據(jù)的相關(guān)性
2014-11-01
收藏

     導(dǎo)讀:大數(shù)據(jù)的意義在于從海量的數(shù)據(jù)里尋找出一定的相關(guān)性,然后推演出行為方式的可能性。從這個(gè)角度來看,很多人所談的大數(shù)據(jù)是相關(guān)數(shù)據(jù)的優(yōu)化和整理概念,壓根不是一回事

  對(duì)大數(shù)據(jù)我不是專家,但由于大數(shù)據(jù)也是開放性的命題,所以我也就自己的認(rèn)知水平,談?wù)勎覍?duì)大數(shù)據(jù)的看法,更多集中在數(shù)據(jù)的金融應(yīng)用上。

第一節(jié) 什么是大數(shù)據(jù)

  一、大數(shù)據(jù)并非新事物

  早在1980 年,著名未來學(xué)家阿爾文· 托夫勒就在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮”。不過,直到2009 年前后,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。2013 年,隨著互聯(lián)網(wǎng)金融的空前熱門,也才真正意義上將“大數(shù)據(jù)”推到了高潮。

  如果探究互聯(lián)網(wǎng)金融與大數(shù)據(jù)流行之間的關(guān)聯(lián),背后有一個(gè)很關(guān)鍵的因素,就是互聯(lián)網(wǎng)金融一直無法解答一個(gè)核心命題——風(fēng)險(xiǎn)控制。即互聯(lián)網(wǎng)沒有找到比傳統(tǒng)金融更具優(yōu)勢(shì)的風(fēng)控方法,從而使得互聯(lián)網(wǎng)金融在興起的過程中飽受質(zhì)疑。

  而橫空出世的大數(shù)據(jù)成為了互聯(lián)網(wǎng)金融支持者的一個(gè)重要精神支柱。大數(shù)據(jù)越不可測(cè),就越具備想象力,對(duì)互聯(lián)網(wǎng)金融而言,就越具解釋力。

  那么什么是大數(shù)據(jù)呢?我談?wù)勛约旱目捶ā?br />
  大概四五年前,美國(guó)《商業(yè)周刊》資深作家約翰·伯恩一本暢銷書《藍(lán)血十杰》,對(duì)今天中國(guó)互聯(lián)網(wǎng)金融和大數(shù)據(jù)理論愛好者們產(chǎn)生了極大的影響。這本書講述了十個(gè)年輕人,出身名校哈佛,心懷理想,是天才中的天才。他們二戰(zhàn)期間成為了美國(guó)空軍的后勤英雄,卓有成效地將數(shù)字化管理模式應(yīng)用于戰(zhàn)爭(zhēng),為盟軍節(jié)約了十億美元的耗費(fèi),幫助盟軍取得了勝利。

  這說明數(shù)據(jù)的分析和管理,很早就被用于國(guó)家戰(zhàn)爭(zhēng)和商業(yè)運(yùn)營(yíng)了,為什么現(xiàn)在非要在數(shù)據(jù)前面加個(gè)“大”字呢?

  上次在鴻儒論道,聽社科院何帆教授的課程,他提到,從本質(zhì)上講一切的社會(huì)現(xiàn)象都是統(tǒng)計(jì)現(xiàn)象,并不像實(shí)驗(yàn)室里的試驗(yàn)?zāi)菢佑忻鞔_的因果關(guān)系。如經(jīng)濟(jì)學(xué)的供求定理就是一個(gè)統(tǒng)計(jì)規(guī)律。但是人類認(rèn)知能力中最差的也是統(tǒng)計(jì)思維。

  諾貝爾獎(jiǎng)得主、心理學(xué)家卡尼曼曾經(jīng)講過,人類頭腦中有兩套思維。一套思維是本能的,比如我們的語言能力、模仿能力、第六感,等等,都是與生俱來的。如麻省理工學(xué)院的語言學(xué)家喬姆斯基指出,小孩子為什么到3 歲就能學(xué)會(huì)說話,而要到十幾歲才能學(xué)會(huì)微積分呢?語言學(xué)得這么快,不是小孩子自己能學(xué)會(huì)的,是他出生時(shí)大腦中就預(yù)裝了一套系統(tǒng)。

  此外,察言觀色的能力也不用特意學(xué)或教,小孩子就已經(jīng)會(huì)了。所以這是人類的第一套系統(tǒng),也是能夠讓我們快速反應(yīng)的系統(tǒng)。第二套系統(tǒng),是當(dāng)我們做數(shù)學(xué)推理,尤其是統(tǒng)計(jì)分析時(shí)需要用到的。第二套系統(tǒng)運(yùn)轉(zhuǎn)很慢,因?yàn)檎嫉膬?nèi)存太大,往往我們犯錯(cuò)誤就是因?yàn)闆Q策太快,在統(tǒng)計(jì)判斷的方面出現(xiàn)問題。

  所以,我們?cè)谡劥髷?shù)據(jù)的時(shí)候,都認(rèn)為是個(gè)新潮的概念,但是作為方法論而言,大數(shù)據(jù)已經(jīng)有很長(zhǎng)的歷史了。那為什么現(xiàn)在大家突然講大數(shù)據(jù)了呢?主要是因?yàn)楝F(xiàn)在的數(shù)據(jù)越來越多,一方面隨著IT 革命,存儲(chǔ)和計(jì)算能力在不斷提高,未來可能會(huì)出現(xiàn)無限存儲(chǔ)、瞬間計(jì)算的新時(shí)代;另一方面,能夠被數(shù)據(jù)化的東西也越來越多,過去只有數(shù)字,而會(huì)計(jì)制度出來后,經(jīng)濟(jì)活動(dòng)開始可以通過記賬數(shù)據(jù)化。

  現(xiàn)在大家拿的pad 和電子閱讀器中的文字、圖像也是數(shù)字化的。隨著能夠變成數(shù)據(jù)的東西越來越多,計(jì)算和處理數(shù)據(jù)的能力越來越強(qiáng),大家突然發(fā)現(xiàn)這個(gè)東西很有意思。一旦把統(tǒng)計(jì)學(xué)和現(xiàn)在大規(guī)模的數(shù)據(jù)融合在一起,就會(huì)顛覆很多我們?cè)瓉淼乃季S。

  二、大數(shù)據(jù)就是非相關(guān)數(shù)據(jù)的相關(guān)性

  現(xiàn)在大數(shù)據(jù)被說得神乎其神的一個(gè)重要原因,是普遍認(rèn)為大數(shù)據(jù)可以有效推演和設(shè)定未來的走向,極為精準(zhǔn)地推斷某些事件出現(xiàn)的概率,體現(xiàn)在金融業(yè)里,就是可以很好地控制風(fēng)險(xiǎn)。那么,真的如此嗎?

  寫于1942 年的科幻小說《銀河帝國(guó)》,就講述了在銀河帝國(guó)最繁榮的時(shí)候,國(guó)內(nèi)最有才華的數(shù)學(xué)家謝頓說他能夠預(yù)知未來歷史的變化以及潛在的危機(jī),只要數(shù)據(jù)量足夠大。當(dāng)時(shí)的人口已經(jīng)是上萬億,足夠他準(zhǔn)確預(yù)測(cè)未來的變化。

  所以,謝頓悄悄建了一個(gè)“基地組織”,還有“第二基地組織”。當(dāng)出現(xiàn)所謂的“謝頓危機(jī)”時(shí)候,大家就把他事先錄好的錄像調(diào)出來,他在錄像里會(huì)闡述已經(jīng)預(yù)測(cè)到的此次危機(jī)及其99% 的可能性,并告知人們要怎么做。

  書里的謝頓教授首先是個(gè)數(shù)學(xué)家,同時(shí)也是個(gè)心理學(xué)家。他從上千兆的社會(huì)民眾中進(jìn)行行為心理學(xué)的樣本分析,來推斷社會(huì)的演變。他把各種偶發(fā)性因素都設(shè)立了變量的幅度范圍,一旦出現(xiàn)異變就予以撲殺,以使社會(huì)回歸到設(shè)定的進(jìn)程去。

  他也做了一些基本的定義,這些定義都隱含了一個(gè)社會(huì)假設(shè),那就是“作為研究對(duì)象的人類,總數(shù)必須達(dá)到足以用統(tǒng)計(jì)的方法來加以處理,還有一個(gè)必要的假設(shè)是群體中必須沒有人知道本身已是心理分析的樣本,如此才能確保所有的反應(yīng)都是真正的隨機(jī)”。

  可以看出,大數(shù)據(jù)的意義在于從海量的數(shù)據(jù)里尋找出一定的相關(guān)性,然后推演出行為方式的可能性。從這個(gè)角度來看,很多人所談的大數(shù)據(jù)是相關(guān)數(shù)據(jù)的優(yōu)化和整理概念,壓根不是一回事。

  何謂非相關(guān)數(shù)據(jù)的相關(guān)性?比如說公共衛(wèi)生領(lǐng)域,研究傳染病是很難的,因?yàn)榘l(fā)病快,病人馬上就死了,很難像癌癥那樣去研究它的病理學(xué)是什么。那最后是怎么發(fā)現(xiàn)傳染方式的呢?以霍亂為例,實(shí)際上就是有兩張地圖,一張是得霍亂病人的分布圖,另外一張是倫敦市水井的分布圖,最后發(fā)現(xiàn)兩張圖之間有一些聯(lián)系規(guī)律,所以覺得可能跟飲水有關(guān)。

  在科學(xué)不發(fā)達(dá)的過去,我們是通過水井跟霍亂這兩種非相關(guān)數(shù)據(jù)的分布尋找到了相關(guān)性,雖然不知道為什么,也無法解釋,但是卻能做出較好的防范。這種非相關(guān)數(shù)據(jù)的相關(guān)性是偶然發(fā)現(xiàn)的,并非刻意尋找的結(jié)果。

  原因在于,過去沒有數(shù)據(jù)匯集技術(shù),導(dǎo)致數(shù)據(jù)量太少,根本無法對(duì)非相關(guān)數(shù)據(jù)進(jìn)行集中比對(duì)。另外一方面也是因?yàn)閿?shù)據(jù)的處理能力有限,即使數(shù)據(jù)匯集了,也無法有效進(jìn)行數(shù)據(jù)處理,要找出各種數(shù)據(jù)的相關(guān)性的手段極為有限。

  所以,過去的數(shù)據(jù)挖掘也好,數(shù)據(jù)分析也罷,更多還是對(duì)帶有相關(guān)性的數(shù)據(jù)的整理和分析,事前都是有邏輯作為基礎(chǔ)的。包括《藍(lán)血十杰》里面的行為,也包括阿里金融的所謂大數(shù)據(jù)風(fēng)控等,本身就是可推導(dǎo)的數(shù)據(jù),在此之上進(jìn)行概率計(jì)算。如果這些都定義為大數(shù)據(jù),那么大數(shù)據(jù)就不是什么新概念。要講大數(shù)據(jù),必然是海量的不同維度數(shù)據(jù)的相關(guān)性分析,對(duì)于本身具備相關(guān)性的數(shù)據(jù),頂多稱為數(shù)據(jù)優(yōu)化罷了。

  我自己覺得,大數(shù)據(jù)的出現(xiàn)更多是基于兩個(gè)方面:第一是互聯(lián)網(wǎng)使得數(shù)據(jù)產(chǎn)生量大大增加,有了現(xiàn)實(shí)的不同數(shù)據(jù)的比對(duì)和處理的可能性;第二是計(jì)算能力大幅度提高,原先單一的中央式計(jì)算方式變成了以云計(jì)算特征分布式計(jì)算方式,使得處理能力海量增加,最終可以把統(tǒng)計(jì)學(xué)和現(xiàn)在大規(guī)模的數(shù)據(jù)融合在一起,從而發(fā)現(xiàn)很多有意思的事情。

  一方面是發(fā)現(xiàn)了很多有相關(guān)性的事件,但是不知道為什么相關(guān);另外一方面是發(fā)現(xiàn)很多原先認(rèn)為是沒有關(guān)聯(lián)的事情,原來內(nèi)在都是有聯(lián)系的。最終可以成為我們決策的依據(jù),大大提升我們的管理效率或者處理事情的能力,也極大地顛覆我們?cè)瓉淼乃季S。

  我曾開玩笑說,我們最早的大數(shù)據(jù)思維是什么呢?是周易衍生出來的命理學(xué)派,絕對(duì)是大數(shù)據(jù)的思維。你算個(gè)卦,然后說某個(gè)人晚上死,他就死了。兩者沒有任何的關(guān)系啊,但是從統(tǒng)計(jì)結(jié)果來看,往往就是準(zhǔn)確率極高。是什么維持了兩者相關(guān),很多時(shí)候有因果關(guān)系,很多時(shí)候無因果關(guān)系,當(dāng)然也可能是還不知道的無法驗(yàn)證的因果關(guān)系。

  我在《支付革命》里提出過,少扯大數(shù)據(jù),多談小數(shù)據(jù)。為什么呢?因?yàn)榇髷?shù)據(jù)要盡量收集更多的非相關(guān)數(shù)據(jù),來計(jì)算其相關(guān)性,必然帶有極大的成本和結(jié)果的不確定性。成本大,是因?yàn)閿?shù)據(jù)收集成本和整理成本都很高;結(jié)果不確定,是因?yàn)槎际欠窍嚓P(guān)數(shù)據(jù),你之前是很難確定這些數(shù)據(jù)的相關(guān)性的,需要不斷碰撞和測(cè)試,不但耗費(fèi)成本,而且很可能窮盡之后發(fā)現(xiàn),這些數(shù)據(jù)真的是不相關(guān),所以投入和產(chǎn)出就經(jīng)常極不對(duì)稱。

  上次碰到惠普的副總裁提大數(shù)據(jù)的概念,他說,按照他們的理解,全球有能力進(jìn)行所謂大數(shù)據(jù)應(yīng)用的公司不會(huì)超過50 家,我自己的推測(cè)也差不多。很多公司即使可以用大數(shù)據(jù),往往所獲得的收益也根本不足以覆蓋巨額的成本。我在一次峰會(huì)上聽到很多P2P 公司在說,它們可以通過業(yè)務(wù)沉淀出極大的數(shù)據(jù),然后用大數(shù)據(jù)技術(shù)來提高風(fēng)控質(zhì)量。這叫啥?叫典型的無知者無畏。

第二節(jié) 大數(shù)據(jù)與“黑天鵝”事件

  一、大數(shù)據(jù)的相關(guān)性基礎(chǔ)條件

  “一句話,即便在大數(shù)據(jù)時(shí)代,種種‘黑天鵝’事件也仍然是沒有辦法被準(zhǔn)確預(yù)測(cè)到的。因?yàn)樗懈鶕?jù)過去的理論數(shù)據(jù)模型進(jìn)行的假設(shè)都無法準(zhǔn)確推演未來,它們不過是為了未來某個(gè)黑天鵝做著準(zhǔn)備。”

  大數(shù)據(jù)涉及海量非相關(guān)數(shù)據(jù)的相關(guān)性的統(tǒng)計(jì),其相關(guān)性的存在基礎(chǔ)又是什么呢?非相關(guān)數(shù)據(jù),很多時(shí)候兩者的相關(guān)性是真相關(guān),也可能是偽相關(guān)。需要注意,這種相關(guān)性要成為可推演的行為邏輯,首要前提就是確保這種相關(guān)性的基礎(chǔ)是恒定不變的。

  再以前文霍亂與水質(zhì)關(guān)系為例,這里存在一個(gè)基礎(chǔ)前提,就是霍亂弧菌在水中存活時(shí)間較長(zhǎng),有些菌株還可以在水中越冬。所以一次污染后有可能使水體較長(zhǎng)時(shí)間保持傳播能力。而且,當(dāng)水棲動(dòng)物被污染后,霍亂弧菌有可能在其體內(nèi)存活較長(zhǎng)的時(shí)間,繼續(xù)污染水體。所以,經(jīng)水傳播的特點(diǎn)是呈現(xiàn)暴發(fā)狀態(tài)。如果這個(gè)霍亂弧菌不是通過水傳播了,那這種相關(guān)性就消失了。

  因此,我們要注意和警惕的是,大數(shù)據(jù)并非是一個(gè)萬能的事物,它的缺陷在于立足于統(tǒng)計(jì)學(xué)基礎(chǔ)之上,必然是會(huì)因?yàn)榻y(tǒng)計(jì)樣本的變化而發(fā)生變化的。尤其在適用于人群分析的時(shí)候。

  拿前面的《銀河帝國(guó)》來舉例,把社會(huì)公民作為樣本來進(jìn)行分析,通過過去的樣本行為,得出未來的可能結(jié)論。這里的理論基礎(chǔ)是,在人群的社會(huì)性特征不發(fā)生改變的情況下,作為社會(huì)構(gòu)成的絕大部分人,思考問題的方式不會(huì)有太大的差異,行為邏輯也是相對(duì)固定的。如果是將一個(gè)人特列出來,可能很有個(gè)性,但當(dāng)人口樣本數(shù)量足夠大時(shí),就會(huì)發(fā)現(xiàn)其實(shí)每個(gè)人都是一模一樣的。

  但是要注意,這個(gè)理論成立的核心前提是,社會(huì)性特征要保持不變。因?yàn)橹挥性谙鄬?duì)穩(wěn)定的基礎(chǔ)性環(huán)境里,被列為樣本分析的群體才會(huì)是一致行為邏輯。在基礎(chǔ)性環(huán)境發(fā)生變化的情況下,人的行為跟過去必然是不同的。

  一個(gè)簡(jiǎn)單的推論是,如果一個(gè)人未來做的事情跟過去一致,那么這個(gè)社會(huì)必然是不發(fā)展的。因?yàn)榧词褂腥俗龀隽藙?chuàng)新性突破,但是當(dāng)社會(huì)多數(shù)群體都拒絕創(chuàng)新使用的話,社會(huì)還是停滯的。

  因此,在一個(gè)發(fā)展的社會(huì)里,社會(huì)群體必然是不斷改變其行為模式的。而一旦行為模式改變,所有過去的數(shù)據(jù)積累所構(gòu)建的相關(guān)性都會(huì)消失,因?yàn)槿藗儾辉侔凑者^去的生活習(xí)慣進(jìn)行生活了。

  當(dāng)然很多人會(huì)說,社會(huì)前進(jìn),必然使得數(shù)據(jù)也是前進(jìn)的,所以還是可以用新的數(shù)據(jù)來推斷未來。這里的悖論在于,由于大數(shù)據(jù)的核心是通過分析過去而判斷未來,隱含的前提條件必然是未來跟過去的基礎(chǔ)性特征一致。而且,數(shù)據(jù)由于需要海量積累,匹配處理后的推論結(jié)果永遠(yuǎn)是慢于社會(huì)前進(jìn)的步伐的。

  二、過去能否決定未來

  所以,問題的焦點(diǎn)在于,過去是否一定能決定未來?如果大數(shù)據(jù)無法解答這個(gè)命題,那么它必然在很多領(lǐng)域是失效的。

  我們先看一個(gè)簡(jiǎn)單的堆沙子的實(shí)驗(yàn)。在海邊堆沙子,無論你怎么堆積,必然是要倒塌的,問題在于什么時(shí)候倒塌?通過數(shù)學(xué)模型一直無法測(cè)算出精確的結(jié)果,也就是無法計(jì)算出到第幾粒沙子的時(shí)候,沙堆就會(huì)倒。這里如果用過去決定未來的邏輯進(jìn)行推演,第1 粒沙子沒倒,第2 粒沒倒,第3 粒沒倒……第1000 粒也沒倒,我們可否有效認(rèn)定,第1001 粒就不會(huì)倒了呢?事實(shí)上,過去的每粒沙子的往上堆積,都是在為最后一粒沙子的倒塌做準(zhǔn)備。

  過去幾年的金融危機(jī)告訴我們,原來的經(jīng)濟(jì)學(xué)、金融學(xué)理論都存在巨大缺陷。按照傳統(tǒng)的標(biāo)準(zhǔn)正態(tài)分布狀的金融學(xué)模型,2008 年的金融危機(jī)大概250 億年才會(huì)爆發(fā)一次,地球都沒有那么長(zhǎng)的壽命,怎么就讓我們趕上了呢?為什么打開新聞,遇到了50年不遇的旱災(zāi),100 年不遇的水災(zāi),歷史上從來沒有過的霧霾天氣,等等,怎么都讓我們趕上了呢?這種黑天鵝事件即使在大數(shù)據(jù)時(shí)代,也仍然是沒有辦法預(yù)測(cè)的,因?yàn)檫@些數(shù)據(jù)都是為了未來某個(gè)黑天鵝事件做的準(zhǔn)備。

  在《黑天鵝》這本書里面,有一句非常好的話:“你不知道的事情比你知道的事情更重要?!痹谝郧埃芏鄸|西我們沒有辦法把它數(shù)據(jù)化,也沒有辦法把它預(yù)測(cè)出來。但現(xiàn)在,數(shù)據(jù)足夠多,它會(huì)給你一種幻覺,讓人覺得能找到看得見、摸得著的規(guī)律,讓人們覺得有足夠的能力把握未來。但往往在人們過于自信的時(shí)候,會(huì)犯更大的錯(cuò)誤。到目前為止,越是大的系統(tǒng)性危機(jī),人們?cè)绞譄o策。

  美國(guó)金融危機(jī)爆發(fā)后,美聯(lián)儲(chǔ)前主席格林斯潘到美國(guó)國(guó)會(huì)去作證,他說,“我發(fā)現(xiàn)了一個(gè)缺陷,但我不知道它有多么嚴(yán)重,也不知道它會(huì)持續(xù)多久,這件事情使我深感苦惱?!庇幸粋€(gè)國(guó)會(huì)議員馬上打斷他,說:“格林斯潘先生,你的意思是不是說你根本不知道為什么會(huì)發(fā)生這次金融危機(jī)?”格林斯潘說:“是的,因?yàn)樵谶^去40 多年甚至更長(zhǎng)的時(shí)間里,我都有非常雄辯的證據(jù)證明我的做法會(huì)如愿以償?!边@么大一場(chǎng)危機(jī)到來了,美聯(lián)儲(chǔ)的掌舵人卻不知道為什么會(huì)發(fā)生金融危機(jī)!

  所以在未來,真正需要我們高度警惕的是,即使你有了大數(shù)據(jù),也沒有辦法完全知道系統(tǒng)性的風(fēng)險(xiǎn)和危機(jī),例如“黑天鵝”事件。

  事實(shí)上,人類歷史的場(chǎng)合中,黑天鵝事件的層出不窮,已經(jīng)是被驗(yàn)證的定論,社會(huì)的每一次技術(shù)突破,其實(shí)就是黑天鵝事件。也就是說,黑天鵝事件,本來就是人類自我創(chuàng)造和努力的結(jié)果。

  牛頓莫名其妙地被蘋果砸了頭,創(chuàng)造引力理論,然后極大地改變了社會(huì)的發(fā)展邏輯,使得人類呈現(xiàn)不同的生活方式,從而使得過去所有既定的規(guī)則都發(fā)生了變化,而事實(shí)上,人類社會(huì)已經(jīng)表現(xiàn)出了加速進(jìn)化的趨勢(shì),這個(gè)趨勢(shì)還在加速過程之中,技術(shù)的迭代更新更加迅猛,最終使得過去決定未來的可能性越來越小。

  從秦朝到清朝的上千年時(shí)間里,事實(shí)上人類生活是沒有發(fā)生太大改變的,都是日出而作、日落而息的農(nóng)耕主導(dǎo)型社會(huì),而大工業(yè)革命之后的社會(huì),以及電氣化時(shí)代的來臨,加速了社會(huì)進(jìn)化過程,時(shí)代周期的縮短已然是個(gè)趨勢(shì),幾千年的時(shí)代周期立刻壓縮為十年為單位的周期,甚至更短,因此使得人類的生活方式更呈現(xiàn)出差異化和偶然性。

  過去決定未來,是無法反映出時(shí)代進(jìn)步和調(diào)整的可能性的。過去所做的推斷,永遠(yuǎn)只代表了過去那個(gè)階段為止的最高極限,本身是不會(huì)自我演化和發(fā)展的。

  很多年前,我寫人工智能的文章,就提出過一個(gè)假象的理論模型,倒是跟大數(shù)據(jù)有點(diǎn)類似。因?yàn)樗械那疤岫际墙⒃诋?dāng)時(shí)的極限值上,所有的推演變化其實(shí)都在過去的科技水平之上,所以,人工智能永遠(yuǎn)只能達(dá)到生產(chǎn)者那個(gè)階段的智力水平,它本身無法改變這個(gè)局限而實(shí)現(xiàn)自我進(jìn)化。這必然決定了它要依附在生產(chǎn)制造它的群體的進(jìn)化之上,只有如此,它才可能繼續(xù)進(jìn)化。

  這里也可以提下,其實(shí)從人生歷史上看,還有一條進(jìn)化之路,其實(shí)是通過相互對(duì)抗而不斷進(jìn)化,對(duì)抗性的存在其實(shí)也是進(jìn)化的基礎(chǔ)。人類的進(jìn)化就是通過不斷消滅別的物種的過程來實(shí)現(xiàn)的,這就可以得出這樣一個(gè)結(jié)論,如果把競(jìng)爭(zhēng)對(duì)手都搞死了,其實(shí)我們也失去了進(jìn)化的可能性。

  三、信號(hào)與噪音

  一個(gè)數(shù)據(jù)分析師寫過一本書叫《信號(hào)與噪音》,其中講到真正的信號(hào)是有用的信息,還有很多沒用的信號(hào)是干擾決策的噪音?!拔覀兛傆X得信息量越大,能夠得到的真理就越多。其實(shí)不是的,信息增長(zhǎng)的速度要遠(yuǎn)遠(yuǎn)快于真理增長(zhǎng)的速度?!彼圆灰詾槟愕臄?shù)據(jù)越多,就能離真理越近,有時(shí)候信息越多,噪音越多,反而干擾決策。換句話說,知識(shí)的邊際收益是遞減的。

  因此,在“過去決定未來”的這個(gè)邏輯上,需要明確幾個(gè)方面:一、經(jīng)濟(jì)生活加速,技術(shù)革命隨時(shí)到來的情況下,穩(wěn)定期限到底能維持多久;二、判斷主體的前提是主體不知道自己被作為樣本;三、社會(huì)生活中,穩(wěn)定的群體是誰?不穩(wěn)定的群體是誰?穩(wěn)定的群體更容易被樣本化而呈現(xiàn)可推演性。不穩(wěn)定的個(gè)人意志往往改變社會(huì),腦殘和精英主導(dǎo)了社會(huì)的前進(jìn);四、人會(huì)因?yàn)槲磥矶淖冞^去的可能性到底有多大?

  在投資領(lǐng)域,我引用雪球網(wǎng)友給我的文章做的評(píng)論里的一段話做個(gè)附文,感覺寫得很不錯(cuò)。

  他將統(tǒng)計(jì)學(xué)運(yùn)用到投資領(lǐng)域,大數(shù)據(jù)理論還延伸出不少著名的投資理論和投資實(shí)踐。

  比如施洛斯的低估值投資方法,便是提高投資成功率的真知灼見之一。沃爾特· 施洛斯認(rèn)為,投資是一件簡(jiǎn)約的事情,長(zhǎng)期投資= 正確決定( 低估值+ 成長(zhǎng)性)+ 時(shí)間。

  總而言之,學(xué)會(huì)用概率統(tǒng)計(jì)思維和非線性復(fù)雜性思維進(jìn)行思考,對(duì)投資是有好處的。有的行業(yè)更加穩(wěn)定,變化緩慢,投資預(yù)測(cè)時(shí)更容易有確定性,這也是傳統(tǒng)投資大師最喜歡的行業(yè)。而有些行業(yè)則更加不可預(yù)測(cè),適用非線性物理學(xué)的能量法則,而非概率統(tǒng)計(jì)的正態(tài)分布。

  《醉漢的腳步——隨機(jī)性如何主宰我們的生活》里提到:“如果電影票房按正態(tài)分布,那大多數(shù)電影賺到的錢都該落在某個(gè)平均值附近,有三分之二的電影票房,將落在這個(gè)平均值周圍一個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)。但在電影業(yè)中,20% 的電影帶來了80% 的票房收入。這類由熱點(diǎn)驅(qū)動(dòng)的產(chǎn)業(yè),盡管完全無法預(yù)測(cè),卻遵循了一個(gè)完全不同的分布,其中均值和標(biāo)準(zhǔn)差的概念毫無意義?!?這些對(duì)于我們的投資有哪些啟示呢?

  1. 投資于變化緩慢或者容易預(yù)測(cè)的行業(yè),也就是更加符合正態(tài)分布的行業(yè),避開高科技、娛樂、文化等非正態(tài)分布的行業(yè)?!逗谔禊Z》一書提出的反脆弱性,是另外一種思路,也可以借鑒。

  2. 即使是對(duì)于非正態(tài)分布的行業(yè),基于低估值的大數(shù)法則也有用武之地。例如獅門影業(yè)就是典型,它只專注于小成本的幾個(gè)細(xì)分市場(chǎng),例如恐怖片、禁忌片等,每次電影制作成本都很低,虧了問題不大,但若有幾個(gè)成為blockbuster,它就賺大了。至于航運(yùn)企業(yè),那些活得久的老家伙都很保守,只在低迷時(shí)期造船,也是類似的道理。

  銀行業(yè)其實(shí)不是好行業(yè),不具備《黑天鵝》作者所述的反脆弱性。老巴投資的富國(guó)銀行是唯一的例外,它最保守。如果比爾·米勒明白這個(gè)道理,他就不會(huì)抄底雷曼了。

  在比爾·米勒看來,“護(hù)城河”最寬的地方就是20 世紀(jì)30 年代大蕭條,“難道我應(yīng)該在假設(shè)中設(shè)置一項(xiàng),‘假設(shè)有朝一日我們回到奴隸制’么?”

  比爾·米勒如果真正明白了他號(hào)稱經(jīng)常研究的混沌理論、非線性動(dòng)力學(xué)、復(fù)雜性理論,他就應(yīng)該對(duì)金融業(yè)的黑天鵝有深刻認(rèn)識(shí),從而遠(yuǎn)遠(yuǎn)避開這個(gè)行業(yè)的公司,除非是富國(guó)銀行這個(gè)少有的奇葩。但他貪圖便宜抄底雷曼,是典型的知行不一。

  3. 即使有上述兩條,還是要明白,最關(guān)鍵的是運(yùn)氣,大勢(shì)勝于一切。適者生存,適應(yīng)的是環(huán)境,環(huán)境變了,勝者也會(huì)變化。所以,要時(shí)刻關(guān)注假設(shè)和前提的變化,關(guān)注規(guī)則的變化,關(guān)注邊緣地帶。因?yàn)閯?chuàng)新都來自于邊緣地帶,要關(guān)注顛覆式創(chuàng)新。那么如何才能發(fā)現(xiàn)邊緣地帶?必須不斷學(xué)習(xí),時(shí)刻否定自己,學(xué)會(huì)擁抱變化。

  《周邊視野——探測(cè)引發(fā)公司成敗的弱信號(hào)》里提到,金寶湯公司(Campbell Soup)的前任營(yíng)銷總監(jiān)梅爾基奧雷說:“我所見過的成功人士所做的最重要的一件事,就是他們把每一天都當(dāng)作全新的一天去體驗(yàn)和學(xué)習(xí)。我拋開所有以前的想法,當(dāng)作自己一無所知地去體驗(yàn)每一天。讓人們失敗的真正原因是,是他們確信自己已經(jīng)知曉如何做事,每天只是花費(fèi)時(shí)間來驗(yàn)證他們的觀點(diǎn)而已。我從來不認(rèn)為我已經(jīng)掌握了全部答案。我經(jīng)常會(huì)把人們的怪異想法作為參考,比如,如果我們使用卡車來運(yùn)送玉米餅或者水果會(huì)怎么樣呢?如果你被困在原有的思維模式中,你就不會(huì)擁有廣闊的視野,你的視野就仿佛是坐井觀天,看到的是井口那么大的天地?!?br />
  亞馬遜創(chuàng)始人貝佐斯說:“聰明人會(huì)持續(xù)修改他們對(duì)特定事物的理解,重新考量先前已解決過的問題。聰明人也對(duì)新觀點(diǎn)、新資訊和挑戰(zhàn)他們既有思考模式的想法抱持著開放的態(tài)度?!必愖羲构膭?lì)大家擁有暫時(shí)而不是永久的想法,保持彈性以作改變。他說:“想法錯(cuò)誤或做錯(cuò)決定的那些人,總是過度執(zhí)著于只能支持某一特定觀點(diǎn)的細(xì)節(jié)。而懂得思考的人會(huì)不斷地省思,并對(duì)其他觀點(diǎn)抱持開放的心胸。”

  《創(chuàng)造性破壞》里指出,具備路易斯·巴斯德所謂“心理準(zhǔn)備”的人,才會(huì)關(guān)注到異常現(xiàn)象的存在?!皝啔v山大·弗萊明不是第一位發(fā)現(xiàn)細(xì)菌培養(yǎng)器皿受到霉菌孢子污染的人,卻是第一位注意到附著在那一層膠化物體上面,明顯的環(huán)狀絨毛斑點(diǎn)所具有的更深層意義的人”。

  四、被移動(dòng)互聯(lián)重構(gòu)的社會(huì)

  接下來,我們進(jìn)一步來論證“過去是否能決定未來”這個(gè)簡(jiǎn)單的命題。通常情況下,絕大多數(shù)人的行為其實(shí)都是按照某種規(guī)律進(jìn)行的,也就是過去如何做,未來也一般會(huì)如何做。例如平時(shí)早晚會(huì)有出行高峰,周末CBD 的人很少等等,都反映了社會(huì)人群的行為邏輯是可推演、可預(yù)測(cè)的,只要數(shù)據(jù)量足夠大。但是這里有兩個(gè)非常重要的假設(shè)性前提:一是社會(huì)現(xiàn)實(shí)的基礎(chǔ)未發(fā)生大變化,另外一個(gè)是你所應(yīng)用的群體,必須是樣本的主體。

  先來看前提條件一,平時(shí)早晚會(huì)有出行高峰,是因?yàn)榇蠖鄶?shù)人都是朝九晚五地上班,但是如果明天戰(zhàn)爭(zhēng)來了,還會(huì)是如此狀態(tài)么?必然不是,戰(zhàn)爭(zhēng)把原先的社會(huì)基礎(chǔ)給打破了,人的行為邏輯必然也就發(fā)生改變了。再按照過去的數(shù)據(jù)推演就無效。

  再來看前提條件二,更簡(jiǎn)單,你如果用早晚出行高峰去預(yù)測(cè)我的行為,那就一點(diǎn)成功的可能性也沒有,因?yàn)槲叶际前滋焖X、晚上上班,我就屬于樣本分析群體里的異類,屬于那部分不呈現(xiàn)樣本分析的群體性特征的人。

  我們從這兩個(gè)前提出發(fā),第一,那些打破基礎(chǔ)性環(huán)境的所謂黑天鵝事件,頻繁么?可測(cè)么?我自己感覺是不可測(cè),并且會(huì)越來越頻繁。從而得出結(jié)論,未來社會(huì)中群體性可預(yù)測(cè)的事情會(huì)越來越少,尤其是移動(dòng)互聯(lián)網(wǎng)興起之后。

  在移動(dòng)互聯(lián)網(wǎng)出現(xiàn)之前,人類社會(huì)骨子里還是個(gè)部落族長(zhǎng)制社會(huì),這種社會(huì)的特征是需要絕大多數(shù)人形成共同的價(jià)值觀,然后基于此來展開社會(huì)分工協(xié)作。即使你不認(rèn)同這種共同的價(jià)值觀,一種被稱為法律或者道德的東西,也會(huì)迫使你按照這種規(guī)則做事情。

  總之,一旦形成了主流價(jià)值觀的趨勢(shì),你只有接受和不接受的權(quán)利。由于這種價(jià)值觀在一定時(shí)期是固定的,這就使得社會(huì)整體的行為邏輯是可以很大程度上被推演和歸納的。所以,我們會(huì)發(fā)現(xiàn)在國(guó)家和民族內(nèi),都有共同的生活習(xí)慣,盡管很多生活習(xí)慣是被強(qiáng)加的,并不代表認(rèn)同。

  在過去的社會(huì)里,你如果是一個(gè)生活在群體性特征下的異類,你的前途基本上很渺茫,會(huì)被不斷地邊緣化,處于自生自滅的境地。當(dāng)然這個(gè)還算好的,如果你要反對(duì)這個(gè)社會(huì)的主流價(jià)值觀,你的下場(chǎng)一般就是哥白尼之類的了。

  當(dāng)然也有極個(gè)別的成功案例,就是被邊緣化和不認(rèn)同后,通過他自己的努力或者是運(yùn)氣,不但活下來了,還活得挺好。畢竟這樣的人真不多。

  但是互聯(lián)網(wǎng)出現(xiàn)之后,情況有了很大的變化。一個(gè)被自己原先所在群體邊緣化的人,通過互聯(lián)網(wǎng),往往能找到另外一些和他一樣被群體邊緣化的人,然后一拍即合,構(gòu)建起一個(gè)新的群體。所以從這個(gè)角度來看,互聯(lián)網(wǎng)其實(shí)是極大地促進(jìn)了社會(huì)群體的分化。社會(huì)更趨向多元化的分布,主流價(jià)值觀會(huì)被打破,越來越多的價(jià)值觀會(huì)涌現(xiàn)。這就使得對(duì)群體性行為的預(yù)測(cè)難度加大,就算每個(gè)群體的行為都可以被預(yù)測(cè),但所有群體疊加之后整個(gè)社會(huì)行為的預(yù)測(cè)難度會(huì)很大。

  互聯(lián)網(wǎng)時(shí)代,價(jià)值觀的對(duì)錯(cuò)與否不再是唯一標(biāo)準(zhǔn)。個(gè)體對(duì)于所謂的價(jià)值認(rèn)定也出現(xiàn)極大分化,一個(gè)人認(rèn)為很沒價(jià)值的東西,就有人做出完全不同的判斷,主流價(jià)值觀不斷被分化。最典型的就是成功學(xué),這個(gè)主流群體可能認(rèn)為毫無價(jià)值的東西,其實(shí)受眾遠(yuǎn)遠(yuǎn)多于批判的人。

  以前我們的社會(huì)講究什么?講究規(guī)矩,例如播音員要字正腔圓,寫文章要條理清晰,邏輯分明。現(xiàn)在發(fā)現(xiàn)不是了,你普通話越不標(biāo)準(zhǔn),得,觀眾還越喜歡;你文章沒人看得懂,得,無數(shù)少男少女為之瘋狂。這意味著社會(huì)舊有的運(yùn)行秩序會(huì)被重構(gòu),背后所反映的是樣本分析、群體分析的難度在加大。

  任何一個(gè)偶發(fā)性的東西都會(huì)因?yàn)檫@些群體行為的不可測(cè)而變得難以捉摸,例如有段時(shí)間很流行的“賈君鵬,你媽媽喊你回家吃飯”“元芳,你怎么看?”都莫名其妙地流行起來,呈現(xiàn)無目的性,無意識(shí)的偶然性因素極大增加。你去豆瓣看,有個(gè)“打死不穿秋褲組”,幾十萬粉絲,還有個(gè)群“打死也要穿秋褲組”,也幾十萬粉絲,就是這個(gè)特征。

  由此判斷,未來的社會(huì)形態(tài)將呈現(xiàn)出“現(xiàn)代社會(huì)的部落制形態(tài)”,過去那種集中式、大一統(tǒng)的社會(huì)可能會(huì)進(jìn)一步走向多元、分散,甚至去中心化,但由此帶來的是整個(gè)社會(huì)更易陷入小團(tuán)體有意識(shí),整體無意識(shí)的社會(huì)方向,從而使得社會(huì)的前進(jìn)方向更具隨機(jī)性。

  于是也更容易理解,為什么現(xiàn)在互聯(lián)網(wǎng)上吵架那么多?互聯(lián)網(wǎng)的這種特性,極大地降低了吵架的成本,讓傻瓜碰到傻瓜的機(jī)會(huì)大大增加。以前找個(gè)人吵架也挺難的,現(xiàn)在容易多了,隨便放個(gè)屁都能臭到人家,不吵架也難。并且,在沒有足夠人群支持的情況下,吵架其實(shí)是需要膽子的,而一旦有一群相同觀點(diǎn)的人支持你的時(shí)候,人的膽子會(huì)增加,吵架因?yàn)橛辛丝纯投菀滓l(fā)。

  未來社會(huì)的另一個(gè)特征,是不可測(cè)事件的頻發(fā)性。我在前面提過一個(gè)觀點(diǎn),到底是誰推動(dòng)了社會(huì)的進(jìn)步?社會(huì)由三種人構(gòu)成:天才、腦殘、普通民眾。大部分人是普通民眾,天才和腦殘都是極少數(shù)人。以前我們接受的教育是人民群眾推動(dòng)歷史前進(jìn),現(xiàn)在我不這么看,我感覺社會(huì)要么是精英推動(dòng),要么是腦殘推動(dòng),但是肯定不是普通人推動(dòng)。為什么這么說呢?

  因?yàn)槲覀儼l(fā)現(xiàn),人類社會(huì)進(jìn)化的過程其實(shí)就是一個(gè)不斷搞死別的物種的過程,而這個(gè)過程中,基因突變很重要?;蛲蛔兪窃谶M(jìn)化過程中能打敗別人和取得絕對(duì)優(yōu)勢(shì)的至關(guān)重要的一個(gè)環(huán)節(jié)。突變之后的個(gè)體展現(xiàn)出了更高層次的技能,從而給群體創(chuàng)造了一個(gè)進(jìn)化的方向,并且?guī)ьI(lǐng)群體開啟這個(gè)進(jìn)化過程。

  這個(gè)突變,本身就反映了隨機(jī)性和不確定性。發(fā)生突變的個(gè)體,從人類社會(huì)來說,就是精英或者腦殘。所以,我一直不認(rèn)為我們走到今天這一步是必然的。在另外一個(gè)空間,可能并不是人主宰地球。

  這里面再深入下去,我們還會(huì)發(fā)現(xiàn)很有意思的事情。人類的進(jìn)化并不是按照最優(yōu)路徑進(jìn)行的,從進(jìn)化通道來看,基因本身也會(huì)同時(shí)出現(xiàn)多種方向,并不是最先進(jìn)的基因決定了進(jìn)化方向。進(jìn)化的方向往往帶有極大的偶然性,隨著外界環(huán)境的變化而變化,但外界環(huán)境又帶有極大的不確定性,大量的事情是非必然的。

  最好的例子是恐龍??铸埖臏缤?,很大程度是因?yàn)樾⌒行堑呐鲎?,這個(gè)突發(fā)的偶然性事件,使得統(tǒng)治了地球近1.4 億年的恐龍?jiān)诤芏痰臅r(shí)期里全部死去,代表了當(dāng)時(shí)最先進(jìn)生產(chǎn)力的恐龍就此滅亡,地球的進(jìn)化方向轉(zhuǎn)向了。沒有任何數(shù)據(jù)可以推導(dǎo)出這個(gè)偶發(fā)性的外部因素,以及由此所造成的影響。

  人類進(jìn)化歷程也必然如此,前進(jìn)是必然的,如何前進(jìn)卻是偶然的。由于樣本分布太少,數(shù)據(jù)不夠充分,那些推動(dòng)人類歷史進(jìn)程的天才或腦殘,現(xiàn)實(shí)中恰是無法進(jìn)行數(shù)據(jù)推演的。

  簡(jiǎn)而言之,正確歸納和推演社會(huì)普遍群體的某一邏輯,其背后需要穩(wěn)定的社會(huì)環(huán)境基礎(chǔ),而穩(wěn)定的社會(huì)環(huán)境基礎(chǔ),卻往往會(huì)被少數(shù)腦殘或者天才所改變。因此,結(jié)論是社會(huì)群體的推演其實(shí)是無法預(yù)測(cè)的,而且移動(dòng)互聯(lián)時(shí)代更加劇了進(jìn)程的不確定性。

  現(xiàn)在這種不確定性日益明確,我們反倒認(rèn)為大數(shù)據(jù)的基礎(chǔ)其實(shí)在坍塌。我們繼續(xù)看大數(shù)據(jù)存在的一些假設(shè)前提條件,其中有一個(gè)認(rèn)為互聯(lián)網(wǎng)世界提供了全數(shù)據(jù)。

  《大數(shù)據(jù)》這本書的聯(lián)合作者,牛津大學(xué)互聯(lián)網(wǎng)中心的維克托邁爾-舍恩伯格教授,曾說他最喜歡的對(duì)于大數(shù)據(jù)集合的定義是“N= 所有”,這里不再需要采樣,因?yàn)槲覀冇姓麄€(gè)人群的數(shù)據(jù)。

  這就好比選舉監(jiān)察人不會(huì)找?guī)讖堄写硇缘倪x票來估計(jì)選舉的結(jié)果,他們會(huì)記點(diǎn)每一張選票。當(dāng)“N= 所有”的時(shí)候,確實(shí)不再有采樣偏差的問題,因?yàn)椴蓸右呀?jīng)包含了所有人。這個(gè)說法很有意思,因?yàn)榛ヂ?lián)網(wǎng)的海量容納數(shù)據(jù)的可能性,的確給了全數(shù)據(jù)一個(gè)很好的假設(shè)前提,但是假設(shè)始終只是假設(shè),現(xiàn)實(shí)卻總是現(xiàn)實(shí)。

  這個(gè)假設(shè)論證大數(shù)據(jù)意義的同時(shí),也提出了一個(gè)致命的問題,即“N= 所有”可實(shí)現(xiàn)么?如果N 不等于所有,是否也意味著大數(shù)據(jù)其實(shí)是不可能實(shí)現(xiàn)的任務(wù),這就是我在很多地方一直強(qiáng)調(diào)的全數(shù)據(jù)的可實(shí)現(xiàn)性。

  如果無法實(shí)現(xiàn)和提供全數(shù)據(jù),那就意味著大數(shù)據(jù)可能是失效的,我提過一個(gè)概念,如何看待民意的問題。理論上很多人都把微博作為輿論情緒的主要調(diào)查樣本,因?yàn)檫@里的數(shù)據(jù)第一可得,第二可統(tǒng)計(jì),但是事實(shí)上,微博上的輿論情緒代表了真正的民意么?顯然不是的。

  很多時(shí)候我說,打開微博,暗無天日,關(guān)掉微博,風(fēng)輕云淡。發(fā)現(xiàn)世界壓根沒有微博上說的那么糟糕,理由很簡(jiǎn)單,微博的使用群體并不能代表社會(huì)的普遍性群體,中國(guó)十三億人,有十二億人壓根沒有使用微博的習(xí)慣,他們的情緒被忽視了。一個(gè)忽略了絕大部分群體的數(shù)據(jù),能代表最終的輿論傾向么?基礎(chǔ)數(shù)據(jù)的樣本偏差,直接帶來了結(jié)果偏差,無法覆蓋足夠多的樣本所帶來的最終統(tǒng)計(jì)結(jié)果,其準(zhǔn)確性必然是極差的。

  前面我提過大數(shù)據(jù)的本質(zhì)必然是統(tǒng)計(jì)學(xué)的社會(huì)應(yīng)用,它沒有帶來新的真理,沒有改變統(tǒng)計(jì)學(xué)的基礎(chǔ)原理,因此沒有必要刻意拔高它的現(xiàn)實(shí)意義。過去統(tǒng)計(jì)學(xué)中碰到的所有問題,大數(shù)據(jù)依然會(huì)碰到。

  現(xiàn)在很多關(guān)于大數(shù)據(jù)的言論,其實(shí)都帶有一點(diǎn)文字游戲的特征,已經(jīng)帶有很強(qiáng)的心理暗示和商業(yè)營(yíng)銷行為在內(nèi)。最經(jīng)典的案例是少女懷孕那個(gè)案例,曾經(jīng)非常的有名,但是卻經(jīng)不起推敲。

  美國(guó)折扣連鎖店Target 的傳奇式成功(由《紐約時(shí)報(bào)》的Charles Duhigg 于2012 年報(bào)道),以后估計(jì)都難以效法。Duhigg解釋了Target 公司是如何從它的顧客身上搜集到大量的數(shù)據(jù)并熟練加以分析,它對(duì)顧客的理解簡(jiǎn)直到了出神入化的程度。

  Duhigg 講的最多的故事是這樣的:一名男子怒氣沖沖地來到明尼蘇達(dá)州的某一Target 連鎖店,向店長(zhǎng)投訴該公司給他十幾歲的女兒郵寄嬰兒服裝和孕婦服裝的優(yōu)惠券。店長(zhǎng)大方地向他道了歉。可不久后,店長(zhǎng)又收到這名男子的電話,要求店長(zhǎng)再次道歉——只是這一次店長(zhǎng)告知那名男子,那個(gè)少女確實(shí)懷孕了。在這名男子還沒有意識(shí)到的時(shí)候,Target 通過分析少女購(gòu)買無味濕紙巾和補(bǔ)鎂藥品的記錄就猜到了這個(gè)事實(shí)。

  做這樣的案例分析之前,我們從統(tǒng)計(jì)學(xué)角度出發(fā),首先要考慮的問題是,這樣的案例背后我們所沒看到的其他因素,最簡(jiǎn)單的一個(gè)因素就是,到底有多少?zèng)]有懷孕的人也收到了類似的優(yōu)惠券?這個(gè)很重要,直接關(guān)系到統(tǒng)計(jì)準(zhǔn)確率的問題。

  事實(shí)上,這個(gè)少女可能僅僅只是個(gè)特例,因?yàn)楹芏喔粯拥呐⒆樱鋵?shí)都收到了優(yōu)惠券,因?yàn)門arget 給所有人都寄了,只是恰巧碰到了少女懷孕這個(gè)案例。兩者一比較,就會(huì)發(fā)現(xiàn),大數(shù)據(jù)的光環(huán)沒了,在看大數(shù)據(jù)成功案例之前,其實(shí)我們要更多關(guān)注反面案例到底有多少,而不是正面案例有多少,一千萬碰到一個(gè)的算法跟精準(zhǔn)命中的算法,雖然最終都是命中,但是商業(yè)價(jià)值是大打折扣的。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }