
大數(shù)據(jù)時(shí)代,人類生活面臨顛覆_數(shù)據(jù)分析師
對(duì)于IT領(lǐng)域來說,最近有很多非常新的概念,比如云計(jì)算、物聯(lián)網(wǎng),當(dāng)大家剛剛對(duì)這些概念開始有清晰的認(rèn)知時(shí),又一個(gè)全新概念出現(xiàn)了——大數(shù)據(jù)。什么是大數(shù)據(jù)?大數(shù)據(jù)概念究竟指向何方,大數(shù)據(jù)背后能怎樣改變我們生活?會(huì)不會(huì)給我們的生活和工作帶來困擾?
本報(bào)與第一財(cái)經(jīng)頭腦風(fēng)暴節(jié)目合作探討大數(shù)據(jù)時(shí)代下的問題。參與這次討論的嘉賓有大數(shù)據(jù)概念的提出者、牛津大學(xué)教授維克托·邁爾·舍恩伯格,微軟亞太研發(fā)集團(tuán)、云計(jì)算操作系統(tǒng)首席架構(gòu)師徐明強(qiáng),上海市信息化專家、專業(yè)委員會(huì)專家、復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院院長王曉陽,科爾尼管理咨詢?nèi)蚝匣锶藢O健,復(fù)旦大學(xué)現(xiàn)代哲學(xué)研究所所長俞吾金,啟明創(chuàng)投合伙人童士豪,著名財(cái)經(jīng)評(píng)論員石述思。
1 到底什么是大數(shù)據(jù)?
維克托:我認(rèn)為它就是新黃金,我覺得是21世紀(jì)最主要的資源,這種資源對(duì)社會(huì)、企業(yè)、個(gè)人是否能成功,還是會(huì)受苦受難有著很重要的作用。解釋一下,雖然此前我們都有數(shù)據(jù),可把它們整理在一起然后分析是非常昂貴的,因此我們更多的注意力都放在了實(shí)體資源上,就是真正的黃金、金塊,像勞動(dòng)力這種資源。但只有最近我們才靠人的知識(shí)、創(chuàng)新來創(chuàng)造財(cái)富,更靠前一步,我們可以根據(jù)數(shù)據(jù)來進(jìn)行,因?yàn)閿?shù)據(jù)收集以及分析,成本上升的程度都已經(jīng)改變了,然后我們的數(shù)據(jù)就可以達(dá)到一定規(guī)模。最后,大家所尋求的不管你是一個(gè)人、一個(gè)公司、一個(gè)組織,還是這個(gè)社會(huì),無外乎就是這種所謂的新黃金。
為什么最近黃金的價(jià)值會(huì)跌得很厲害?因?yàn)槔宵S金不值錢了,沒有新黃金有價(jià)值。
童士豪:我的觀點(diǎn)有點(diǎn)類似,第一個(gè)是云,第二個(gè)是關(guān)系,第三個(gè)是未來。像剛才維克托先生提到的,因?yàn)樵茣r(shí)代到了,儲(chǔ)存的大量數(shù)據(jù)的成本非常低,所以能讓大家去利用大數(shù)據(jù)做工作分析,最近由于很多事情的關(guān)系,有更多的關(guān)系被理解,所以能去預(yù)測未來狀況。用自己的話說,就是在聆聽上花很多時(shí)間,看了很多朋友,大家尋找工作機(jī)會(huì)也好或者是認(rèn)識(shí)對(duì)工作有幫助的合作伙伴也好,在這么大的信息里,這么多人把他自己的信息放在上面,就是做了一件事,就是分析。如果你40歲想當(dāng)創(chuàng)意公司的CEO,你現(xiàn)在20歲,未來20年該怎么規(guī)劃?這就是非常有意思的一件事。
最后可能有不同的可能性,最后會(huì)不會(huì)給你找到一個(gè)最好的方法,那是自己決定的??赡苄苑旁诿媲埃菣C(jī)會(huì)率最高的,怎么選還是個(gè)人決定,所以大數(shù)據(jù)并沒有抹殺個(gè)人的意識(shí)。
石述思:大數(shù)據(jù)首先改變的是我們看待世界的方法,它會(huì)對(duì)這個(gè)時(shí)代的很多的價(jià)值觀產(chǎn)生劇烈沖擊。舉例來說,因?yàn)檫^去我們東方人特別喜歡一個(gè)詞叫因果,我們認(rèn)為善有善報(bào)、惡有惡報(bào),其實(shí)根據(jù)交管部門調(diào)查的數(shù)據(jù),在街頭遭遇橫禍的人其實(shí)跟道德無關(guān),秦檜的壽命是岳飛的兩倍半,很多貪官在發(fā)現(xiàn)之前,那過的確實(shí)是令人無限羨慕的生活。因此,通過大數(shù)據(jù)我們能用一種全新的觀念來看待這個(gè)世界,這個(gè)世界是有關(guān)聯(lián)來建構(gòu)的一個(gè)新型的關(guān)系,只有科技發(fā)展到一定水平,才能達(dá)到這樣的高度。
與此同時(shí),在大數(shù)據(jù)時(shí)代,我們?cè)撱∈氐牡拙€還是要恪守,但它的確在告訴我們真相,因?yàn)榭茖W(xué)就是在告訴我們真相。我有一個(gè)愿望,就是剛才講的大數(shù)據(jù)是新的黃金,我希望它更多地用于社會(huì)公益事業(yè),比如,去挽救地震局。這樣能避免很多人道主義的災(zāi)難和財(cái)產(chǎn)的損失,結(jié)論是我們過去認(rèn)為上帝是哲學(xué)家或者叫哲人,現(xiàn)在發(fā)現(xiàn)他老人家是個(gè)老頑童。
2 大數(shù)據(jù)究竟有沒有對(duì)各領(lǐng)域的工作和生活產(chǎn)生影響?
王曉陽:大數(shù)據(jù)影響了智慧。怎么理解呢?大數(shù)據(jù)本身的概念是數(shù)據(jù)采集和處理,到了一定的程度使我們的社會(huì)也好,管理者也好,都能獲益——從城市來講,一個(gè)管理者可以聚集這些數(shù)據(jù)和處理方式,使得我們能用智慧來管理城市,可以從交通管理、公共衛(wèi)生,還有其他各個(gè)方面來管理,這管理是需要數(shù)據(jù),數(shù)據(jù)產(chǎn)生了智慧,然后反過頭來能管理我們的模式。
比如,在公共衛(wèi)生方面,采集數(shù)據(jù)到了目前為止其實(shí)已經(jīng)進(jìn)行了好多年,它的數(shù)據(jù)采集原來并不是為了大數(shù)據(jù)來做的,其實(shí)是為了一個(gè)方便——方便大家去看病。而且你的電子病例等,讓你看病更人性化,或者對(duì)醫(yī)生來講能更快、更方便地去熟悉病情,但在這種情況下,這個(gè)數(shù)據(jù)一旦采集起來使得我們對(duì)整個(gè)城市的健康狀況就能進(jìn)一步了解,所以,剛才講的看病的數(shù)據(jù)其實(shí)是原本的用意,大數(shù)據(jù)一來其實(shí)我們就能看見原來看不見的問題。比如一些比較大趨勢方面的問題,流行病在哪個(gè)地方比較多,或者它怎樣流傳的,等等。這些事情我們?cè)瓉硎强床坏降模@種情況就是大數(shù)據(jù)對(duì)我們的幫助。
徐明強(qiáng):先舉個(gè)例子,有一個(gè)球和一只螞蟻,球跟螞蟻說,做三維世界的事物太好了,你看這條線上有多少個(gè)螞蟻我一眼就看見了,螞蟻說我真的不信,我得按照這條線爬,爬到頭計(jì)數(shù)器沒有出故障我才知道有多少螞蟻。這能看到三維和二維差了一維,就差了這么大,所以大數(shù)據(jù)首先它不是數(shù)據(jù)大,不是同樣的數(shù)據(jù)多了就變成大數(shù)據(jù),而是在原有的二維、原有的數(shù)據(jù)庫基礎(chǔ)上,再建立一維,給它一個(gè)全新的看點(diǎn)。舉例說明,你如果在美國,你是欠了債的,除了債主對(duì)你感興趣,還有人會(huì)對(duì)你感興趣——如果你欠了債,突然你可以還債了,那么銀行會(huì)對(duì)你感興趣。在11年前,美國資本一號(hào)就發(fā)明了一種大數(shù)據(jù)的應(yīng)用,它可以找到哪些人是欠了銀行的錢、欠了信用卡的錢,然后它就會(huì)觀察你的消費(fèi)數(shù)據(jù),當(dāng)它發(fā)現(xiàn)你可以開始還的時(shí)候,他立刻把你再買過來,從此以后他就吃上了你的利息。資本一號(hào)這個(gè)公司在2001年時(shí),每個(gè)季度的增長率是20%,就是因?yàn)樗髷?shù)據(jù)的程序,它可以高命中率地發(fā)現(xiàn)這個(gè),它是從哪里找來的數(shù)據(jù)呢?從沃爾瑪、從各種各樣的消費(fèi)數(shù)據(jù)中找到的。從這個(gè)實(shí)例我們可以看出,大數(shù)據(jù)這個(gè)原有的數(shù)據(jù)分析商務(wù)智能上加了一層,商務(wù)智能不能告訴我們別人將要并且能做什么。
關(guān)于我們公司對(duì)奧斯卡頒獎(jiǎng)的預(yù)測,除了對(duì)李安的預(yù)測沒對(duì),其他都對(duì)了。其實(shí),我們的預(yù)測是把所有人員都做了一個(gè)概率,所以做了19個(gè)預(yù)測對(duì)的,是我們放在第一概率的獲獎(jiǎng)人,下面還有4個(gè)是第二概率,所以李安導(dǎo)演我們放在第二概率,我們把他放在后面。
這個(gè)預(yù)測跟大數(shù)據(jù)很有關(guān)系,首先做大數(shù)據(jù)需要有IQ,智商,就是說,這個(gè)模型要非常好。我們公司做IQ的人叫加戴維·羅斯查爾德,是我們研究部門的一個(gè)人。還有其他人,我要講講,他這個(gè)人的IQ有什么差別?他這個(gè)人的IQ用了一個(gè)非常簡單聚合的模式,除了IQ還有什么呢?智商以后還要有勤商,勤奮的勤。勤商就是說,他非常勤奮地去找數(shù)據(jù),要找多種數(shù)據(jù),還要找非常實(shí)際的數(shù)據(jù),所以他在網(wǎng)上、社交網(wǎng)上都有找。有一些找不到的數(shù)據(jù),怎么辦?他找人做調(diào)查,然后找人來做,所以他又有智商,又有勤商,夠不夠呢?還不夠,五年前這種事情做不到,為什么?五年前他要做這樣大量的數(shù)據(jù)的話,自己作為一個(gè)研究生的小預(yù)算是做不到的,但云計(jì)算的出現(xiàn),他就可以做到了??梢匝由爝@些數(shù)據(jù),用很多處理器來處理,現(xiàn)在他就是用了云做這樣一個(gè)計(jì)算,最后成功了。
孫?。何覍懙氖菣C(jī)會(huì)加危險(xiǎn),就是危機(jī)。我同意維克托的結(jié)論,說這是一個(gè)新的金礦,或者有說法叫新的機(jī)會(huì),但不要忘記那同時(shí)會(huì)帶來很多危險(xiǎn)。如果我們不能很好地去處理大數(shù)據(jù)的話,特別是像在我們?nèi)粘9ぷ髦薪佑|到的很多中國企業(yè),它們大多數(shù)甚至在最基礎(chǔ)的數(shù)據(jù)分析方面還比較落后,這就意味著,我們?cè)撛鯓雍芸斓剡^渡到大數(shù)據(jù)時(shí)代去,去面對(duì)大數(shù)據(jù)挑戰(zhàn),如果準(zhǔn)備不好,那我很擔(dān)心,這會(huì)像以往很多新技術(shù)來了以后的情況,很容易造成很多企業(yè)邯鄲學(xué)步——連走路都還沒學(xué)會(huì),就要學(xué)跳,一下子邁到大數(shù)據(jù)時(shí)代,企業(yè)不知道怎樣真正地讓大數(shù)據(jù)發(fā)揮作用。
在我們的行業(yè)里,因?yàn)榇髷?shù)據(jù)而做了很多產(chǎn)品創(chuàng)新。談到大數(shù)據(jù)時(shí)代的破壞型創(chuàng)新,實(shí)際上也是談了同樣的問題,因?yàn)樵趧?chuàng)新的同時(shí),事實(shí)上要推導(dǎo)、顛覆原來的很多東西,包括我們咨詢行業(yè)的很多服務(wù)和產(chǎn)品都要做更新,也要跟上時(shí)代。比如,我們有一家很大的全球性零售企業(yè),它每天要處理海量數(shù)據(jù),那么在海量數(shù)據(jù)之前,雖然有了技術(shù)手段,它仍需找到一個(gè)很好的切入點(diǎn),去解決大數(shù)據(jù)該怎樣應(yīng)用到業(yè)務(wù)中,改變業(yè)務(wù)模式,給業(yè)務(wù)創(chuàng)新帶來價(jià)值。因?yàn)橐堰@個(gè)大數(shù)據(jù)加以更好地利用,再便宜還是投資,還是要改變,硬件、軟件各方面要做配置,甚至對(duì)應(yīng)的組織要做調(diào)整,一個(gè)企業(yè)要做進(jìn)一步調(diào)整才能適應(yīng)大數(shù)據(jù)時(shí)代的需求,才能讓大數(shù)據(jù)發(fā)揮作用。所以我們做的工作就是幫助企業(yè)找到它的價(jià)值創(chuàng)造,建立業(yè)務(wù)模式,來證明在這方面做這樣的投資,讓大數(shù)據(jù)發(fā)揮作用是值得的。
俞吾金:我想提出不同看法,就是因?yàn)槿祟惖乃季S有一個(gè)特點(diǎn),他把覺悟的東西夸大為全球的。比如你看到三只天鵝是白的,但其實(shí)有一千只天鵝都是白的,可在澳大利亞發(fā)現(xiàn)了一只黑天鵝,就把一切天鵝都是白的這個(gè)原理給推翻了,我覺得大數(shù)據(jù)這個(gè)問題是重要的,但如何正確看待它,不能走極端。大數(shù)據(jù)反映了人們從數(shù)量關(guān)系去理解生活的一種思維方法,從古代開始就非常重視,當(dāng)然古代沒有使用大數(shù)據(jù)這個(gè)概念。
數(shù)字本身對(duì)生活的重要性越來越大。從哲學(xué)上看,它有實(shí)踐性,比如數(shù)學(xué)中的π,圓周率,它等于3.1415926……它就把所有大數(shù)據(jù)都囊括進(jìn)去了,更容易理解的是三分之一,三分之一的另一種寫法就是0.333333無限被延伸,所以黑客在邏輯學(xué)里就強(qiáng)調(diào),這個(gè)無限包容在三分之一這個(gè)有限中,有限中包含著無限的一個(gè)展開,包含所有數(shù)據(jù)的展開,這就體現(xiàn)了實(shí)踐精神。從這個(gè)實(shí)踐角度看這個(gè)數(shù)據(jù),我認(rèn)為大數(shù)據(jù)在當(dāng)代的變動(dòng)中有重要地位,但看它要有眼光,不要夸大也不要縮小。
3 怎么理解三分之一就把一生所有數(shù)據(jù)都概括了?
維克托:我不同意俞老師的觀點(diǎn)。數(shù)字的歷史很悠久,但是,以前我們對(duì)這些數(shù)字的處理方式非常有限,光有技術(shù)是不夠的,能對(duì)數(shù)據(jù)進(jìn)行分析,比如像數(shù)字,它對(duì)你只是一個(gè)數(shù)字,這個(gè)意義不重要,你也可以用一個(gè)漢字或一個(gè)字母來表示,那從這個(gè)角度來看,大數(shù)據(jù)不過是一個(gè)很長很長的數(shù)字,你可以用心記住就可以。
但其實(shí),大數(shù)據(jù)的價(jià)值在于,在整個(gè)數(shù)據(jù)的收集過程中,需要運(yùn)用分析才可以了解。比如,如何進(jìn)行預(yù)防性的維修,如何能夠防止爆發(fā)等,我們不是把這個(gè)數(shù)字簡單地記下來或背下來,而是要通過分析,通過數(shù)據(jù)統(tǒng)計(jì)的分析,通過把它進(jìn)行整理了解之后分析,這不是你背下來一個(gè)數(shù)字就可以了,這是非常大的區(qū)別。
4 大數(shù)據(jù)時(shí)代究竟會(huì)給生活帶來什么樣的顛覆?
維克托:首先從商業(yè)來講,我覺得有三個(gè)元素要記?。阂粋€(gè)是在商業(yè)世界中決策將發(fā)生變化,會(huì)越來越清楚地證明,要靠數(shù)據(jù)說話。
在美國,最大的互聯(lián)網(wǎng)公司大概是谷歌,每天都有30億搜索請(qǐng)求。有一天他們屏幕上準(zhǔn)備用藍(lán)色,然后他們就選了一個(gè)特別的藍(lán)色,但他是要測試41種不同的藍(lán)色,來看到底哪一種最受歡迎。他本來想自己來決定:我是首席設(shè)計(jì)師啊,我就選了一種藍(lán)色。但他的老板說:不行,我需要實(shí)證來告訴我們哪一種藍(lán)色最受歡迎。但這個(gè)谷歌的首席設(shè)計(jì)師就辭職了,他說我是首席設(shè)計(jì)師啊,我是最清楚的。通過很多測試發(fā)現(xiàn),有一種藍(lán)色的藍(lán)是裸眼看到和設(shè)計(jì)師選的藍(lán)色不太區(qū)別得開,但另一種通過測試所產(chǎn)生的藍(lán)色,更受歡迎,有更多點(diǎn)擊量。通過實(shí)證做出來的決策更有效。類似例子有很多,都說我做這行已經(jīng)幾十年了,我說的肯定沒錯(cuò)。這種傳統(tǒng)的社會(huì)觀念和思維方式會(huì)受到挑戰(zhàn),我們的決策必須要靠數(shù)據(jù)說話,這是第一點(diǎn)。
第二,就是在我們出去說話時(shí),我們要注意不能誤讀數(shù)據(jù),錯(cuò)誤的數(shù)據(jù)是不行的。也就是如果原來的材料不對(duì),原料是垃圾,出來的東西肯定也是垃圾,這個(gè)公司出這些數(shù)據(jù)的話都是比較容易理解的,但可能不是你應(yīng)該熟悉的數(shù)據(jù)。
第三個(gè)是挑戰(zhàn)。就是普通產(chǎn)業(yè),尤其是計(jì)算機(jī)產(chǎn)業(yè),數(shù)據(jù)會(huì)超越它們,這個(gè)可能是有一種挑戰(zhàn)式的說法。如果沒有足夠的數(shù)據(jù),你也趕不上一個(gè)大量數(shù)據(jù)的比較平庸的模型,也就是為什么說數(shù)據(jù)會(huì)超越那些產(chǎn)業(yè)。比如機(jī)器翻譯這件事,在六七十年代,IBM花了很多錢想用機(jī)器翻譯,它要弄一些語言的規(guī)則輸入到機(jī)器中,但效果不太好,它就有了一個(gè)新想法,它不是把一種語言的語法規(guī)則輸入機(jī)器,而是把加拿大議會(huì)中的英法雙語的互譯輸進(jìn)去,把成千上萬的翻譯資料輸入進(jìn)去,它就有了大量的累計(jì)組織上的數(shù)據(jù)庫,這個(gè)效果就好得多。而谷歌又在這個(gè)領(lǐng)域有更多數(shù)據(jù),一下子這個(gè)翻譯就更成熟、效果更好??梢哉f,是這個(gè)數(shù)據(jù)使它超越了這個(gè)軟件。因?yàn)榻裉爝@個(gè)大數(shù)據(jù)的力量,可以很容易地獲得想要的資訊,但大概在十年前,需要五十萬個(gè)服務(wù)器,大量的儲(chǔ)存以及處理數(shù)據(jù)的模式,你才能開始一個(gè)新業(yè)務(wù)。今天如果要輸入業(yè)務(wù),用云計(jì)算來測試就可以了。比如有一個(gè)叫蒂塞德的公司,它有很多產(chǎn)品及價(jià)格,它收購一些數(shù)據(jù)來預(yù)測到底一個(gè)產(chǎn)品是上架還是下架,雖然他們擁有大量客戶,可這個(gè)公司的員工只有13個(gè)人,因此它的服務(wù)器有很多,他們擁有大量的數(shù)據(jù)??梢姡@個(gè)舞臺(tái)不僅可以讓大公司來做,而且創(chuàng)新的小公司也能以平等的地位來競爭。
王曉陽:其實(shí)講到改變了我們整個(gè)思維方式,所謂的就是實(shí)驗(yàn)這個(gè)思維,比理論思維更重要,這一點(diǎn)我不是太懂。其實(shí)維克托先生剛才舉的例子,是在很多情況下,是我們用數(shù)據(jù)去驗(yàn)證以前想要能夠有的東西,有一些智慧確實(shí)是在數(shù)字里挖掘出來的,這個(gè)可能是一個(gè)語言來自不同的地方,怎么講呢?基于在大數(shù)據(jù)的情況下,其實(shí)有一個(gè)所謂的循環(huán)概念,等于說你有了智慧以后去驗(yàn)證,驗(yàn)證數(shù)據(jù)里又產(chǎn)生了各種各樣的智慧來做這樣的理解,所以從這個(gè)角度來講,我覺得是大數(shù)據(jù)的情況下面,沒有顛覆,而是說一個(gè)改進(jìn),對(duì)我們認(rèn)知世界的改進(jìn)。就公共衛(wèi)生這個(gè)話題來說,我們舉的最多的一個(gè)例子就是在谷歌,有一個(gè)所謂的趨勢預(yù)測,它就是用了網(wǎng)民們搜索的詞來預(yù)測。
所謂的預(yù)測流感,怎么做?很簡單,就是它去分析了以往的數(shù)據(jù),說在流感發(fā)生的地域,地域的那個(gè)時(shí)間大家是用什么詞去搜索,這樣就可以做統(tǒng)計(jì)。做了統(tǒng)計(jì)以后,反過頭來用這些搜索詞來預(yù)測這個(gè)流感,這種情況下是什么意思?并不見得是說這種數(shù)據(jù)或大數(shù)據(jù)的情況就能使我們對(duì)這個(gè)流感突然有一個(gè)新的認(rèn)識(shí),其實(shí)不然,其實(shí)是谷歌的那些工程師們有一個(gè)想法,認(rèn)為我們好像流行流感,這和大家有關(guān),而每個(gè)人都會(huì)用搜索來獲取一些跟流感有關(guān)的信息,就有了這樣的關(guān)聯(lián)。這個(gè)關(guān)聯(lián)怎么去發(fā)現(xiàn)?這就要用數(shù)據(jù)去發(fā)現(xiàn),用所謂的大數(shù)據(jù)的做法,去實(shí)現(xiàn)我們已有的一些概念的東西,把它實(shí)現(xiàn)了之后,就能做預(yù)測。所以從這樣的角度講,并不見得是有了大數(shù)據(jù),我們就可以把所有的智慧都丟掉,我們不用IQ了,只要數(shù)據(jù)就好了,這肯定是不行的。一定是IQ加上數(shù)據(jù),然后能讓它有個(gè)正反的概念,這是大數(shù)據(jù)所應(yīng)該干的事情。
童士豪:我有不同想法,我覺得剛才維克托先生講的一點(diǎn)很有意思,就是對(duì)智慧的要求,大數(shù)據(jù)時(shí)代是不一樣的。在大數(shù)據(jù)時(shí)代,對(duì)智慧的要求可以低一點(diǎn),都能產(chǎn)生更好的結(jié)果,這是一個(gè)有意思的事情。他剛才提了一個(gè)例子,之前要做翻譯是很難的,你的規(guī)則必須特別強(qiáng)、精簡、完整,才能有60%、70%的準(zhǔn)確率。但在大數(shù)據(jù)時(shí)代,我們不用想那些,不用花智慧講那么復(fù)雜的規(guī)則和套路,干脆把幾億個(gè)已翻譯好的文章交給電腦,用統(tǒng)計(jì)學(xué)的方式找到哪種情況下,翻譯的字的另外一個(gè)意思是比較對(duì)的。這對(duì)于智慧的要求其實(shí)是降低了,但效果可能會(huì)更好。
孫?。嚎赡芪覀儗?duì)智慧的理解有歧義。我覺得維克托先生講的我理解,因?yàn)樗辛硪槐緯小禗elete》,里面專門講了這個(gè)三重智慧,談了取舍問題。因?yàn)殡S著存儲(chǔ)技術(shù)、因特網(wǎng)的發(fā)展,他講的更多的是知識(shí),知識(shí)的要求可以低,但對(duì)智慧,我覺得理解不一樣。我理解的智慧是,你判斷一個(gè)事物的根本的、真正的洞察能力。就是,你對(duì)一個(gè)事物的洞察能力還是需要有,不會(huì)因?yàn)榇髷?shù)據(jù)的存在而削弱或不需要了,而恰恰因?yàn)榇髷?shù)據(jù)的存在才更需要洞察力。
5 大數(shù)據(jù)時(shí)代到底真正來臨了嗎?
王曉陽:大數(shù)據(jù)時(shí)代來不來臨要看你怎么度量、衡量?,F(xiàn)在這個(gè)數(shù)據(jù)的量和種類,以及采集的方式、手段,處理的手段,絕對(duì)已經(jīng)達(dá)到了“前無古人,后無來者”的感覺。這個(gè)情況下,我們從這個(gè)數(shù)據(jù)采集以及數(shù)據(jù)處理這個(gè)能力方面來講,我們的大數(shù)據(jù)時(shí)代來臨了,但我們使用數(shù)據(jù)利用數(shù)據(jù)這個(gè)才是剛剛開始,只是剛起步。
而大數(shù)據(jù)改變我們生活的時(shí)代,還沒有完全到來,但為這個(gè)我們已經(jīng)做了很多準(zhǔn)備,這是城市的管理問題。我們?yōu)榇髷?shù)據(jù)時(shí)代做了很多準(zhǔn)備,比如在數(shù)據(jù)采集方面已經(jīng)做了很多準(zhǔn)備,怎么樣利用這個(gè)數(shù)據(jù)來做我們這個(gè)智慧城市,這是一個(gè)最大的問題。
徐明強(qiáng):從商業(yè)角度來看,我從運(yùn)用上說,個(gè)人認(rèn)為是來臨了。舉個(gè)例子,墨客這樣一個(gè)藥材公司,他可以根據(jù)天氣性質(zhì),比如如果今天冬天特別冷,很多過敏性動(dòng)物就會(huì)冬眠,四五月份突然轉(zhuǎn)熱時(shí),花粉也開始多了,今年有很多人會(huì)過敏,等等,它就通過市場進(jìn)行營銷,把比如克敏能這種藥材發(fā)布出去。
維克托·邁爾·舍恩伯格:美國總統(tǒng)奧巴馬曾說,盡管政府也嘗試,但他總是落后于企業(yè),落后于社會(huì)的其他一些群體。所以說搞這種活動(dòng)能充分激發(fā)數(shù)據(jù),提供給大眾,而且公司也可以拿這些數(shù)據(jù),讓公司能利用這些數(shù)據(jù)有更多創(chuàng)新。這是一個(gè)想法,也許有一些做法,比如商業(yè)方法,我認(rèn)為能通過發(fā)揮企業(yè)的智慧,發(fā)揮像微軟這樣的一些聰明企業(yè)的智慧,還是有幫助的,包括和政府的合作來管好社會(huì)。
石述思:我有一個(gè)感受,當(dāng)商業(yè)巨頭面對(duì)屌絲談大數(shù)據(jù)時(shí),我們都有一種不寒而栗的感覺,因?yàn)楸M管大數(shù)據(jù)時(shí)代我們每個(gè)人都是公平的,我們可以說小公司可以獲得公平競爭待遇,但其實(shí)掌握大數(shù)據(jù)的都是一些巨頭,他們有得天獨(dú)厚的優(yōu)勢來搶我們錢包里的錢,我們很難,因?yàn)楣镜亩x就是在法律允許的范疇中唯利是圖。但我們倒是渴望政府部門能利用大數(shù)據(jù)為我們提供普惠性的服務(wù),可就像一些智慧城市沒法真正做到智慧管理的案例一樣,所以我對(duì)大數(shù)據(jù)來到中國的前途深表憂慮。還有,即使優(yōu)秀的公司利用大數(shù)據(jù),它也要面對(duì)一個(gè)現(xiàn)實(shí),比如我們像電視臺(tái)做廣告的一樣,為什么現(xiàn)在人依然很多,因?yàn)橹袊毟徊罹嗵貏e大,如果你掌握了所有消費(fèi)者的數(shù)據(jù),而大多數(shù)在今天是無效數(shù)據(jù),所以你還是有一個(gè)有選擇的大數(shù)據(jù)的過程,叫有購買力的大數(shù)據(jù),所以各種各樣的問題就會(huì)出現(xiàn)在我們面前,就是社會(huì)本來是我們需要,但它存在很多幕后看不清楚的東西。我們擔(dān)心被商業(yè)巨頭利用,來完成對(duì)消費(fèi)者進(jìn)一步的盤剝。
孫?。何矣X得從企業(yè)角度來看也是同樣的問題。我前面想表達(dá)的意思就是,第一我們今天中國很多企業(yè)實(shí)際上并沒有準(zhǔn)備好迎接這個(gè)大數(shù)據(jù),因?yàn)槲覀儸F(xiàn)在還停留在比較初級(jí)的基礎(chǔ)數(shù)據(jù)分析時(shí)代,我們很多的基礎(chǔ)數(shù)據(jù)今天都沒有被運(yùn)用,不要說大數(shù)據(jù),就是小數(shù)據(jù)今天也沒有很好的利用。還有很多假的數(shù)據(jù),是因?yàn)閷?duì)這些數(shù)據(jù)的輸入管理非常不成熟,我自己在工作中接觸很多企業(yè),企業(yè)今天做的幾件事大家都在做,有ERP系統(tǒng),有數(shù)據(jù)庫,有了數(shù)據(jù)就往里面存,但我發(fā)覺,有很多中國企業(yè)兌現(xiàn)的數(shù)據(jù)管理沒有規(guī)范化的感覺,更沒有很好的利用。這就存在這樣的擔(dān)心:最后大數(shù)據(jù)時(shí)代來了以后,我們本來中國企業(yè)在這個(gè)數(shù)據(jù)分析的利用上就不擅長,今天有了大數(shù)據(jù)以后差距會(huì)變得更大,以后國際巨頭有一個(gè)成熟的數(shù)據(jù)分析方法,很多健全的商業(yè)模式,它會(huì)把這個(gè)差距變得越來越大。
6 在大數(shù)據(jù)時(shí)代,下一個(gè)預(yù)言會(huì)是什么,下一個(gè)判斷會(huì)是什么?
維克托:接下來怎么能讓生活比現(xiàn)在更高效,就是要讓城市變得更加智能,這是可行的,為什么?我強(qiáng)調(diào)的是,我們有可能改善我們的公共衛(wèi)生,改善教育,我們有能力收集數(shù)據(jù),公共交通的通化能真正滿足市民的需求,而不只是政客,而且能源消耗也會(huì)得到更好的檢測、預(yù)測和管理,這樣我們的城市就會(huì)更加智能,讓城市的生活更加好。在150年前,曾有預(yù)測如果是在城市生活,壽命會(huì)更短;在農(nóng)村生活則壽命長。而150年之后的今天,壽命更加長了,有了大數(shù)據(jù)我們會(huì)更加美好,可是有一個(gè)條件,就是那些決策者,他們一定要使用這些數(shù)字才可以。
下一步是專家怎么來做。其實(shí)這涉及到在數(shù)據(jù)時(shí)代,數(shù)據(jù)點(diǎn)是有限的,那么我們收集的數(shù)據(jù),只要我們收集足夠的數(shù)據(jù)來解決問題就可以了。因?yàn)榉浅?fù)雜、數(shù)據(jù)點(diǎn)非常少,所以我們的數(shù)據(jù)點(diǎn)收集起來必須是要高質(zhì)量的,現(xiàn)在不是這樣的,現(xiàn)在的是更加的多、更加的亂。解釋一下什么叫更多更亂,更多就是有數(shù)據(jù)點(diǎn),關(guān)于我們想要研究的一個(gè)現(xiàn)象,我們可以更多的進(jìn)行數(shù)據(jù)統(tǒng)計(jì),比如在美國,你有DNA基因圖譜,那么只要2000美金就可以知道你的整個(gè)基因圖譜當(dāng)中的30億這個(gè)東西是怎么組成的,這樣你就可以知道那些30億個(gè)精對(duì),現(xiàn)在如果說有一個(gè)基因組成可能會(huì)導(dǎo)致什么樣的癌癥,就可以查基因圖譜,說我是不容易生這個(gè)病的,這是為什么可以預(yù)測是否患癌癥的原因。那么有更多的數(shù)據(jù)便會(huì)存在一定的不準(zhǔn)確性,所以,我說更多且更亂,所以這里允許一點(diǎn)點(diǎn)的不準(zhǔn)確,或者可以亂一點(diǎn),這個(gè)所謂的亂就是指,不是說每一個(gè)數(shù)據(jù)點(diǎn)都要達(dá)到最高的準(zhǔn)確度,這個(gè)結(jié)果就是,不是百分之一百完美,但在大數(shù)據(jù)這樣一種方向,或者說,我們?cè)谡_的數(shù)據(jù)點(diǎn)上要知道一個(gè)方向。知道方向比晚一點(diǎn)知道完美的數(shù)據(jù)更有效。比如交通預(yù)測,也許當(dāng)下看到的交通預(yù)測比實(shí)際運(yùn)用中要晚了20分鐘,可能看起來太晚了,但如果這是預(yù)測一個(gè)星期的信息,就夠了。
王曉陽:大數(shù)據(jù)時(shí)代對(duì)我們這個(gè)城市更加理解,所謂的理解就是你知道這個(gè)城市里發(fā)生了什么,這非常重要。在以前,這個(gè)城市的管理都是一拍腦袋,有的時(shí)候拍腦袋拍出很好的來,拍腦袋也能拍出非常棒的一個(gè)城市來,但是有的時(shí)候呢?拍腦袋可能太離譜,這種情況下在大數(shù)據(jù)時(shí)代我們?cè)趺礃永煤?,就是我們所講的。而為了政績也可以用大數(shù)據(jù)來考慮,說這個(gè)數(shù)字到底對(duì)它的政績有沒有好處?就是名義是一個(gè)很大的方面,大數(shù)據(jù)方面不光是理解我們這個(gè)城市發(fā)生了什么,而且還能了解我們城市里的民眾在想什么?這點(diǎn)對(duì)城市管理來說非常重要,城市不光是一個(gè)硬件設(shè)施,不光是地鐵和高樓,人在里面非常重要。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘龌蚴窃诼殘稣媾R崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競爭力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11