99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù)時(shí)代:技術(shù)有效性比科學(xué)完整性更重要
大數(shù)據(jù)時(shí)代:技術(shù)有效性比科學(xué)完整性更重要
2016-02-21
收藏

大數(shù)據(jù)時(shí)代:技術(shù)有效性比科學(xué)完整性更重要

自從大數(shù)據(jù)引入了人們的視線之后,人們普遍講的是三個(gè)字“大數(shù)據(jù)”。但是忽略了《自然》雜志的副標(biāo)題——它講的是PB時(shí)代的科學(xué)。本質(zhì)上大數(shù)據(jù)的挑戰(zhàn)是PB時(shí)代的科學(xué)的挑戰(zhàn)。在這么一個(gè)大數(shù)據(jù)時(shí)代怎么做數(shù)據(jù)挖掘呢?

《自然》雜志的副標(biāo)題——它講的是PB時(shí)代的科學(xué)

《自然》雜志的副標(biāo)題——它講的是PB時(shí)代的科學(xué)

人們用很多的V來形容大數(shù)據(jù),其實(shí)大數(shù)據(jù)的主要來源有三個(gè)方面,

第一:是這個(gè)地球,自然界的大數(shù)據(jù),這么多的衛(wèi)星繞著地球轉(zhuǎn),我們看看每天要下載多少數(shù)據(jù)量?

第二:生命大數(shù)據(jù)、生物大數(shù)據(jù),尤其是每一個(gè)人體的大數(shù)據(jù)也是一個(gè)重要的來源。

第三:社交大數(shù)據(jù):對(duì)于我們IT工作者來說,我們更關(guān)心的是社交大數(shù)據(jù),每天你拿著手機(jī)、拿著筆記本來回折騰了半天,這些數(shù)據(jù)對(duì)你起作用了嗎?

大數(shù)據(jù)的主要來源有三個(gè)方面

大數(shù)據(jù)的主要來源有三個(gè)方面



PB時(shí)代對(duì)科學(xué)的挑戰(zhàn)更是對(duì)包括數(shù)據(jù)挖掘在內(nèi)的認(rèn)知科學(xué)的挑戰(zhàn)。奧巴馬就職演說當(dāng)中,每一個(gè)人后面都有大數(shù)據(jù)的支撐,我點(diǎn)到誰,你就能告訴我他的大數(shù)據(jù)嗎?一個(gè)人,一個(gè)社會(huì)的活動(dòng)人非常了不起,他有他的身份、情感、職業(yè)、年齡、性格等等,假如現(xiàn)在給你一張全家福,你能不能從他們的人臉識(shí)別當(dāng)中告訴我誰是兒媳婦、誰是女婿?

PB時(shí)代對(duì)科學(xué)的挑戰(zhàn)更是對(duì)包括<a href='/map/shujuwajue/' style='color:#000;font-size:inherit;'>數(shù)據(jù)挖掘</a>在內(nèi)的認(rèn)知科學(xué)的挑戰(zhàn)。

PB時(shí)代對(duì)科學(xué)的挑戰(zhàn)更是對(duì)包括數(shù)據(jù)挖掘在內(nèi)的認(rèn)知科學(xué)的挑戰(zhàn)。

這么多人臉下,怎么把人臉識(shí)別清楚呢?現(xiàn)在我們北京市有80萬個(gè)攝像頭,每天照著我們大家,我們可以利用攝像頭做身份認(rèn)證、年齡識(shí)別、情感計(jì)算、親緣發(fā)現(xiàn)、心理識(shí)別、地區(qū)識(shí)別、民族識(shí)別,都很有用處。這種流媒體主要的形態(tài)是非結(jié)構(gòu)化的,特征之間的關(guān)聯(lián)關(guān)系、設(shè)備算法的準(zhǔn)確率等等,都嚴(yán)重的制約著大數(shù)據(jù)人臉挖掘的進(jìn)度。

由技術(shù)推動(dòng)的計(jì)算機(jī)發(fā)展

那么怎么辦?我們還是要回歸一下計(jì)算機(jī)所發(fā)展的歷史,1936年天才數(shù)學(xué)家圖靈提出來一個(gè)圖靈模型,后來有一個(gè)計(jì)算機(jī),把圖靈模型轉(zhuǎn)化為物理計(jì)算機(jī),有三大塊,一塊叫做CPU,操作系統(tǒng),還有一大塊叫做內(nèi)存和外存,還有一塊就是輸入和輸出。

把圖靈模型轉(zhuǎn)化為物理計(jì)算機(jī),有三大塊,一塊叫做CPU,操作系統(tǒng),還有一大塊叫做內(nèi)存和外存,還有一塊就是輸入和輸出

把圖靈模型轉(zhuǎn)化為物理計(jì)算機(jī),有三大塊,一塊叫做CPU,操作系統(tǒng),還有一大塊叫做內(nèi)存和外存,還有一塊就是輸入和輸出

在計(jì)算機(jī)發(fā)展的頭一個(gè)30年里,我們感興趣最多的是CPU、是操作系統(tǒng),是軟件、是中間件、是應(yīng)用軟件。這時(shí)候代表信息技術(shù)發(fā)展速度的可以用摩爾速度來表示,它告訴我們微電子發(fā)展是18個(gè)月可以翻一番的,所以我們側(cè)重于計(jì)算性能的提高,我們把這個(gè)時(shí)代叫做計(jì)算時(shí)代,計(jì)算,尤其是高性能計(jì)算機(jī),人們花了很大的精力研究,它帶動(dòng)了存儲(chǔ),也帶動(dòng)了輸入輸出,這個(gè)時(shí)間大概用了三四十年。計(jì)算領(lǐng)先、存儲(chǔ)交互也跟著發(fā)展。

在這樣一個(gè)計(jì)算領(lǐng)先當(dāng)中,我們主要做的是結(jié)構(gòu)化數(shù)據(jù)的挖掘,我們要提起一個(gè)偉大的學(xué)者,他的名字叫埃德加,他在1970年提出一個(gè)關(guān)系模型,用二維表形式表示實(shí)體與實(shí)體間的聯(lián)系。

埃德加在1970年提出一個(gè)關(guān)系模型,用二維表形式表示實(shí)體與實(shí)體間的聯(lián)系。

埃德加在1970年提出一個(gè)關(guān)系模型,用二維表形式表示實(shí)體與實(shí)體間的聯(lián)系。



三四十年來,各行各業(yè)的數(shù)據(jù)庫和數(shù)據(jù)倉庫技術(shù),以及從數(shù)據(jù)庫發(fā)現(xiàn)知識(shí)的數(shù)據(jù)挖掘成為巨大的信息產(chǎn)業(yè)。關(guān)于數(shù)據(jù)庫之父,美國工程院院士獲獎(jiǎng)了1981年的圖靈獎(jiǎng),他這篇論文是1970年寫的,講的是共享數(shù)據(jù)銀行的關(guān)系模型。關(guān)系數(shù)據(jù)庫有嚴(yán)格的頂層設(shè)計(jì),為構(gòu)造良式關(guān)系,必須消除元組中不合適的依據(jù)依賴,通過第三范式、第四范式、甚至更多的范式分解數(shù)據(jù)表以階級(jí)數(shù)據(jù)冗余、異常等問題。我們每一個(gè)IT計(jì)算機(jī)本科生都學(xué)過這樣的技術(shù),對(duì)這樣的關(guān)系運(yùn)算,結(jié)果仍然是關(guān)系。

數(shù)據(jù)庫之父,美國工程院院士獲獎(jiǎng)了1981年的圖靈獎(jiǎng),他這篇論文是1970年寫的,講的是共享數(shù)據(jù)銀行的關(guān)系模型。

只要數(shù)據(jù)在關(guān)系數(shù)據(jù)庫中,總可以通過SQL語言,將結(jié)果輸出,這就是Edgar的偉大之處。
 
關(guān)系代數(shù)是關(guān)系數(shù)據(jù)庫的形式化理論和約束,先有頂層設(shè)計(jì)和數(shù)據(jù)結(jié)構(gòu),后填入清洗后的數(shù)據(jù)。數(shù)據(jù)圍繞結(jié)構(gòu)轉(zhuǎn),數(shù)據(jù)圍繞程序轉(zhuǎn)。用戶無需關(guān)心數(shù)據(jù)的獲取,存儲(chǔ)、分析以及提取過程。不再關(guān)系數(shù)據(jù)結(jié)構(gòu)的內(nèi)容和形式,唯一希望得到的是符合查詢條件的結(jié)果。通過數(shù)據(jù)挖掘,可以從數(shù)據(jù)庫中發(fā)現(xiàn)分類知識(shí)、關(guān)聯(lián)知識(shí),時(shí)序知識(shí)、異常知識(shí)等等。

隨著數(shù)據(jù)庫產(chǎn)業(yè)的膨大,人們對(duì)數(shù)據(jù)庫已經(jīng)不太滿足了,于是把Databases說成是LargeDatabases……

隨著數(shù)據(jù)庫產(chǎn)業(yè)的膨大,人們對(duì)數(shù)據(jù)庫已經(jīng)不太滿足了,于是把Databases說成是LargeDatabases……

隨著數(shù)據(jù)庫產(chǎn)業(yè)的膨大,人們對(duì)數(shù)據(jù)庫已經(jīng)不太滿足了,于是把Databases說成是LargeDatabases……

但是不管怎么大,遇到了兩個(gè)不可回避的挑戰(zhàn):第一是由于關(guān)系代數(shù)的形式化約束過于苛刻,無法表示現(xiàn)實(shí)數(shù)據(jù)怎么辦?第二個(gè)挑戰(zhàn),隨著數(shù)據(jù)量的增大,關(guān)系代數(shù)運(yùn)算性能急劇下降,如果是一個(gè)TB的關(guān)系數(shù)據(jù)庫,兩個(gè)表做一個(gè)join,要幾十個(gè)小時(shí),人們?nèi)淌懿涣?,這兩個(gè)挑戰(zhàn)就意味著心里方法的存在。就在這個(gè)時(shí)候,我們的存儲(chǔ)技術(shù)得到了迅猛發(fā)展,大家知道,存儲(chǔ)、內(nèi)存、外存、硬盤越來越普遍了,當(dāng)上海俞正聲書記提出1+TB的時(shí)候,這個(gè)錢誰來買單?現(xiàn)在我們可能都有一兩個(gè)TB,一個(gè)TB400塊錢就買到了,所以人類進(jìn)入了搜索時(shí)代。搜索因?yàn)榇鎯?chǔ)便宜了,存儲(chǔ)的速度大概每9個(gè)月翻一番,這在中國也好、全世界也好,誰能干就多干一點(diǎn)活,所以存儲(chǔ)帶動(dòng)了技術(shù)的腳步,這種搜索時(shí)代經(jīng)過了20多年,于是我們進(jìn)入了一個(gè)半結(jié)構(gòu)化數(shù)據(jù)挖掘時(shí)代。

這個(gè)時(shí)代代表人物就是萬維網(wǎng)之父Tim,請(qǐng)大家注意剛才關(guān)系代數(shù)的發(fā)明者是20后,萬維網(wǎng)之父是50后,他提出了超文本思想,開發(fā)了世界上第一個(gè)Web服務(wù)器和web客戶機(jī),于是我們可以從一臺(tái)服務(wù)器上檢索另一臺(tái)服務(wù)器的內(nèi)容,服務(wù)器在軟件支持下可發(fā)布包括文本、表格、圖片、音視頻的碎片化超媒體信息。

萬維網(wǎng)之父Tim

萬維網(wǎng)之父Tim

因此,客戶端服務(wù)器結(jié)構(gòu)和云計(jì)算結(jié)構(gòu)蓬勃產(chǎn)生,在這時(shí)候我們已經(jīng)沒有了關(guān)于代數(shù)那樣嚴(yán)格的形式化約束,依靠的主要是規(guī)范、標(biāo)準(zhǔn),所有媒體均以實(shí)體形式存在,甚至是軟件,實(shí)體通過超鏈接產(chǎn)生聯(lián)系。



形式化理論比關(guān)系代數(shù)寬松了許多,創(chuàng)建了靈活多樣的實(shí)體,這時(shí)候數(shù)據(jù)開始圍繞實(shí)體轉(zhuǎn),實(shí)體圍繞鏈接轉(zhuǎn)。挖掘就是在云計(jì)算環(huán)境下搜索和個(gè)性化服務(wù),沒有死板的查詢方式,也不是唯一結(jié)果,允許帶有不確定性,重視搜索的統(tǒng)計(jì)性質(zhì)。各種各樣的關(guān)鍵字搜索引擎,語音、圖片、視頻搜索引擎在互聯(lián)網(wǎng)上出現(xiàn)了繁榮的內(nèi)容服務(wù)。隨著這些服務(wù)的普及,又遇到了新的挑戰(zhàn),千人一面的搜索服務(wù)受到了質(zhì)疑,如果同一個(gè)人問同一問題它不可改變,當(dāng)一萬個(gè)人再問的時(shí)候,它可能有所改變,人們覺得這個(gè)還不好。

大數(shù)據(jù)時(shí)代技術(shù)的有效性要比科學(xué)的完整性更為重要

水不轉(zhuǎn),云在轉(zhuǎn)。這是我報(bào)告的第二條。
 
隨著互聯(lián)網(wǎng)貸款6個(gè)月翻一番的速度,它比9個(gè)月翻一番、18個(gè)月翻一番要快,你的帶寬有能耐就多起點(diǎn)作用,于是人類進(jìn)入了交互時(shí)代,交互帶動(dòng)著計(jì)算和存儲(chǔ)。

水不轉(zhuǎn),人在轉(zhuǎn)。移動(dòng)互聯(lián)網(wǎng)時(shí)代的大數(shù)據(jù)挖掘主要是網(wǎng)絡(luò)化環(huán)境下的非結(jié)構(gòu)化數(shù)據(jù)挖掘,這些數(shù)據(jù)形態(tài)反映的是帶毛的、鮮活的、碎片化了的、異構(gòu)的、有情感的原生態(tài)數(shù)據(jù)。

這種非結(jié)構(gòu)化數(shù)據(jù)有什么特點(diǎn)呢?它常常是低價(jià)值、強(qiáng)噪聲、異構(gòu)、冗余的而且是冰冷的數(shù)據(jù),有很多數(shù)據(jù)放在存儲(chǔ)器里一輩子沒再用過。數(shù)據(jù)的形式化約束越來越寬松,越來越接近互聯(lián)網(wǎng)文化、窗口文化和社區(qū)文化,我們現(xiàn)在的青年人不要學(xué)什么東西,只要會(huì)玩手機(jī),越玩越熟悉,因?yàn)樗呀?jīng)進(jìn)入這個(gè)文化之中。

關(guān)注的對(duì)象也發(fā)生很大改變,挖掘關(guān)注的首先是小眾,只有滿足小眾挖掘需求,才談得上滿足更多小眾組成的大眾的需求,因此一個(gè)重要思想,就是由下而上勝過由上而下的頂層設(shè)計(jì),強(qiáng)調(diào)挖掘數(shù)據(jù)的真實(shí)性、及時(shí)性,要發(fā)現(xiàn)關(guān)聯(lián)、發(fā)現(xiàn)異常、發(fā)現(xiàn)趨勢,總之要發(fā)現(xiàn)價(jià)值,但是它未必注重因果、未必注重主次、未必注重時(shí)序,更未必發(fā)現(xiàn)普遍的知識(shí)。

移動(dòng)互聯(lián)網(wǎng)時(shí)代的大數(shù)據(jù)挖掘過程當(dāng)中,數(shù)據(jù)的簡約具有自適應(yīng)性,不必具有固定特征或者層次。許多年來,我的課題組提出一個(gè)方法,叫認(rèn)知物理學(xué)方法,用物理學(xué)場的方法類比形成數(shù)據(jù)場。

許多年來,我的課題組提出一個(gè)方法,叫認(rèn)知物理學(xué)方法,用物理學(xué)場的方法類比形成數(shù)據(jù)場。

對(duì)128×128的象素組成的人臉,如果他們的數(shù)據(jù)場是等價(jià)的話,我們可以用28個(gè)特征點(diǎn)數(shù)據(jù)來等價(jià)這個(gè)流媒體數(shù)據(jù)。對(duì)另外一張人臉,它可以變成254個(gè)數(shù)據(jù)、59個(gè)數(shù)據(jù),這是非常不同于結(jié)構(gòu)化、半結(jié)構(gòu)化的。

對(duì)另外一張人臉,它可以變成254個(gè)數(shù)據(jù)、59個(gè)數(shù)據(jù),這是非常不同于結(jié)構(gòu)化、半結(jié)構(gòu)化的。

當(dāng)前,深度學(xué)習(xí)也是一種數(shù)據(jù)自適應(yīng)簡約,百度人工智能建設(shè)院的吳教授他們就開展了這方面的研究。

<a href='/map/shenduxuexi/' style='color:#000;font-size:inherit;'>深度學(xué)習(xí)</a>也是一種數(shù)據(jù)自適應(yīng)簡約

深度學(xué)習(xí)也是一種數(shù)據(jù)自適應(yīng)簡約



如果我們?cè)诎俣壬嫌?a href='/map/shenduxuexi/' style='color:#000;font-size:inherit;'>深度學(xué)習(xí)搜索一個(gè)人臉象素搜索,這么多人臉誰是誰?是他嗎?數(shù)據(jù)量急劇增加,各種媒體形態(tài)可隨意碎片化,組織結(jié)構(gòu)和挖掘程序要圍著數(shù)據(jù)轉(zhuǎn),程序要碎片化,并可以隨時(shí)虛擬重組,挖掘常常是人機(jī)交互環(huán)境下不同社區(qū)的發(fā)現(xiàn)以及社區(qū)中形成的群體智能,在非結(jié)構(gòu)化數(shù)據(jù)挖掘中,會(huì)自然進(jìn)行數(shù)據(jù)清洗和逐步強(qiáng)形式化,自然形成半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù),以提高數(shù)據(jù)使用效率。

用<a href='/map/shenduxuexi/' style='color:#000;font-size:inherit;'>深度學(xué)習(xí)</a>搜索一個(gè)人臉象素搜索,這么多人臉誰是誰?是他嗎?

深度學(xué)習(xí)搜索一個(gè)人臉象素搜索,這么多人臉誰是誰?是他嗎?

因此我們用網(wǎng)絡(luò)化的大數(shù)據(jù)挖掘方法,首先要是在這個(gè)復(fù)雜的人人都連網(wǎng)的情況之下找到一個(gè)特定問題的社區(qū),因此由社區(qū)發(fā)現(xiàn)成為大數(shù)據(jù)發(fā)展的首要問題,要研究社區(qū)成員,就必須要研究他們之間的相連關(guān)系,要研究他們的交互形態(tài),顯現(xiàn)的形態(tài)有評(píng)論、心情、收藏、購買、評(píng)分、頂踩、分享、轉(zhuǎn)載、加為好友、邀請(qǐng)等等,這些統(tǒng)計(jì)數(shù)據(jù)都成為我們挖掘的基礎(chǔ)。隱形形態(tài)有跳轉(zhuǎn)、瀏覽、翻頁、收聽、觀看、聊天、點(diǎn)擊、取消、會(huì)話中斷、黑名單等等。

社區(qū)中的交互

社區(qū)中的交互

交互的特點(diǎn)可以從頻繁性、增量性、主動(dòng)性、廣泛性、多樣性、持久性去研究社區(qū)成員的連接強(qiáng)度。我們利用拓?fù)鋭莘椒ㄍ诰蛏鐓^(qū),我們還要發(fā)現(xiàn)在一個(gè)社區(qū)中,誰是一個(gè)領(lǐng)頭羊,誰是第二個(gè)領(lǐng)頭羊,成員的角色和重要性,成員之間的關(guān)系等等。

利用拓?fù)鋭莘椒ㄍ诰蛏鐓^(qū)

利用拓?fù)鋭莘椒ㄍ诰蛏鐓^(qū)



在現(xiàn)實(shí)生活中,人類的某個(gè)概念,或者世界的認(rèn)知經(jīng)過一段時(shí)間的反復(fù)交互、匯聚、修正、演化,群體形成趨于相對(duì)穩(wěn)定的共識(shí)。合作編輯下的維基條目,社會(huì)化標(biāo)注等都是這種過程中的生動(dòng)再現(xiàn)。

用拓?fù)鋭莘椒òl(fā)現(xiàn)社區(qū)成員的重要性

用拓?fù)鋭莘椒òl(fā)現(xiàn)社區(qū)成員的重要性

群體智能是一個(gè)最近說得越來越多的詞,大家知道我們?cè)?jīng)在計(jì)算機(jī)上做一個(gè)圖靈測試,讓計(jì)算機(jī)區(qū)分哪些碼是人產(chǎn)生的,哪些是機(jī)器產(chǎn)生的,這是卡內(nèi)基美隆大學(xué)提出來的,在網(wǎng)絡(luò)購物、登錄網(wǎng)站、申請(qǐng)網(wǎng)站時(shí)都會(huì)碰到適配碼被使用。

區(qū)分計(jì)算機(jī)和人的全自動(dòng)公共圖靈測試(CAPTCHA)還能維持多久?

這里我要提到第三個(gè)代表人物,他叫路易斯,他提出用這個(gè)適配碼應(yīng)用方式。這里面我提出另一個(gè)代表人物,70后,1979年出生,路易斯提出能不能把129年的報(bào)紙掃描,把圖片碎片化,變成檢驗(yàn)碼,讓大家去識(shí)別,這樣一來,如果每天有兩億個(gè)檢驗(yàn)碼,從而一下子就把129年的紐約時(shí)報(bào)實(shí)現(xiàn)數(shù)字化,這就是群體智能。有些事情計(jì)算機(jī)做得很好,人做不好,有些事情人做得很好,很簡單,計(jì)算機(jī)做不好,怎樣把這兩個(gè)優(yōu)勢加在一起呢?于是就有了群體智能。

人參與的<a href='/map/shujuwajue/' style='color:#000;font-size:inherit;'>數(shù)據(jù)挖掘</a>

人參與的數(shù)據(jù)挖掘

所以云計(jì)算支撐大數(shù)據(jù)挖掘要發(fā)現(xiàn)價(jià)值的話,我們認(rèn)為云計(jì)算本來就是基于互聯(lián)網(wǎng)的大眾參與計(jì)算模式,其計(jì)算資源是動(dòng)態(tài)的,可收縮的,被虛擬化的,而且以服務(wù)的方式提供。產(chǎn)生擺脫了傳統(tǒng)的胖配置帶來的系統(tǒng)升級(jí)開柙,更加簡潔、更加靈活多樣、個(gè)性化,手機(jī)、游戲機(jī)、數(shù)碼相機(jī)、電視機(jī)差別細(xì)微,出現(xiàn)更多iCloud產(chǎn)品,界面人性化個(gè)性化,可成為大數(shù)據(jù)挖掘的終端。

挖掘員支撐各種各樣的大數(shù)據(jù)應(yīng)用,如果我們有數(shù)據(jù)收集中心、存儲(chǔ)中心、計(jì)算中心、服務(wù)中心,一定還有數(shù)據(jù)挖掘中心,這樣一來,我們就可以實(shí)現(xiàn)支撐大數(shù)據(jù)的及時(shí)應(yīng)用和價(jià)值的及時(shí)發(fā)現(xiàn)。



云計(jì)算產(chǎn)生的眾包思想已經(jīng)被大家接受,無論是電影行業(yè),還是搜狗的輸入方法,還是攝影照片共享,還是T恤衫的設(shè)計(jì)購買,說明眾包是怎么樣完成生產(chǎn)購買的。因此我們可以設(shè)想,在互聯(lián)網(wǎng)環(huán)境下,利用人的認(rèn)知和大眾間的交互,融合計(jì)算機(jī)存儲(chǔ)對(duì)大數(shù)據(jù)挖掘,形成群體智能,這樣一來,我們提出一個(gè)新的概念,叫眾挖,大家來挖。

我們提出一個(gè)新的概念,叫眾挖,大家來挖。

我們提出一個(gè)新的概念,叫眾挖,大家來挖。

用戶無需關(guān)心數(shù)據(jù)的形態(tài),無需關(guān)心數(shù)據(jù)的獲取位置、結(jié)構(gòu)模式、存儲(chǔ)方式以及分析過程,得到的就是及時(shí)的足夠滿意的挖掘結(jié)果,MaaS,誰是挖掘時(shí)代的谷歌呢?

誰是挖掘時(shí)代的谷歌呢?

誰是挖掘時(shí)代的谷歌呢?

大數(shù)據(jù)時(shí)代技術(shù)的有效性要比科學(xué)的完整性更為重要,如果說科學(xué)是解決形而上的問題,技術(shù)是解決行而下的問題的話,我們回顧一百年來的歷史,在上世紀(jì)的后半世紀(jì),我們有了1930年的圖靈模型,1970年我們有了物理的計(jì)算機(jī),80年代,我們開始了關(guān)系數(shù)據(jù)庫和產(chǎn)業(yè),后來我們有了專家系統(tǒng),在前50年大概都是科學(xué)引領(lǐng)技術(shù)發(fā)展,科學(xué)是技術(shù)先導(dǎo)。現(xiàn)在情況發(fā)生了變化,云計(jì)算的形而上是什么呢?有人說是網(wǎng)絡(luò)科學(xué),大數(shù)據(jù)的形而上是什么呢?有人說是數(shù)據(jù)科學(xué)。

大數(shù)據(jù)時(shí)代技術(shù)的有效性要比科學(xué)的完整性更為重要

大數(shù)據(jù)時(shí)代技術(shù)的有效性要比科學(xué)的完整性更為重要



數(shù)據(jù)結(jié)構(gòu)的形式化約束由強(qiáng)到弱的演變非常明顯,70年代是強(qiáng)約束,后面的Web計(jì)算是半結(jié)構(gòu)化約束,到現(xiàn)在我們用的這些微機(jī)、手機(jī)、物聯(lián)網(wǎng)傳感器,越來越弱約束,弱到什么程度?弱到我們這個(gè)社區(qū)文化的常識(shí)就可以了,就好象說我們?cè)诔鞘欣锝煌ㄐ腥丝坑易?,這是不需要大家說的常識(shí)。

數(shù)據(jù)結(jié)構(gòu)的形式化約束由強(qiáng)到弱的演變

數(shù)據(jù)結(jié)構(gòu)的形式化約束由強(qiáng)到弱的演變

所以,我的基本結(jié)論是大數(shù)據(jù)標(biāo)志一個(gè)新時(shí)代的到來,這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無所不在的互聯(lián)網(wǎng)帶來方便的多樣化的信息服務(wù),同時(shí)還包含區(qū)別于物質(zhì)的數(shù)據(jù)資源的價(jià)值挖掘,以及價(jià)值轉(zhuǎn)換,虛擬世界的信息價(jià)值挖掘?qū)е赂泳_的控制物理世界的物質(zhì)和能量,以及由大數(shù)據(jù)挖掘帶來的精神和文化方面的嶄新現(xiàn)象。

大數(shù)據(jù)標(biāo)志一個(gè)新時(shí)代的到來

大數(shù)據(jù)標(biāo)志一個(gè)新時(shí)代的到來


于是,我們可以看一看從三四十年前的計(jì)算時(shí)代到二三十年前的搜索時(shí)代,到今天開啟的交互時(shí)代,我們依然會(huì)想起那英唱的那首歌,山不轉(zhuǎn)水轉(zhuǎn),水不轉(zhuǎn)云轉(zhuǎn),云不轉(zhuǎn)心轉(zhuǎn),再深的巷子也能走出那個(gè)天,再大的數(shù)據(jù)也能繞過那道彎,

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }