99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展李德毅:大數(shù)據(jù)突破點在于聚類
李德毅:大數(shù)據(jù)突破點在于聚類
2015-04-10
收藏

李德毅:大數(shù)據(jù)突破點在于聚類


2015年4月9日,第三屆中國電子信息博覽會在深圳召開。工業(yè)和信息化部電子信息司司長刁石京主持開展了新一代信息技術(shù)產(chǎn)業(yè)發(fā)展高峰論壇。中國工程院院士李德毅發(fā)表了主題為“大數(shù)據(jù)認(rèn)知”的演講,對大數(shù)據(jù)的發(fā)展前景做出了展望。

人類社會文明已經(jīng)進入到了數(shù)據(jù)密集型的新時代,大數(shù)據(jù)已經(jīng)成為重要的資產(chǎn)。在李德毅看來,大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù),它反映的是網(wǎng)絡(luò)時代的一種客觀存在。而數(shù)據(jù)數(shù)量巨大,價值密度低,實時在線,多源異構(gòu),給人們的認(rèn)知造成了很大的困擾。

李德毅認(rèn)為, 人類的認(rèn)知科學(xué)要想有所突破,首先就要在大數(shù)據(jù)聚類上去的突破,聚類是挖掘大數(shù)據(jù)資產(chǎn)價值的第一步。這種聚類是跨學(xué)科、跨領(lǐng)域、跨媒體的,并且已經(jīng)成為許多行業(yè)的核心競爭力。人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化,但特定的情境下的認(rèn)知能力是否可以先局部地形式化。

智能機器人是物聯(lián)網(wǎng)不可或缺的端設(shè)備,一直以來都是人類關(guān)注的重點。李德毅認(rèn)為,機器人既使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動者,機器人是大數(shù)據(jù)的認(rèn)知的典型代表。人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化,但特定的情境下的認(rèn)知能力是否可以先局部地形式化,而機器人就是人類的思維移植。

以下為李德毅演講全文:

尊敬的懷部長,各位來賓,女士們,先生們,我匯報的主題是大數(shù)據(jù)認(rèn)知,云計算、大數(shù)據(jù)、認(rèn)知,大家知道認(rèn)知是現(xiàn)在全球都感興趣的話題。所謂認(rèn)知,就是怎么樣獲取知識和技能的能力,所以我的第一個小標(biāo)題是講一下認(rèn)知。

大數(shù)據(jù)標(biāo)志著一個新時代的到來,這個時代的特征不只是追求豐富的物質(zhì)資源,也不只是無所不在的互聯(lián)網(wǎng)帶來的方便的多樣化信息服務(wù),同時還包含區(qū)別于物質(zhì)的數(shù)據(jù)資源的價值發(fā)現(xiàn)和價值轉(zhuǎn)換,以及由大數(shù)據(jù)帶來的精神和文化方面的嶄新現(xiàn)象。

大數(shù)據(jù)來源于人類的測量、記錄和分析世界的渴望和無盡的追求。隨著信息技術(shù),尤其是傳感器、通信、計算機和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,人類獲取數(shù)據(jù)的手段越來越多,速度大大加快、成本急劇降低,層次和尺度更為精細(xì),揭示自然現(xiàn)象和社會現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,這樣一來,大數(shù)據(jù)成為網(wǎng)絡(luò)時代人類社會的重要資產(chǎn)。

我想說一個觀點,大數(shù)據(jù)本身既不是科學(xué),也不是技術(shù),我個人認(rèn)為,它反映的是網(wǎng)絡(luò)時代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以三個數(shù)量級的階梯迅速增長,是用傳統(tǒng)工具難以認(rèn)知的,具有更大挑戰(zhàn)的數(shù)據(jù)。

數(shù)據(jù)量巨大,價值密度低,實時在線,多源異構(gòu),怎么辦?舉個例子吧!聚類,物以類聚,人以群分,這是人類幾千年來認(rèn)識世界和社會的基本能力,是從大數(shù)據(jù)中發(fā)現(xiàn)價值必須面對的一個普遍性、基礎(chǔ)性問題,是認(rèn)知科學(xué)作為學(xué)科的學(xué)科,要解決的首要問題。無論是政治、經(jīng)濟、文學(xué)、歷史、社會、文化、還是數(shù)理、化工、醫(yī)農(nóng)、交通、地理、各行各業(yè)的大數(shù)據(jù)或宏觀或微觀的任何價值發(fā)現(xiàn)。

2008年XX??橇艘黄恼拢藗儗π?biāo)題關(guān)注不夠,這個小標(biāo)題講的PB時代的科學(xué)怎么做。大數(shù)據(jù)分析和挖掘的首要任務(wù)是聚類,這種聚類是跨學(xué)科、跨領(lǐng)域、跨媒體的。

聚類的挑戰(zhàn)性很多,有人是并行計算等等,我不細(xì)講了。我想說的是大數(shù)據(jù)聚類表現(xiàn)形態(tài)。

我想用幾個例子來講一講,人類走過了幾千年的實驗科學(xué)、幾百年的理論科學(xué),保險是一個很傳統(tǒng)的行業(yè),基于概念評估的生意,保險公司對車險客戶是這樣聚類的:A類連續(xù)兩年沒有出車禍的,B類,最近一年沒有出車禍的,C類過去一年出了一次車禍的,D類過去一年出了兩此及以上車禍的。我從機場到深圳來,你坐飛機從北京到深圳,保險公司給你付了,我一了解,這個保險是20塊錢,這個保險公司買了你三個大數(shù)據(jù),身份證,還有你的手機號,各位企業(yè)、各位領(lǐng)導(dǎo),各位老百姓,你們想一想。

物聯(lián)網(wǎng)時代,當(dāng)汽車成為輪式機器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個大數(shù)據(jù)發(fā)生體,每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會記錄在岸,利用大數(shù)據(jù)聚類,保險公司可對一個車況好、駕駛習(xí)慣好、常走線路事故率低,不勤開車的特定客戶,給予更大的優(yōu)惠,而對風(fēng)險太高的客戶報高價甚至拒絕,例如出租車司機跑的比老百姓多得多,總之能夠給出包括保險費支付方式在內(nèi)的個性化解決方案,這就顛覆了保險公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類成為保險公司的核心競爭力,我擴張一下,就是大數(shù)據(jù)聚類成為很多行業(yè)的核心競爭力。

非大數(shù)據(jù)時代,做一個人臉的識別,我們可以提取它十個特征,第二類先結(jié)構(gòu)化存起來,你想一想,如果十個特征都一樣的話,兩個人是不是同一個人呢?當(dāng)然,這也是不可能的,但是我們再想一想,人類智能來看,它忽略了什么呢?我認(rèn)為它忽略了太多,這種人臉識別僅僅是幾何結(jié)構(gòu)的聚類,落入集合學(xué)框架,忽略了聚類的不確定性,忽略了聚類的多樣性等等。

再舉個例子,大數(shù)據(jù)寫詩,人們熟讀眾多詩詞,記住了針對各種意境的大量字串。例如說李白一生寫詩1010首,把他所有詩句進行機械切割。李白給毛主席誕辰100周年寫一首詩,就是這樣。

大數(shù)據(jù)對形式化方法的挑戰(zhàn)是非常嚴(yán)峻的,在數(shù)據(jù)密集型的網(wǎng)絡(luò)時代,任何傳統(tǒng)學(xué)科,或者傳統(tǒng)的行業(yè),它的公理、原理和定理組成的語境,遇到互聯(lián)網(wǎng)+的挑戰(zhàn)之后,這樣一來,傳統(tǒng)的學(xué)科行業(yè),或者是交叉學(xué)科,成為一個大數(shù)據(jù)、小模型、小定律、交叉學(xué)科的時代,模型和程序要圍繞數(shù)據(jù)轉(zhuǎn)。

創(chuàng)新,表示在創(chuàng)造一個新的語境,新的坐標(biāo)系,在這個坐標(biāo)系下研究大數(shù)據(jù),在互聯(lián)網(wǎng)情況下,如何創(chuàng)造你新的坐標(biāo)系,新的語境,否則難以有新的發(fā)現(xiàn)。

實踐中的研究,由下而上要深入,數(shù)據(jù)要勝過程序,價值要勝過知識,關(guān)聯(lián)要勝過因果,更多要關(guān)注有意義的小眾,把這些小眾累積起來才成為大眾。

通過大數(shù)據(jù)聚類即時發(fā)現(xiàn)價值,要充分認(rèn)識大數(shù)據(jù)中的不確定性和價值的隱蔽性。

機器人如何認(rèn)知是我講的第二個問題,這七個字,可以有兩種劃分,一種是機器人如何認(rèn)知,你要把這個弄清楚,我覺得實際上是在弄這個,機器人在想,人如何認(rèn)知,智能機器人是集新材料、新工藝、新能源、機械、電子、移動通信、全球定位導(dǎo)航、移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、自動化、人工智能、認(rèn)知科學(xué)、乃至人文藝術(shù)等多個學(xué)科、多種技術(shù)于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設(shè)備,是人類社會走向智慧生活的重要伴侶。

機器人既是使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動者,機器人是大數(shù)據(jù)的認(rèn)知的典型代表,機器人時代真的來了,我們希望我們以后的黃牛退休、鐵牛耕地,這個鐵牛就是機器人,農(nóng)民進城,機器人耕地,醫(yī)療與健康機器人,服務(wù)機器人更是上上下下,當(dāng)然還有太空機器人等。

我先講一下服務(wù)機器人,高考機器人,就是由知識的碎片化,大數(shù)據(jù)來認(rèn)知,就說明我們的教育不能光是填知識,我們現(xiàn)在做一個報告,我們可以用機器人來撰稿,機器人導(dǎo)航,機器人手術(shù)等。

如果語言、文本、歌曲、劇本,都可以用虛擬機器人,訓(xùn)練他的形象、情感、動作、語音、語調(diào)、風(fēng)格,利用大數(shù)據(jù),發(fā)出新的歌聲。

機器人革命是世界性的、時代性的,機器人換人首先不是換掉理發(fā)師之類的勞動者,而可能是產(chǎn)業(yè)工人、文秘人員、醫(yī)生、服務(wù)員、甚至士兵,他們將升級轉(zhuǎn)型成為機器人的創(chuàng)造者和使用者,成為懂得集成、維修、管理機器人的專業(yè)人才??缃鐫B透和跨界創(chuàng)新誕生的智能制造也是我國抓住歷史機遇的又一次崛起。

我想做一個可穿戴設(shè)備的案例,如果你能做一個人和人的衣服,動力驅(qū)動,研制一個可穿戴的機械,幫助負(fù)重、助行、轉(zhuǎn)體、條約的話,不僅可以讓機器人站起來走路,還可以讓特種兵成為飛人、超人。

這就是這樣一些機器人,可穿戴的外部增強的機器人,這是我想做的家庭服務(wù)機器人,今天企業(yè)家很多,我在這投一個標(biāo),我想做這邊這一個機器人,誰能做下面的輪子,從餐廳到臥室,從臥室到書房,希望大家有興趣能夠談一談。

機器人還將進一步刮起穿戴風(fēng),蘋果做了手表,這個手表里面有一個檢查老年癡呆的,蘋果發(fā)表了5個APP商家,啟動全新醫(yī)療應(yīng)用,我們想一想,如果有一天讓手機或者手表成為醫(yī)療診斷的工具,成為用于慢性管理的醫(yī)患視頻互動平臺,成為醫(yī)療互聯(lián)網(wǎng)個人健康與醫(yī)療的數(shù)據(jù)發(fā)生器,成為遠(yuǎn)程診療的開始,成為某種流行病的社會調(diào)查,成為病友社交網(wǎng)絡(luò),甚至?xí)嵏矀鹘y(tǒng)看病模式,顛覆傳統(tǒng)醫(yī)學(xué)研究。

生物機器人遐想,我們?nèi)说南胂笾校?/span>生命的多種形象,如果器官移植越來越發(fā)達(dá),那么移花接木就屢見不鮮。將來,誰是誰搞不清楚了,如果這個人的臉換到另一個人的身上去,怎么界定?從定制治療到定制嬰兒,改造人類胚胎DNA,會不會避免遺傳性疾???如果將人的思維移植到機器人,那么思想是不是不朽的呢?

我現(xiàn)在想做一個東西,我想做一個機器駕駛腦。在腦科學(xué)取得重大突破前,能不能做得出來?人腦很復(fù)雜,我跟一個美國科學(xué)院士,是個華人,在科技部開的咨詢會上,他告訴我一句話,讓我很吃驚,他回答我的問題,腦里要花一個腦袋功能結(jié)構(gòu)圖,100年都畫不出,他說你看一看生命科學(xué)的書,那叫人腦的組織結(jié)構(gòu)圖,全球已經(jīng)發(fā)現(xiàn)500多種腦部疾病。

科學(xué)界正把腦科學(xué)和認(rèn)知科學(xué)作為當(dāng)前的重大研究領(lǐng)域,我們熱切期待生物腦的出現(xiàn)。

難道認(rèn)知科學(xué)就是研究生物腦的自然屬性嗎?怎樣把社會屬性研究進去呢?我提出來要研究文字、文明和傳承,我們各種高端生物都會有語言、文字的,因為有了文字,才有了文明。要研究腦認(rèn)知的后天屬性,研究腦發(fā)育、可塑性與自然環(huán)境的關(guān)系,認(rèn)知也是后天學(xué)習(xí)和積累的結(jié)果,是與社會環(huán)境、社會實踐、群體交互等密切相關(guān)的,要建立人腦認(rèn)知的成長機制:如何創(chuàng)建神經(jīng)元之間新的連接和新的認(rèn)知。

我們想一下,人的智能,除了記憶之外,在學(xué)習(xí)和思維上,到底有什么能耐?客觀地說,或者概括地說,一個是邏輯思維,一個是形象思維,形象思維最主要的是兩個,一個是類比,一個是聯(lián)想,主要解決的是圖象。

因此我的技術(shù)觀點是如果人腦的認(rèn)知能力不能夠全部、完整、統(tǒng)一地形式化、但特定的情境下的認(rèn)知能力是否可以先局部地形式化,例如算術(shù)運算、簡單游戲、博弈、定點開車等。

就在此時此刻,美國的一個汽車公司,真的從洛杉磯往紐約開,他要開5000多公里。我們有很多攝像頭,還有汽車本身的運動參數(shù),再一個就是我們的導(dǎo)航地圖,還有雷達(dá)傳感器,我們利用一次規(guī)劃,和駕駛地圖,形成一個初位化。我們認(rèn)為,我們的駕駛腦主要涵蓋了人腦關(guān)于駕駛行為的主要功能,長期記憶、短期記憶,還有瞬間記憶,就是感覺記憶,從感知到認(rèn)知,到行動。我今天在博覽會上找了好幾個廠家,希望跟他們合作,X1芯片,我們能不能做出我們自己的XPA,讓我們的汽車工業(yè)在智能時代到來中不錯失又一次機遇。謝謝大家!

中國腦計劃馬上要啟動了,我個人認(rèn)為是要將三項研究同步進行,因為大數(shù)據(jù)三化來認(rèn)識腦袋,保護腦,模擬腦,謝謝!

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }