
百度首席科學(xué)家:解析人工智能和大數(shù)據(jù)
百度首席科學(xué)家吳恩達(dá)(Andrew Ng)在硅谷的百度BIG TALK大會(huì)上發(fā)表演講。吳恩達(dá)表示,深度算法將和大數(shù)據(jù)結(jié)合,使新的人工智能算法越來越好,未來人工智能虛擬圈里完成整個(gè)循環(huán)。
恩達(dá)解釋道,以前人工智能的虛擬圈,比如做一個(gè)很好的產(chǎn)品,可以得到很多很好的用戶,這些用戶可以提供很多的數(shù)據(jù)。最后,用人工智能就可以讓很多的產(chǎn)品越來越好,讓你得到越來越多的用戶,如此產(chǎn)生人工智能的良性循環(huán)。
如今,人們溝通已經(jīng)從文字轉(zhuǎn)向圖像和語音,未來這方面將有很大機(jī)會(huì)。百度為此正在經(jīng)歷改變。吳恩達(dá)認(rèn)為這個(gè)給百度帶來了新的機(jī)會(huì)。不過,這些都需要電腦理解圖像基礎(chǔ)上進(jìn)行,而百度是第一個(gè)用神經(jīng)網(wǎng)絡(luò)技術(shù)寫的。
吳恩達(dá)指出,電腦視覺是深度學(xué)習(xí)帶來的革命。百度已經(jīng)建立了有效的深度學(xué)習(xí)的算法,改變整個(gè)人工智能的方法。而百度為什么能夠?qū)崿F(xiàn)深度學(xué)習(xí),吳恩達(dá)給出了自己答案,就是百度擁有強(qiáng)大的數(shù)據(jù)收集能力,比如,用戶使用語音搜索,這個(gè)過程雖然簡(jiǎn)單,但是這是在百度綜合各種環(huán)境后,從7千萬語音數(shù)據(jù)中,從來總結(jié)出十萬多個(gè)小時(shí)的數(shù)據(jù),通過這些數(shù)據(jù),可以建立矩陣,跟其他的語音識(shí)別系統(tǒng)效果要更好。這背后秘訣就是百度擁有強(qiáng)大數(shù)據(jù)來支撐。
吳恩達(dá)認(rèn)為,語音會(huì)是一個(gè)改革互聯(lián)網(wǎng)很大的因素。中國其實(shí)領(lǐng)先于美國和其他國家很多,特別是在移動(dòng)互聯(lián)網(wǎng)方面。我們花很多時(shí)間在智能手機(jī)上,用打字的方式溝通,即使在嘈雜的環(huán)境中用語音溝通,可以通過講話就可以給另一半發(fā)消息,如果語音識(shí)別繼續(xù)改進(jìn)的話,以后這個(gè)技術(shù)可能改變我們的生活。此外,語音識(shí)別也會(huì)對(duì)互聯(lián)網(wǎng),家用電器帶來很大的改革。
吳恩達(dá)演講全文:
非常高興大家可以在硅谷相聚,在過去幾年有一種人工智能已經(jīng)開始起飛了,對(duì)硅谷有很大的沖擊,就像Jason所講,今天你會(huì)聽到人工智能如何沖擊并改變醫(yī)療保險(xiǎn)、教育和其他領(lǐng)域。
這里面有很多種操作,今天我想和大家分享兩件事情,第一件,什么是,和什么不是深度學(xué)習(xí),在二十分鐘的時(shí)間里面我們希望可以讓你知道這樣的技術(shù)是什么。第二點(diǎn),對(duì)于在領(lǐng)先機(jī)構(gòu)里面的你們,你們能夠在策略上思考這些機(jī)構(gòu)—公司、學(xué)校、企業(yè)是否要做深度學(xué)習(xí)的技術(shù)。
多年以來,我們一直有這樣的創(chuàng)意,就是人工智能的虛擬圈,比如做一個(gè)很好的產(chǎn)品,可以得到很多很好的用戶,這些用戶可以提供很多的數(shù)據(jù)。最后,用人工智能就可以讓很多的產(chǎn)品越來越好,讓你得到越來越多的用戶,如此產(chǎn)生人工智能的良性循環(huán)。但是這樣的理念根本沒有成功,在這幅拼圖里面所缺失的最大一環(huán),就是人工智能。來看早一代的人工智能算法,即使有很多的數(shù)據(jù)支持,但是表現(xiàn)功能不會(huì)越來越好,在我腦中有一個(gè)非常基本的原因。為什么深度學(xué)習(xí)沖擊世界,因?yàn)槲覀兌伎梢詼y(cè)量算法,所以在大數(shù)據(jù)里面,新的人工智能的算法越來越好,我們可以第一次在整個(gè)虛擬圈里完成整個(gè)循環(huán)。
過去時(shí)間,很多溝通都是通過文字,過去十年間網(wǎng)頁就是一堆文字。如今在百度,我們看到,特別是在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,溝通已經(jīng)改變成為了圖像和語音。百度已經(jīng)經(jīng)歷改變十五年了,現(xiàn)在就要跟大家分享在圖像語音方面的機(jī)會(huì)。因?yàn)樵诨ヂ?lián)網(wǎng)上的溝通,提供更好的服務(wù),給各國和全世界使用?,F(xiàn)在談?wù)劙俣热绾卫斫鈭D像和語音。
七年前,在斯坦福,我讓我的學(xué)生寫程序識(shí)別咖啡杯的圖像,他們用了當(dāng)時(shí)最好的圖像和算法,這就是他們得到的結(jié)果。他們發(fā)現(xiàn)到處都是咖啡杯,為什么識(shí)別咖啡杯這么困難?當(dāng)我們放大以后繼續(xù)來看。把他當(dāng)成紅的方塊。電腦的問題就是看到這些數(shù)據(jù),色素的強(qiáng)度,告訴我們這些數(shù)據(jù)定義了咖啡杯,所以長(zhǎng)久以來這是在電腦圖像方面不足的地方。神經(jīng)元網(wǎng)絡(luò)的技術(shù)很有前景,人腦的工作被激發(fā)開來,因此模擬神經(jīng)元的信號(hào),用算法讓他更具有智能。在深度學(xué)習(xí),剛才講的熱磁,來模擬人腦,很多研究人員想用這個(gè)熱磁。可是神經(jīng)學(xué)家知道根本不可能知道人腦如何工作。我的朋友開玩笑說,神經(jīng)網(wǎng)絡(luò)好像用卡通畫腦子。過度簡(jiǎn)單的用卡通描述腦子,因此對(duì)大腦不是非常了解。這些程序可以了解這些物體,能做的就是說照張相,給神經(jīng)網(wǎng)絡(luò)很多數(shù)據(jù),很多咖啡杯圖像,可以來學(xué)習(xí),可以來說這是咖啡杯。這只是識(shí)別咖啡杯,是個(gè)相對(duì)容易,但是計(jì)算機(jī)視覺比這個(gè)要復(fù)雜得多,但我們看這個(gè)圖像,看到很多東西。如果要給很多注解的話,你就說,黃色大巴開在路上,右邊的畫,你就說,一間起居室,很多陽光照進(jìn)來,而你寫這個(gè)注解的能力,就是對(duì)這個(gè)圖像的深度理解。那么,可不可以讓電腦理解圖片和我們做的一樣?如果要讓你用中文來注解這張圖片,同樣,你就看這個(gè)圖片,說,這個(gè)棒球運(yùn)動(dòng)員準(zhǔn)備擊球,一個(gè)人在沖浪,一個(gè)車停在現(xiàn)場(chǎng)。
所以,電腦是否可以理解圖像,好像我們有這個(gè)能力寫注解。所以我給你們一個(gè)驚喜,這個(gè)字幕不是人寫出來的,是電腦寫的,百度是第一個(gè)用神經(jīng)網(wǎng)絡(luò)技術(shù)寫的?,F(xiàn)在還有其他好多公司來尾隨我們。所以我們今天在的位置在哪里呢?在計(jì)算機(jī)視覺我們已經(jīng)建立了一個(gè)很好的技術(shù)來建立圖像。我們?cè)趯?duì)美國聽眾展示用中文寫的字幕。既然已經(jīng)有非常復(fù)雜的電腦技術(shù),現(xiàn)在就是應(yīng)用是什么。電腦可以了解在過去五年有長(zhǎng)足的發(fā)展。應(yīng)用是什么?醫(yī)學(xué)影像,圖像的搜尋,買什么衣服,百度還有其他公司有這樣的計(jì)算機(jī)視覺技術(shù),嘗試產(chǎn)品和技術(shù),今天也不知道最好的應(yīng)用是什么,未來幾年會(huì)改變這方面的情況。
所以,電腦視覺是深度學(xué)習(xí)帶來的革命。為什么深度學(xué)習(xí),也就是神經(jīng)網(wǎng)絡(luò)如今有迅猛的發(fā)展?這就是我們來建立了有效的深度學(xué)習(xí)的算法,改變整個(gè)人工智能的方法。舉個(gè)例子。建造火箭,需要兩個(gè)部分組成,很大的引擎,很多燃料,好像宇宙火箭,如果有很大的引擎,很少的燃料,這是無法工作的,反之亦然。所以需要有一個(gè)很大的引擎和很多的燃料才行的通,算法的時(shí)候也是,建立一個(gè)很大很大的神經(jīng)網(wǎng)絡(luò)。另外數(shù)據(jù)就是燃料,在整個(gè)人類社會(huì)的數(shù)據(jù)化,可以看到很多以前拿不到的數(shù)據(jù)。這就是很大的可以騰飛的火箭。因此未來的最近今年的深度學(xué)習(xí)就是讓火箭可以騰飛。大概是2010,五年前,最大的神經(jīng)網(wǎng)絡(luò)有一千萬的連接點(diǎn),幾年后我就開始了在google云項(xiàng)目,用一千個(gè)電腦建立的一億個(gè)神經(jīng)元的網(wǎng)絡(luò),這其實(shí)為深度學(xué)習(xí)帶來很大進(jìn)展。后來我意識(shí)到這是一個(gè)非常昂貴的技術(shù),有朋友就意識(shí)到用不同的技術(shù),用其他gpu技術(shù),在電腦里面處理訊息圖像的技術(shù)可以建立這樣的神經(jīng)網(wǎng)絡(luò),用大的引擎飛火箭。比過去還大十倍。今天在百度,硅谷或中國建立了巨大的神經(jīng)網(wǎng)絡(luò)。代表百度來講,我們是第一個(gè)建立深度學(xué)習(xí)的網(wǎng)絡(luò),這就是火箭引擎,現(xiàn)在有很多公司步我們后塵。
現(xiàn)在舉個(gè)實(shí)例,深度學(xué)習(xí)如何了解互聯(lián)網(wǎng)。今天百度很多用戶是用語音搜索,很多太年幼的用戶,也有很多年齡大的用戶,或文化程度不高的用戶,無法用拼音搜索。對(duì)于他們,用語音搜索是唯一的方式可以讓我們知道他們的需求。如果在安靜的環(huán)境中,手機(jī)可以識(shí)別你的語音。如果在嘈雜的環(huán)境中,比如車?yán)锘蛘卟蛷d中,識(shí)別就不是很好,我們要想辦法解決這個(gè)問題。傳統(tǒng)的方式是工程師要寫軟件,分解成小的軟件來解決這個(gè)問題。我們要不要換一個(gè)角度,為語音識(shí)別建立一個(gè)火箭發(fā)動(dòng)機(jī)一樣的流程。一般來說最大的語音識(shí)別的數(shù)據(jù)是需要兩千小時(shí)的數(shù)據(jù),我們要利用七千萬小時(shí)的語音數(shù)據(jù)來,燃料多三倍。我們后來又說從這七千萬小時(shí)語音數(shù)據(jù)來總結(jié)出十萬多個(gè)小時(shí)的數(shù)據(jù),通過這些數(shù)據(jù),可以建立矩陣,跟其他的語音識(shí)別系統(tǒng),比別的api都好很多。在比較小的時(shí)間當(dāng)中,建立出體系。在嘈雜的環(huán)境中也表現(xiàn)的比較好。秘訣就是我們有很大的引擎和很多的燃料。
為什么要說這個(gè)?市場(chǎng)上有很多的產(chǎn)品,但是語音會(huì)是一個(gè)改革互聯(lián)網(wǎng)很大的因素。在這個(gè)方面,中國其實(shí)領(lǐng)先于美國和其他國家很多,特別是在移動(dòng)互聯(lián)網(wǎng)方面。我們花很多時(shí)間在智能手機(jī)上,用打字的方式溝通,即使在嘈雜的環(huán)境中用語音溝通,可以通過講話就可以給另一半發(fā)消息,如果語音識(shí)別繼續(xù)改進(jìn)的話,以后這個(gè)技術(shù)可能改變我們的生活。
此外,語音識(shí)別也會(huì)對(duì)互聯(lián)網(wǎng),家用電器帶來很大的改革。我有五個(gè)遙控器,如果我可以用講話控制的話就完美了。我現(xiàn)在還沒有下一代,但是我希望有一天我的兒子或?qū)O子一輩,可以問我在我小時(shí)候你跟你的微波爐講話卻沒有反應(yīng)這是真的嗎?太不禮貌了。未來語音識(shí)別會(huì)對(duì)我們的技術(shù)帶來翻天覆地的變化。
現(xiàn)在圍繞互聯(lián)網(wǎng)有很多變化,因?yàn)楝F(xiàn)在有很多的數(shù)據(jù)圍繞著語音,如果有很大的引擎很多的燃料,通過深度學(xué)習(xí)可以深入了解解決這些問題,可以改變我們使用技術(shù)的方式,也可以帶來其他領(lǐng)域,如金融這些方面的變化。你們可以看出來我非常興奮,另外還有炒作的因素,在過去有很多人提到了邪惡的機(jī)器人,有些人在擔(dān)心機(jī)器人可能會(huì)帶來負(fù)面影響。其實(shí)我們現(xiàn)在掌握的技術(shù)是非常好的,我個(gè)人還不知道怎么建造出有自我感知的機(jī)器人。當(dāng)然,我對(duì)于技術(shù)是很有激情的,我相信會(huì)改變我們的生活,給成千上萬人的生活帶來變化。有些炒作或擔(dān)心我覺得沒有必要。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03