
大數(shù)據(jù)與深度學習是一種蠻力
Facebook去年底挖來了一個機器學習大神Vladimir Vapnik,他是統(tǒng)計學習理論和支持向量機的主要發(fā)明者。Vladimir Vapnik被稱為統(tǒng)計學習理論之父,他出生于俄羅斯,1990年底移居美國,在美國貝爾實驗室一直工作到2002年,之后加入了普林斯頓的NEC實驗室機器學習研究組,同時任哥倫比亞大學特聘教授。2014年,Vladimir Vapnik加入Facebook人工智能實驗室。
Vladimir Vapnik
近日,Vladimir在俄羅斯最大的搜索引擎公司Yandex的大會上發(fā)表了講話,重點討論了深度學習是否以蠻力取勝。來自加利福尼亞大學圣地亞哥分校的Zachary Chase Lipton博士詳細記錄了會議內(nèi)容,并整理成了文章:
上周,我來到柏林參加機器學習展望和應(yīng)用大會。這個大會由Yandex舉辦,主要談了Deep Learning和Intelligent Learning兩個問題,它們經(jīng)常作為對比的概念出現(xiàn)。
雖然我自己也是演講者之一,但是整個會議的高潮部分,還是關(guān)于深度學習的方法論,其中經(jīng)驗主義和數(shù)學推理中的矛盾部分。
第一條是關(guān)于深度學習,討論的是背后的數(shù)學支撐,以及未來的方向。問題包括了模型的可解釋性和醫(yī)療領(lǐng)域的應(yīng)用。到了周三晚上,Vladimir Vapnik也參與了討論,說的是知識如何在不同的個體之間傳遞。Vladimir的哲學觀橫跨了機器學習、數(shù)學和智能的源頭,并且挑戰(zhàn)了深度學習的方法論,這很有爭議。
其實在今年夏天,我就寫文章說機器學習的成功是大數(shù)據(jù)時代經(jīng)驗主義的勝利。在里面我強調(diào)說,過度去擬合數(shù)據(jù),雖然能在真實數(shù)據(jù)中得到檢驗,但里面會有很大風險,至少比基于數(shù)學推理建立的系統(tǒng)風險大得多。在這次會議中,我聽到了Vladimir在這方面的觀點。
為了避免混淆視聽,我得強調(diào):我是一個深度學習的實踐者。我個人并不否認深度學習,而且對它的先行者和火炬手充滿尊敬。但我也同樣相信,我們應(yīng)該對深度學習的可能性抱有開放性的態(tài)度:
即會有一些數(shù)學模型,能夠更好的指明未來發(fā)展方向,開啟新的方法論。
很顯然,當我們?nèi)ゾ捉篮拖@些觀點的時候,能夠得到很大的價值。
大數(shù)據(jù)與深度學習是一種蠻力?
盡管Vapnik當場說了很多觀點,但是最核心的還是援引了愛因斯坦關(guān)于上帝的隱喻。簡單的說,Vapnik假設(shè)了一個理論:想法和直覺要么來自上帝,要么出自魔鬼。而區(qū)別在于,上帝是智慧的,而魔鬼往往不是。
在作為數(shù)學家和機器學習研究和踐行者的生涯中,Vapnik得出了一個結(jié)論:魔鬼往往來自于蠻力(Brute Force)。進一步說,如果承認深度學習系統(tǒng)在解決問題時不可思議的表現(xiàn),那么大數(shù)據(jù)和深度學習,都有某種蠻力的味道。
不過,我自己并不同意深度學習必須等同于機器蠻力。我們?nèi)缃褚材芸吹綄τ诖髷?shù)據(jù)的觀點爭論,其中Vapnik和Nathan Intrator教授就說:小孩不需要幾億的標簽樣本以完成學習。雖然有大量帶有標簽的數(shù)據(jù)時,學習會成為一件比較容易的事,但如果依賴這樣的方法,我們就錯失了自然界中關(guān)于學習的基本原理。
也許,真正的學習只需要數(shù)百樣本,而我們現(xiàn)在卻只有非常大的數(shù)據(jù)量才能完成學習。如果我們不去探尋學習的本質(zhì),那就是在屈從于懶惰。
我們現(xiàn)在的深度學習并非科學。確切的說,機器學習和核心任務(wù)是理解計算本身,而現(xiàn)在的方法和它有所背離。這就好比任務(wù)是制造小提琴,而我們扮演的角色不過是小提琴演奏者,雖然也能創(chuàng)作美妙的音樂,也有演奏的直覺,但我們并不知道小提琴如何創(chuàng)造出音樂。
進一步說,很多深度學習實踐者,他們對數(shù)據(jù)和工程有很好的感覺,但其實不知道這里頭是怎么回事。所以在目前的深度學習方法中,參數(shù)的調(diào)節(jié)方法依然是一門“藝術(shù)”,而非“工藝”。
在算法和模型上,我們是否能發(fā)明所有東西?
Vapnik認為,在機器學習的算法和模型上,我們并不能發(fā)明所有東西。他堅持說,他自己并沒有如此的聰明才智,以完成這些算法模型的發(fā)明。(這似乎也在暗示,其他人也沒有那么聰明,去發(fā)明這些玩意)
按照Vapnik的意思,我們在機器學習上發(fā)明的東西是微不足道的。真正重要的東西,來自于我們對數(shù)學本質(zhì)的理解。就深度學習來說,模型經(jīng)常被發(fā)明出來、品牌化并申請專利,但這些相比于真正由數(shù)學驅(qū)動的機器學習,就顯得很一般了。
關(guān)于深度學習的反思,來自紐約州立大學的顧險峰教授也有很多理解。顧險峰認為,深度學習方法深刻地轉(zhuǎn)變了學術(shù)研究的范式。以前學者們所采用的觀察現(xiàn)象,提煉規(guī)律,數(shù)學建模,模擬解析,實驗檢驗,修正模型的研究套路被徹底顛覆,被數(shù)據(jù)科學的方法所取代:收集數(shù)據(jù),訓練網(wǎng)絡(luò),實驗檢驗,加強訓練。
在深度學習新方法下,嚴格的數(shù)學推理缺失了。比如說地圖四色定理的證明,數(shù)學家將平面圖的構(gòu)型分成1936種,然后用計算機逐一驗證。當然在足夠的算力下,這可以證明地圖四色定理。但是在這個過程中,沒有新穎概念提出,換言之,機械蠻力代替了幾何直覺。
而在數(shù)學歷史上,對于一個著名猜想的證明和解答,答案本身也許并不重要,在尋找證明的過程中所凝練的概念,提出的方法,發(fā)展的理論才是真正目的所在。機械定理證明驗證了命題的真?zhèn)危菬o法明確地提出新的概念和方法,實質(zhì)上背離了數(shù)學的真正目的。
所以說,這是一種“相關(guān)性”而非“因果性”的科學。歷史上,人類積累科學知識,在初期總是得到“經(jīng)驗公式”,但是最終還是尋求更為深刻本質(zhì)的理解。例如從煉丹術(shù)到化學、量子力學的發(fā)展歷程。
人類智能最為獨特之處也在于數(shù)學推理,特別是機械定理證明,對于這一點,機器學習方法是無能為力的。當人的數(shù)學推理缺失的時候,僅僅依靠機器蠻力,就會遇到很大制約。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03