
古往今來,人類一直在探求科技的極限。隨著信息技術(shù)在21世紀的爆發(fā),數(shù)據(jù)科學(xué)與人工智能技術(shù)迎來自己的春天,尤其是以深度學(xué)習(xí)為基礎(chǔ)的人工智能技術(shù)可謂是大放異彩,在諸多領(lǐng)域遠勝人類,并且如人臉識別這樣的技術(shù)也紛紛落地,甚至悲觀者認為,機器智能時代來臨,倘若某天機器有了自主思維,人類將會面臨滅頂之災(zāi)??墒?,深度學(xué)習(xí)就如此無所不能嗎?答案是否定的!深度學(xué)習(xí)是利用深層神經(jīng)網(wǎng)絡(luò)的技術(shù),雖然在圖像識別等方面已經(jīng)能夠超越人類,但是它仍然有許多方面是不能完成的,本文列舉深度學(xué)習(xí)目前不能實現(xiàn)的一些領(lǐng)域,希望能夠幫大家打開思維,更好地認識深度學(xué)習(xí)。
既是學(xué)霸,又是游戲王
一般來說,多數(shù)人每年可以看300篇文獻,而IBM的Watson系統(tǒng)在10分鐘里就可以閱讀2000萬的文獻,顯而易見,深度學(xué)習(xí)的學(xué)習(xí)能力是遠遠大于人類的,是個十足的“學(xué)霸”。與此同時,在游戲領(lǐng)域,不管是圍棋還是dota2,深度學(xué)習(xí)有足夠的能力碾壓人類。所以深度學(xué)習(xí)既是學(xué)霸,又是游戲王。
多才多藝
下棋,寫詩,作曲,藝術(shù)畫······2016年,阿爾法狗大勝李世石,2017年微軟小冰出版第一部詩集,隨后又開始轉(zhuǎn)向音樂創(chuàng)作·····深度學(xué)習(xí)已經(jīng)慢慢變成琴棋書畫樣樣精通,多才多藝全能王。
從深度學(xué)習(xí)所取得的成果來看,它似乎已經(jīng)無所不能,在諸多方面超過了人類。
算法輸出不穩(wěn)定,容易被攻擊
在圖像識別領(lǐng)域,我們可能在一張圖像中只改變一個像素點的值,那么輸出結(jié)果會發(fā)生巨大改變,這就是算法輸出不穩(wěn)定導(dǎo)致的,這種細微的改變在人類看來微不足道,對于算法模型來說確不同。不僅在圖像領(lǐng)域,自然語言處理領(lǐng)域也有這樣的問題。在問答系統(tǒng)中,在原始文本中隨機得加入一些簡單的詞,模型的理解能力大大降低。這種問題不僅出現(xiàn)在深度學(xué)習(xí),傳統(tǒng)機器學(xué)習(xí)更容易被攻擊。
模型復(fù)雜度高,難以糾錯或調(diào)試
在2016年阿法狗與李世石的大戰(zhàn)中,李世石贏了一局。在李世石的78手后,阿法狗的勝率便直線下降。如果可以投降的話,那么在李世石的第78手后,阿法狗應(yīng)該會選擇投降,而并不會針對這一手進行相應(yīng)的改進。此外,在深度學(xué)習(xí)進行翻譯時,不管是給模型什么數(shù)據(jù)輸入,都會有一個有意義的輸出。此前的谷歌翻譯曾遇到過這樣的問題,在翻譯結(jié)果有明顯錯誤的時候,翻譯部門的工程師也很難去對模型修改,可見深度學(xué)習(xí)模型的復(fù)雜。
層級復(fù)合程度高,參數(shù)不透明
在圖像識別領(lǐng)域,我們在模型的中間層中盡力去抓取圖像的特征。在第一層的卷積層計算后,我們對結(jié)果進行可視化,可以很容易看出結(jié)果與原圖像有很大相似性。然后,隨著層數(shù)的加深,對中間其他層的可視化,我們完全不能看出中間層所代表的意義。主要原因在于感受野的復(fù)合,而且每層的卷積核也會產(chǎn)生復(fù)合,加上一些模型會有自己特有的復(fù)合,如inception模塊的復(fù)合,殘差的復(fù)合,讓我們難以從中間層的可視化中看到模型具體運行的結(jié)果。
對數(shù)據(jù)依賴性強,模型增量性差
深度學(xué)習(xí)是端到端結(jié)構(gòu),靈活性非常低。我們將單個圖像拼接在一起,人類很容易識別的內(nèi)容,深度學(xué)習(xí)確無能為力,可見其遷移能力較差。在“語義標注”和“關(guān)系檢測”這類問題中,人類可以通過完成一個任務(wù)中的多個子任務(wù),并將子任務(wù)整合的方式解決問題,而對于深度學(xué)習(xí)來說,多個子任務(wù)與一個總?cè)蝿?wù)是完全不同的兩個任務(wù),需要不同的模型去解決問題。在數(shù)據(jù)量較小的情況下,模型擬合能力較差。
專注直觀感知類問題,對開放性問題無能為力
我們小時候都曾學(xué)習(xí)過關(guān)于烏鴉喝水的故事。烏鴉在面對半瓶水,而自己的嘴夠不著水時,會往瓶子里丟入石子,使得水面上升從而喝到水。此外,烏鴉在無法撥開堅果時,它會把堅果丟在馬路上,讓來往的車輛碾壓從而遲到果實,在此過程中,烏鴉能夠通過觀察人行道的情況學(xué)會判斷車輛是否會行駛以保障自己的安全。而鸚鵡也有自己的智能,在聽過人類重復(fù)說過的話后,鸚鵡能夠很好地模仿人類說話。深度學(xué)習(xí)只能做到鸚鵡的智能,而做不到烏鴉的智能,可見其泛化能力之低。此外,深度學(xué)習(xí)也難以理解圖像背后的寓意。當一幅圖中出現(xiàn)奧巴馬與一群大象時,深度學(xué)習(xí)僅僅能辨認圖中是一個男人與一群大象,顯然圖作者卻是想透過圖片暗喻美國的兩黨之爭,一般來說,大象喻指美國民主黨。
機器偏見難以避免,人類知識難以有效監(jiān)督
這可能是目前深度學(xué)習(xí)面臨的最大問題。數(shù)據(jù)是深度學(xué)習(xí)的基礎(chǔ),而數(shù)據(jù)的可靠程度決定了模型的可靠程度。微軟層開發(fā)聊天機器人Tay,模仿年輕網(wǎng)民的語言模式。但是試用24小時后便被引入歧途,成為偏激的種族主義者,甚至發(fā)出了“希特勒無罪”的消息。原因在于年輕的網(wǎng)民本身的語料庫并不是純凈的,是人就會有偏見,這種偏見在網(wǎng)絡(luò)中尤其嚴重,這樣便導(dǎo)致了Tay用來訓(xùn)練的數(shù)據(jù)帶有偏見,并使得Tay誤入歧途,而人類知識的監(jiān)督很難有效采用,這就無法避免機器的偏見。另一個例子,美國法院用以評估犯罪風(fēng)險的算法COMPAS,也被證明對黑人造成了系統(tǒng)性歧視。機器偏見無法消除,日后可能會給人類帶來嚴重的后果。
不可否認,深度學(xué)習(xí)可以在特定領(lǐng)域超過人類,有很好的效果,但它并非萬能。某種意義上說,它離智能還差很遠。目前,對深度學(xué)習(xí)的泛化性與可解釋性的呼聲越來越高。2017年7月,國務(wù)院在《新一代人工智能發(fā)展規(guī)劃》中提出“實現(xiàn)具備高可解釋性,強泛化能力的人工智能”?;蛟S下一代人工智能技術(shù)還是在深度學(xué)習(xí)基礎(chǔ)之上展開,但是希望新的技術(shù)能夠很好地解決現(xiàn)在深度學(xué)習(xí)的不能,更好地造福人類!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03