
神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)和缺點(diǎn)
深度學(xué)習(xí)目前大受追捧。人們總想在各個(gè)方面使用神經(jīng)網(wǎng)絡(luò),但它們總是正確的選擇嗎?
在本文中我們將探討如今深度學(xué)習(xí)如此受歡迎的原因。在讀完本文后,你將了解神經(jīng)網(wǎng)絡(luò)的主要優(yōu)缺點(diǎn),并且當(dāng)你為解決機(jī)器學(xué)習(xí)問(wèn)題選擇合適類(lèi)型的算法時(shí),你將做到心中有數(shù)。你還將了解目前在機(jī)器學(xué)習(xí)中我們遇到了哪些主要問(wèn)題。
為什么深度學(xué)習(xí)如此熱門(mén)?
深度學(xué)習(xí)如此熱門(mén)的主要包括以下四個(gè)原因,即數(shù)據(jù)、計(jì)算能力、算法和市場(chǎng)營(yíng)銷(xiāo)。接下來(lái)我們將一一探討。
1. 數(shù)據(jù)
深度學(xué)習(xí)大受追捧的一個(gè)因素是,如今有大量可使用的數(shù)據(jù),這些數(shù)據(jù)是在過(guò)去幾年,幾十年中收集的。這使得神經(jīng)網(wǎng)絡(luò)能夠真正發(fā)揮其潛力,因?yàn)?a href='/map/shenjingwangluo/' style='color:#000;font-size:inherit;'>神經(jīng)網(wǎng)絡(luò)獲得的數(shù)據(jù)越多,表現(xiàn)越好。
相比之下,傳統(tǒng)的機(jī)器學(xué)習(xí)算法在達(dá)到一定水平時(shí),獲得更多的數(shù)據(jù)并不會(huì)提高其性能。以下圖表說(shuō)明了這一點(diǎn):
2. 計(jì)算能力
另一個(gè)非常重要的因素是,如今可用的計(jì)算能力能夠讓我們處理更多的數(shù)據(jù)。
根據(jù)人工智能的領(lǐng)軍人物Ray Kurzweil的說(shuō)法,在每個(gè)時(shí)間單位,計(jì)算能力以乘以某個(gè)常數(shù)的速度增長(zhǎng)(例如,每年增加一倍),而不是逐漸增加。這意味著計(jì)算能力呈指數(shù)增長(zhǎng)。
3. 算法
深度學(xué)習(xí)大受追捧的第三個(gè)因素是算法本身的進(jìn)步。最近算法開(kāi)發(fā)方面的突破讓其比以前運(yùn)行得更快,從而能夠讓我們使用越來(lái)越多的數(shù)據(jù)。
4. 市場(chǎng)營(yíng)銷(xiāo)
同時(shí),市場(chǎng)營(yíng)銷(xiāo)也很重要。神經(jīng)網(wǎng)絡(luò)已經(jīng)存在了幾十年(在1944年首次提出),當(dāng)時(shí)已經(jīng)有一些宣傳,但沒(méi)有人相信以及愿意進(jìn)行投資。
“深度學(xué)習(xí)”讓其有了一個(gè)高大上的名字,讓其更好進(jìn)行宣傳,同時(shí)也讓許多人錯(cuò)誤地認(rèn)為深度學(xué)習(xí)是一個(gè)全新的領(lǐng)域。
此外,其他因素也促成了深度學(xué)習(xí)的市場(chǎng)推廣。例如漢森機(jī)器人公司有爭(zhēng)議的機(jī)器人Sophia,以及機(jī)器學(xué)習(xí)主要領(lǐng)域的幾項(xiàng)突破等等。
神經(jīng)網(wǎng)絡(luò) VS 傳統(tǒng)算法
你應(yīng)該使用神經(jīng)網(wǎng)絡(luò)還是傳統(tǒng)的機(jī)器學(xué)習(xí)算法?這是一個(gè)難以回答的問(wèn)題,因?yàn)檫@很大程度上取決于你想要解決的問(wèn)題。
我們要明確的是并不存在一種“完美的”機(jī)器學(xué)習(xí)算法,能夠出色地解決任何問(wèn)題。對(duì)于某個(gè)問(wèn)題,有的方法是適合的,有的則反之。
但我認(rèn)為這正是機(jī)器學(xué)習(xí)有趣的地方所在。這也說(shuō)明為什么你需要精通多種算法;在練習(xí)中反復(fù)試錯(cuò)才是成為優(yōu)秀機(jī)器學(xué)習(xí)工程師或數(shù)據(jù)科學(xué)家的唯一方法。
下面我將提供一些方法,幫助你理解何時(shí)要選擇哪種類(lèi)型的算法。
神經(jīng)網(wǎng)絡(luò)的主要優(yōu)勢(shì)在于,它的性能優(yōu)于幾乎其他的機(jī)器學(xué)習(xí)算法。但同時(shí)也存在一些缺點(diǎn),這也是你需要重點(diǎn)關(guān)注的。正如我之前所說(shuō)的,是否應(yīng)該使用深度學(xué)習(xí),這主要取決于你需要解決的問(wèn)題。例如,在癌癥檢測(cè)中,高性能至關(guān)重要,因?yàn)樾阅茉胶?,越多的人可以接受治療。但是?duì)于一些機(jī)器學(xué)習(xí)問(wèn)題,傳統(tǒng)算法可以提供更好的結(jié)果。
1. 黑箱
神經(jīng)網(wǎng)絡(luò)最廣為人知的缺點(diǎn)是“黑箱”性質(zhì),這意味著你不知道神經(jīng)網(wǎng)絡(luò)如何以及為何會(huì)得出一定的輸出。例如,當(dāng)你將一張貓的圖像輸入神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)這是汽車(chē)時(shí),很難理解為什么會(huì)導(dǎo)致它產(chǎn)生這個(gè)預(yù)測(cè)。當(dāng)你有可解釋的特征時(shí),就能更容易的理解其錯(cuò)誤的原因。相比起來(lái),像決策樹(shù)這樣的算法更容易理解。這是很重要的,因?yàn)樵谀承╊I(lǐng)域可解釋性至關(guān)重要。
這就是為什么許多銀行不使用神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)客戶(hù)是否有信用,因?yàn)樗麄冃枰蚩蛻?hù)解釋為什么他們無(wú)法獲得貸款。否則用戶(hù)會(huì)產(chǎn)生誤解和不滿(mǎn),因?yàn)樗幻靼诪槭裁醋约簾o(wú)法獲得貸款。
像Quora這樣的網(wǎng)站也是如此。如果他們通過(guò)機(jī)器學(xué)習(xí)算法決定刪除某個(gè)用戶(hù)的帳戶(hù),他們需要向用戶(hù)解釋當(dāng)中的原因。如果僅僅說(shuō)”這是計(jì)算機(jī)的決定”,這樣的答案是不盡人意的。
制定重要的商業(yè)決策時(shí)也是如此。你能想象大公司的CEO在做出關(guān)于數(shù)百萬(wàn)美元的決定,而不探究當(dāng)中的原因,僅僅因?yàn)橛?jì)算機(jī)的決策嗎?
2. 開(kāi)發(fā)時(shí)間
雖然像Keras這樣的庫(kù)讓神經(jīng)網(wǎng)絡(luò)的開(kāi)發(fā)變得簡(jiǎn)單,但有時(shí)你需要更多地控制算法的細(xì)節(jié)。特別是當(dāng)你試圖解決機(jī)器學(xué)習(xí)中之前沒(méi)人做過(guò)的難題時(shí)。
接著你可能會(huì)使用Tensorflow,它為你提供了更多的機(jī)會(huì),但同時(shí)因?yàn)樗哺鼜?fù)雜,開(kāi)發(fā)時(shí)間更長(zhǎng)。對(duì)于公司管理層來(lái)說(shuō),他們需要決定是否值得這么做。使用深度學(xué)習(xí),工程師需要花費(fèi)數(shù)周的時(shí)間進(jìn)行開(kāi)發(fā),而用更簡(jiǎn)單的算法能夠更快的解決問(wèn)題。
3. 數(shù)據(jù)量
與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比,神經(jīng)網(wǎng)絡(luò)通常需要更多的數(shù)據(jù),至少需要數(shù)千甚至數(shù)百萬(wàn)個(gè)標(biāo)記樣本。這不是一個(gè)容易解決的問(wèn)題,但如果使用其他算法,則可以用更少的數(shù)據(jù)解決相關(guān)的機(jī)器學(xué)習(xí)問(wèn)題。
盡管有些情況下,神經(jīng)網(wǎng)絡(luò)在很少的數(shù)據(jù)下也能很好的解決問(wèn)題,但這是少數(shù)情況。在這種情況下,像樸素貝葉斯這樣的簡(jiǎn)單算法能通過(guò)少量數(shù)據(jù)解決問(wèn)題,這顯然是更好的選擇。
4. 計(jì)算成本
通常在計(jì)算方面,神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)算法更昂貴。先進(jìn)的深度學(xué)習(xí)算法,若想成功完成訓(xùn)練,可能需要幾周的時(shí)間。而大多數(shù)傳統(tǒng)的機(jī)器學(xué)習(xí)只需花費(fèi)少于幾分鐘,幾個(gè)小時(shí)或者幾天。
神經(jīng)網(wǎng)絡(luò)所需的計(jì)算能力很大程度上取決于數(shù)據(jù)的大小,也取決于網(wǎng)絡(luò)的深度和復(fù)雜程度。例如,將比具有1000個(gè)決策樹(shù)的隨機(jī)森林,具有一層和50個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)要快得多。同時(shí),相,具有50層的神經(jīng)網(wǎng)絡(luò)將比僅有10個(gè)決策樹(shù)的隨機(jī)森林更慢。
總結(jié)
現(xiàn)在你知道對(duì)于某些任務(wù)來(lái)說(shuō)神經(jīng)網(wǎng)絡(luò)是不錯(cuò)的選擇,而對(duì)于某些任務(wù)來(lái)說(shuō)并非如此。
大量的數(shù)據(jù)、更多的計(jì)算能力、更好的算法和智能的營(yíng)銷(xiāo)促進(jìn)了深度學(xué)習(xí)的受歡迎程度,并使其成為目前最熱門(mén)的領(lǐng)域之一。
最重要的是,你已經(jīng)了解到神經(jīng)網(wǎng)絡(luò)幾乎優(yōu)于所有其他機(jī)器學(xué)習(xí)算法,以及與之相伴隨的缺點(diǎn)。那就是“黑箱”性質(zhì),更長(zhǎng)的開(kāi)發(fā)時(shí)間,所需的數(shù)據(jù)量以及高昂的計(jì)算成本。
結(jié)論
在我看來(lái),目前深度學(xué)習(xí)有點(diǎn)過(guò)度炒作,并且期望超過(guò)了其實(shí)際能力。但這并不意味著深度學(xué)習(xí)是沒(méi)有用的。
如今機(jī)器學(xué)習(xí)變得越來(lái)越普遍,越來(lái)越多的人可以用它來(lái)構(gòu)建有用的產(chǎn)品。同時(shí),機(jī)器學(xué)習(xí)可以解決很多問(wèn)題,這都是未來(lái)幾年內(nèi)會(huì)實(shí)現(xiàn)的。
其中一個(gè)主要問(wèn)題是,只有少數(shù)人了解可以用深度學(xué)習(xí)做些什么,并知道如何構(gòu)建出色的數(shù)據(jù)科學(xué)團(tuán)隊(duì),為公司帶來(lái)真正的價(jià)值。一方面,我們擁有博士級(jí)工程師,他們熟知機(jī)器學(xué)習(xí)背后的理論,但缺乏對(duì)商業(yè)方面的理解。另一方面,公司的領(lǐng)導(dǎo)層和管理人員,他們不知道深度學(xué)習(xí)可以做些什么,并認(rèn)為它將在未來(lái)幾年解決所有的問(wèn)題。在我看來(lái),我們需要更多的人才來(lái)填補(bǔ)來(lái)彌補(bǔ)當(dāng)中的差距,這將會(huì)為我們的社會(huì)帶來(lái)更多有用的產(chǎn)品。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10