
作者 | Adrian Rosebrock
編譯 | 數(shù)盟
如果你對深度學習和卷積神經(jīng)網(wǎng)絡(luò)感興趣,但是并不知道從哪里開始,也不知道使用哪種庫,那么這里就為你提供了許多幫助。
在這篇文章里,我詳細解讀了9個我最喜歡的Python深度學習庫。
這個名單并不詳盡,它只是我在計算機視覺的職業(yè)生涯中使用并在某個時間段發(fā)現(xiàn)特別有用的一個庫的列表。
這其中的一些庫我比別人用的多很多,尤其是Keras、mxnet和sklearn-theano。
其他的一些我是間接的使用,比如Theano和TensorFlow(庫包括Keras、deepy和Blocks等)。
另外的我只是在一些特別的任務(wù)中用過(比如nolearn和他們的Deep Belief Network implementation)。
這篇文章的目的是向你介紹這些庫。我建議你認真了解這里的每一個庫,然后在某個具體工作情境中你就可以確定一個最適用的庫。
我想再次重申,這份名單并不詳盡。此外,由于我是計算機視覺研究人員并長期活躍在這個領(lǐng)域,對卷積神經(jīng)網(wǎng)絡(luò)(細胞神經(jīng)網(wǎng)絡(luò))方面的庫會關(guān)注更多。
我把這個深度學習庫的列表分為三個部分。
第一部分是比較流行的庫,你可能已經(jīng)很熟悉了。對于這些庫,我提供了一個通俗的、高層次的概述。然后,針對每個庫我詳細解說了我的喜歡之處和不喜歡之處,并列舉了一些適當?shù)膽?yīng)用案例。
第二部分進入到我個人最喜歡的深度學習庫,也是我日常工作中使用最多的,包括:Keras、mxnet和sklearn-theano等。
最后,我對第一部分中不經(jīng)常使用的庫做了一個“福利”板塊,你或許還會從中發(fā)現(xiàn)有用的或者是在第二板塊中我還沒有嘗試過但看起來很有趣的庫。
接下來就讓我們繼續(xù)探索。
針對初學者:
1.Caffe
提到“深度學習庫”就不可能不說到Caffe。事實上,自從你打開這個頁面學習深度學習庫,我就敢打保票你肯定聽說Caffe。
那么,究竟Caffe是什么呢?
Caffe是由Berkeley Vision and Learning Center(BVLC)建立的深度學習框架。它是模塊化的,速度極快。而且被應(yīng)用于學術(shù)界和產(chǎn)業(yè)界的start-of-the-art應(yīng)用程序中。
事實上,如果你去翻閱最新的深度學習出版物(也提供源代碼),你就很可能會在它們相關(guān)的GitHub庫中找到Caffe模型。
雖然Caffe本身并不是一個Python庫,但它提供綁定到Python上的編程語言。我們通常在新領(lǐng)域開拓網(wǎng)絡(luò)的時候使用這些綁定。
我把Caffe放在這個列表的原因是它幾乎被應(yīng)用在各個方面。你可以在一個空白文檔里定義你的模型架構(gòu)和解決方案,建立一個JSON文件類型的.prototxt配置文件。Caffe二進制文件提取這些.prototxt文件并培訓你的網(wǎng)絡(luò)。Caffe完成培訓之后,你可以把你的網(wǎng)絡(luò)和經(jīng)過分類的新圖像通過Caffe二進制文件,更好的就直接通過Python或MATLAB的API。
雖然我很喜歡Caffe的性能(它每天可以在K40 GPU上處理60萬張圖片),但相比之下我更喜歡Keras和mxnet。
主要的原因是,在.prototxt文件內(nèi)部構(gòu)建架構(gòu)可能會變得相當乏味和無聊。更重要的是, Caffe不能用編程方式調(diào)整超參數(shù)!由于這兩個原因,在基于Python的API中我傾向于對允許我實現(xiàn)終端到終端聯(lián)播網(wǎng)的庫傾斜(包括交叉驗證和調(diào)整超參數(shù))。
2.Theano
在最開始我想說Theano是美麗的。如果沒有Theano,我們根本不會達到現(xiàn)有的深度學習庫的數(shù)量(特別是在Python)。同樣的,如果沒有numpy,我們就不會有SciPy、scikit-learn和 scikit-image,,同樣可以說是關(guān)于Theano和深度學習更高級別的抽象。
非常核心的是,Theano是一個Python庫,用來定義、優(yōu)化和評估涉及多維數(shù)組的數(shù)學表達式。 Theano通過與numpy的緊密集成,透明地使用GPU來完成這些工作。
雖然可以利用Theano建立深度學習網(wǎng)絡(luò),但我傾向于認為Theano是神經(jīng)網(wǎng)絡(luò)的基石,同樣的numpy是作為科學計算的基石。事實上,大多數(shù)我在文章中提到的庫都是圍繞著Theano,使自己變得更加便利。
不要誤會我的意思,我愛Theano,我只是不喜歡用Theano編寫代碼。
在Theano建設(shè)卷積神經(jīng)網(wǎng)絡(luò)就像只用本機Python中的numpy寫一個定制的支持向量機(SVM),當然這個對比并不是很完美。
你可以做到嗎?
當然可以。
它值得花費您的時間和精力嗎?
嗯,也許吧。這取決于你是否想擺脫低級別或你的應(yīng)用是否需要。
就個人而言,我寧愿使用像Keras這樣的庫,它把Theano包裝成更有人性化的API,同樣的方式,scikit-learn使機器學習算法工作變得更加容易。
3.TensorFlow
與Theano類似,TensorFlow是使用數(shù)據(jù)流圖進行數(shù)值計算的開源庫(這是所有神經(jīng)網(wǎng)絡(luò)固有的特征)。最初由谷歌的機器智能研究機構(gòu)內(nèi)的Google Brain Team研究人員開發(fā),此后庫一直開源,并提供給公眾。
相比于Theano ,TensorFlow的主要優(yōu)點是分布式計算,特別是在多GPU的環(huán)境中(雖然這是Theano正在攻克的項目)。
除了用TensorFlow而不是Theano替換Keras后端,對于TensorFlow庫我并沒有太多的經(jīng)驗。然而在接下來的幾個月里,我希望這有所改變。
4.Lasagne
Lasagne是Theano中用于構(gòu)建和訓練網(wǎng)絡(luò)的輕量級庫。這里的關(guān)鍵詞是輕量級的,也就意味著它不是一個像Keras一樣圍繞著Theano的重包裝的庫。雖然這會導致你的代碼更加繁瑣,但它會把你從各種限制中解脫出來,同時還可以讓您根據(jù)Theano進行模塊化的構(gòu)建。
簡而言之:Lasagne的功能是Theano的低級編程和Keras的高級抽象之間的一個折中。
我最喜歡的:
5.Keras
如果我必須選出一個最喜歡的深度學習Python庫,我將很難在Keras和mxnet中做出抉擇——但最后,我想我會選Keras。
說真的,Keras的好處我說都說不完。
Keras是一個最低限度的、模塊化的神經(jīng)網(wǎng)絡(luò)庫,可以使用Theano或TensorFlow作為后端。Keras最主要的用戶體驗是,從構(gòu)思到產(chǎn)生結(jié)果將會是一個非常迅速的過程。
在Keras中架構(gòu)網(wǎng)絡(luò)設(shè)計是十分輕松自然的。它包括一些state-of-the-art中針對優(yōu)化(Adam,RMSProp)、標準化(BatchNorm)和激活層(PReLU,ELU,LeakyReLU)最新的算法。
Keras也非常注重卷積神經(jīng)網(wǎng)絡(luò),這也是我十分需要的。無論它是有意還是無意的,我覺得從計算機視覺的角度來看這是非常有價值的。
更重要的是,你既可以輕松地構(gòu)建基于序列的網(wǎng)絡(luò)(其中輸入線性流經(jīng)網(wǎng)絡(luò))又可以創(chuàng)建基于圖形的網(wǎng)絡(luò)(輸入可以“跳過”某些層直接和后面對接)。這使得創(chuàng)建像GoogLeNet和SqueezeNet這樣復雜的網(wǎng)絡(luò)結(jié)構(gòu)變得容易得多。
我認為Keras唯一的問題是它不支持多GPU環(huán)境中并行地訓練網(wǎng)絡(luò)。這可能會也可能不會成為你的大忌。
如果我想盡快地訓練網(wǎng)絡(luò),那么我可能會使用mxnet。但是如果我需要調(diào)整超參數(shù),我就會用Keras設(shè)置四個獨立的實驗(分別在我的Titan X GPUs上運行)并評估結(jié)果。
6.mxnet
我第二喜歡的深度學習Python庫無疑就是mxnet(重點也是訓練圖像分類網(wǎng)絡(luò))。雖然在mxnet中站立一個網(wǎng)絡(luò)可能需要較多的代碼,但它會提供給你驚人數(shù)量的語言綁定(C ++、Python、R、JavaScript等)。
Mxnet庫真正出色的是分布式計算,它支持在多個CPU / GPU機訓練你的網(wǎng)絡(luò),甚至可以在AWS、Azure以及YARN集群。
它確實需要更多的代碼來設(shè)立一個實驗并在mxnet上運行(與Keras相比),但如果你需要跨多個GPU或系統(tǒng)分配訓練,我推薦mxnet。
7.sklearn-theano
有時候你并不需要終端到終端的培養(yǎng)一個卷積神經(jīng)網(wǎng)絡(luò)。相反,你需要把CNN看作一個特征提取器。當你沒有足夠的數(shù)據(jù)來從頭培養(yǎng)一個完整的CNN時它就會變得特別有用。僅僅需要把你的輸入圖像放入流行的預先訓練架構(gòu),如OverFeat、AlexNet、VGGNet或GoogLeNet,然后從FC層提取特征(或任何您要使用的層)。
總之,這就是sklearn-theano的功能所在。你不能用它從頭到尾的訓練一個模型,但它的神奇之處就是可以把網(wǎng)絡(luò)作為特征提取器。當需要評估一個特定的問題是否適合使用深度學習來解決時,我傾向于使用這個庫作為我的第一手判斷。
8.nolearn
我在PyImageSearch博客上用過幾次nolearn,主要是在我的MacBook Pro上進行一些初步的GPU實驗和在Amazon EC2 GPU實例中進行深度學習。
Keras把 Theano和TensorFlow包裝成了更具人性化的API,而nolearn也為Lasagne做了相同的事。此外,nolearn中所有的代碼都是與scikit-learn兼容的,這對我來說絕對是個超級的福利。
我個人不使用nolearn做卷積神經(jīng)網(wǎng)絡(luò)(CNNs),但你當然也可以用(我更喜歡用Keras和mxnet來做CNNs)。我主要用nolearn來制作Deep Belief Networks (DBNs)。
9.DIGITS
DIGITS并不是一個真正的深度學習庫(雖然它是用Python寫的)。DIGITS(深度學習GPU培訓系統(tǒng))實際上是用于培訓Caffe深度學習模式的web應(yīng)用程序(雖然我認為你可以破解源代碼然后使用Caffe以外其他的后端進行工作,但這聽起來就像一場噩夢)。
如果你曾經(jīng)用過Caffe,那么你就會知道通過它的終端來定義.prototxt文件、生成圖像數(shù)據(jù)、運行網(wǎng)絡(luò)并監(jiān)管你的網(wǎng)絡(luò)訓練是相當繁瑣的。 DIGITS旨在通過讓你在瀏覽器中執(zhí)行這些任務(wù)來解決這個問題。
此外,DIGITS的用戶界面非常出色,它可以為你提供有價值的統(tǒng)計數(shù)據(jù)和圖表作為你的模型訓練。另外,你可以通過各種輸入輕松地可視化網(wǎng)絡(luò)中的激活層。最后,如果您想測試一個特定的圖像,您可以把圖片上傳到你的DIGITS服務(wù)器或進入圖片的URL,然后你的Caffe模型將會自動分類圖像并把結(jié)果顯示在瀏覽器中。干凈利落!
福利:
10.Blocks
說實話,雖然我一直想嘗試,但截至目前我的確從來沒用過Blocks(這也是我把它包括在這個列表里的原因)。就像許多個在這個列表中的其他庫一樣,Blocks建立在Theano之上,呈現(xiàn)出一個用戶友好型的API。
11.deepy
如果讓你猜deepy是圍繞哪個庫建立的,你會猜什么?
沒錯,就是Theano。
我記得在前一段時間用過deepy(做了初始提交),但在接下里的大概6-8個月我都沒有碰它了。我打算在接下來的博客文章里再嘗試一下。
12.pylearn2
雖然我從沒有主動地使用pylearn2,但由于歷史原因,我覺得很有必要把它包括在這個列表里。 Pylearn2不僅僅是一般的機器學習庫(地位類似于scikit-learn),也包含了深度學習算法的實現(xiàn)。
對于pylearn2我最大的擔憂就是(在撰寫本文時),它沒有一個活躍的開發(fā)者。正因為如此,相比于像Keras和mxnet這樣的有積極維護的庫,推薦pylearn2我還有些猶豫。
13.Deeplearning4j
這本應(yīng)是一個基于Python的列表,但我想我會把Deeplearning4j包括在這里,主要是出于對他們所做事跡的無比崇敬——Deeplearning4j為JVM建立了一個開源的、分布式的深度學習庫。
如果您在企業(yè)工作,你可能會有一個塞滿了用過的Hadoop和MapReduce服務(wù)器的儲存器。也許這些你還在用,也許早就不用了。
你怎樣才能把這些相同的服務(wù)器應(yīng)用到深度學習里?
事實證明是可以的——你只需要Deeplearning4j。
深入研究深度學習和卷積神經(jīng)網(wǎng)絡(luò)
圖1:了解PyImageSearch大師課程內(nèi)的如何利用深度學習和卷積神經(jīng)網(wǎng)絡(luò)對圖像內(nèi)容進行分類
總結(jié)
在這篇文章中,我回顧了一些我最喜愛的深度學習和卷積神經(jīng)網(wǎng)絡(luò)庫。但這個列表決不是詳盡的,而且專注于計算機視覺和卷積神經(jīng)網(wǎng)絡(luò)的深度學習庫肯定是有失偏頗的。
盡管這樣說,但對于一個剛剛進入深度學習領(lǐng)域,并在尋找一個合適的庫的人,我認為這確實是一個偉大的列表。
我個人認為打敗Keras和mxne是很難的事。Keras庫位于計算的龍頭地位,如Theano和TensorFlow,可以讓您只需幾行Python代碼就可以構(gòu)建深度學習架構(gòu)。
雖然mxnet可能需要更多一點的代碼來構(gòu)建和培養(yǎng)網(wǎng)絡(luò),但它能夠輕松高效地將培養(yǎng)任務(wù)分配到多個GPU中。如果你在一個多GPU系統(tǒng)或環(huán)境中,并希望充分利用這個環(huán)境,那就肯定要試一試mxnet。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10