深度學習(deep learning,以下簡稱DL),可以說是基于人工神經(jīng)網(wǎng)絡的機器學習。區(qū)別于傳統(tǒng)的機器學習,DL需要更多樣本,換來更少的人工標注和更高的準確率。
DL利用深度來取代廣度,進一步降低參數(shù),提高擬合能力,很多情況下都比傳統(tǒng)機器學習表現(xiàn)好。但DL和傳統(tǒng)機器學習一樣,DL學習的是一個映射f(x)=y,比如x是輸入的手寫數(shù)字圖片,那么y就是0~9中的一個。
傳統(tǒng)的BP((back propagation)反向傳播)神經(jīng)網(wǎng)絡一般指三層的全連接神經(jīng)網(wǎng)絡,而大于三層就成了DNN(深度神經(jīng)網(wǎng)絡)。
事實上,DNN能解決一些問題,但因為參數(shù)太多,逐步被其他網(wǎng)絡模型取代:CNN(卷積神經(jīng)網(wǎng)絡)、RNN(循環(huán)神經(jīng)網(wǎng)絡)。二者目前最成功的實現(xiàn)分別是ResNet和LSTM。
以下拿計算機視覺相關研究領域來舉例,所有x都是若干輸入圖片。
如果f(x)=y中,y是一個n色圖,表征了x中n個目標及其位置呢?這就是大名鼎鼎的語義分割:
語義分割示意圖
只需要將CNN結構稍作修改就可以了,先降維再升維,就能完成映射。
那如果f(x)=y中,y是一個邊框,框住輸入的天空圖片x中小鳥的位置呢?當然有CNN和滑動窗口可以完成,但太慢了。于是Faster-RCNN誕生了,可以快速提取到圖片中目標的位置,并畫出邊框。
利用深度學習畫出圖像邊框
但是,如果f(x)=y中,x和y都是圖片呢?也就是說,我希望通過對圖片的學習,生成一些相似圖片,該怎么做呢?GAN(生成式對抗網(wǎng)絡)因此誕生。這個網(wǎng)絡的想法是,用一個網(wǎng)絡模型來生成目標,叫做生成器;然后用另一個或多個網(wǎng)絡模型來實現(xiàn)判別,叫做判別器。判別器提升自己的判別能力,將生成的假目標與真實的目標區(qū)分開;而生成器提升自己的生成能力,將生成的假目標做得真實,試圖騙過判別器。目前最成功的實現(xiàn)是style-GAN。
生成式對抗網(wǎng)絡








暫無數(shù)據(jù)