99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀前景、行業(yè)、技能……關(guān)于機(jī)器學(xué)習(xí)入門,你想知道的都在這兒!
前景、行業(yè)、技能……關(guān)于機(jī)器學(xué)習(xí)入門,你想知道的都在這兒!
2016-03-24
收藏
每天一個(gè)數(shù)據(jù)分析師」第19期內(nèi)容奉上,請(qǐng)享用~

編者按:

圍棋人機(jī)大戰(zhàn)一役,火的不僅是AlphaGo和李世石,還有機(jī)器學(xué)習(xí)。作為人工智能的一個(gè)分支,機(jī)器學(xué)習(xí)越來越受到矚目。本期C君采訪了計(jì)算機(jī)科學(xué)博士鄒博老師,為有志于機(jī)器學(xué)習(xí)的小伙伴提供一些經(jīng)驗(yàn)分享。

近期,CDA也邀請(qǐng)鄒博老師開設(shè)了機(jī)器學(xué)習(xí)課程,開課在即,可在文尾掃碼了解更多詳情。

Question=DA
Answer=鄒博

DA:能否簡(jiǎn)單地闡述一下機(jī)器學(xué)習(xí)的概念?

鄒博:以機(jī)動(dòng)車自動(dòng)駕駛為例,假定已經(jīng)完成了視頻采集和信號(hào)轉(zhuǎn)換的前提下,如果使用傳統(tǒng)算法,一種思路是列舉所有的交通規(guī)則,分為道路擁擠、行駛緩慢、較慢、暢通等情況,按照事先給定的規(guī)則對(duì)機(jī)動(dòng)車操作完成各項(xiàng)動(dòng)作,達(dá)到起步、加速、剎車、拐彎等功能。

很明顯的是,由于路況信息復(fù)雜,窮盡所有情況是不可能的;因此,可以在給定一個(gè)響應(yīng)模型的前提下,使用各種模擬的路況(即樣本)訓(xùn)練這個(gè)模型,通過正負(fù)反饋對(duì)模型的參數(shù)進(jìn)行調(diào)整。當(dāng)參數(shù)收斂或者達(dá)到某要求時(shí),我們認(rèn)為訓(xùn)練結(jié)束。然后就可以在各種路況下做驗(yàn)證和測(cè)試了。

這個(gè)例子說明:讓機(jī)器在給定大量樣本的前提下,不斷的調(diào)整參數(shù)——這個(gè)過程就像讓機(jī)器來學(xué)習(xí)一樣,這就是“機(jī)器學(xué)習(xí)”。多說一句的是,雖然我們舉的例子是“機(jī)動(dòng)車”,但Machine Learning中的Machine是指的分類器、模型的意思,只不過大家看到的自動(dòng)駕駛、AlphaGO等是成型的產(chǎn)品,必然是某個(gè)“機(jī)器”罷了。如SVM(Support Vector Machine)中的字母M,就是Machine——在某些向量(點(diǎn),vertor)的支持(support)下的一個(gè)分類器(machine)。


DA:經(jīng)過人機(jī)圍棋大戰(zhàn)事件,很多人對(duì)人工智能產(chǎn)生了興趣,機(jī)器學(xué)習(xí)與人工智能是一種怎么樣的關(guān)系?

鄒博機(jī)器學(xué)習(xí)可以在一定程度上看成是人工智能的分支。讓機(jī)器在給定大量樣本的前提下,不斷的調(diào)整參數(shù),最終得到(近似)最優(yōu)的參數(shù)值,從而具備預(yù)測(cè)、分類、決策等功能。

DA:在國內(nèi),機(jī)器學(xué)習(xí)的應(yīng)用現(xiàn)狀和前景是怎樣的?

鄒博:火爆!

DA:機(jī)器學(xué)習(xí)主要應(yīng)用于什么行業(yè)?有哪些應(yīng)用形式?

鄒博機(jī)器學(xué)習(xí)在圖像處理、語音識(shí)別、自然語言處理方面發(fā)揮了越來越大的作用,如使用GBDT選擇特征,配合Logistic做分類,已經(jīng)成了點(diǎn)擊率預(yù)估的經(jīng)典模型。同時(shí),機(jī)器學(xué)習(xí)也滲透到各個(gè)傳統(tǒng)行業(yè)中產(chǎn)生巨大的社會(huì)價(jià)值。

舉例來說,以前可以使用隱馬爾科夫模做語音識(shí)別,說話人的語音信號(hào)可以轉(zhuǎn)化成文字輸出(這就為接下來的文本翻譯、文字到語音兩個(gè)步驟做了準(zhǔn)備,即機(jī)器的“同聲傳譯”問題);當(dāng)前可以使用深度學(xué)習(xí)的方式,將錯(cuò)誤率大幅度降低,逐步逼近實(shí)用化水平。

剛剛結(jié)束的AlphaGO和李世石的人機(jī)大戰(zhàn),就是經(jīng)典的卷積網(wǎng)絡(luò)的應(yīng)用(再配合機(jī)器學(xué)習(xí)方法做快速預(yù)估);而這個(gè)模型最吸引人的是它的通用性——通過給定其他樣本,AlphaGO學(xué)到參數(shù)后就可以用于醫(yī)療等其他領(lǐng)域,這和以往的AI模型(如深藍(lán)DeepBlue)是不同的。

另外,在人臉識(shí)別、目標(biāo)檢測(cè)、擁塞預(yù)測(cè)等傳統(tǒng)的數(shù)據(jù)處理領(lǐng)域,機(jī)器學(xué)習(xí)更是完全勝任。

DA:對(duì)于初學(xué)者來說,機(jī)器學(xué)習(xí)的難點(diǎn)在哪里?

鄒博:對(duì)于機(jī)器學(xué)習(xí)的掌握,我覺得至少分為三個(gè)方向:

1.對(duì)機(jī)器學(xué)習(xí)的算法做理論分析和改進(jìn),推動(dòng)學(xué)科發(fā)展。

達(dá)到這一要求,需要有深厚的理論功底和科研能力,大體上,或許需要優(yōu)秀的博士經(jīng)歷(或與之相當(dāng)?shù)乃剑┘右稽c(diǎn)點(diǎn)天賦。但這決不是“與我無關(guān)”的一個(gè)發(fā)展方向,現(xiàn)在機(jī)器學(xué)習(xí)界中的中國人面孔越來越多,一定程度上說明中國人蠻適合做相關(guān)工作的。

2.團(tuán)隊(duì)的技術(shù)負(fù)責(zé)與核心。

如果達(dá)到這一點(diǎn),需要:

(1)對(duì)數(shù)學(xué)有自己的理解——個(gè)人認(rèn)為,對(duì)數(shù)學(xué)需要有“Gauss式的硬推導(dǎo)+Eular式的直觀理解”;

(2)對(duì)機(jī)器學(xué)習(xí)的算法本身清晰理解——適用環(huán)境是什么、參數(shù)如何選擇、優(yōu)缺點(diǎn)有哪些、算法之間的橫向比較等;

(3)編碼實(shí)現(xiàn)能力。能夠使用至少一種語言,把自己的想法付諸實(shí)踐并根據(jù)數(shù)據(jù)本身做自適應(yīng)的調(diào)整——不要認(rèn)為大牛不會(huì)編碼,世界上從來沒有出現(xiàn)過不會(huì)編程的頂級(jí)人才;

(4)熟悉開源庫和數(shù)據(jù)處理工具;熟練而恰當(dāng)?shù)氖褂霉ぞ?,提高效率?/span>

我想,這個(gè)職業(yè)要求是絕大多數(shù)人機(jī)器學(xué)習(xí)者的努力目標(biāo)。

3.能夠使用各項(xiàng)開源庫,勝任項(xiàng)目和任務(wù)要求。

達(dá)到這個(gè)要求,是能夠跟別人說“我是做機(jī)器學(xué)習(xí)的”最低要求;但這依然需要熟悉數(shù)據(jù)清洗、特征選擇、算法調(diào)參、效果解釋等內(nèi)容,熟悉各種算法的適用條件,根據(jù)遇到的樣本分布做最合理的選擇或組合。如果能夠熟悉各個(gè)算法本身的技術(shù)原理、時(shí)空復(fù)雜度,將有極大的幫助。

可以看出,每個(gè)方向有各個(gè)方向的要求,并且這3個(gè)方向沒有先后難易之分??梢愿鶕?jù)自己的興趣和期望做最合適的規(guī)劃。


DA:如果初學(xué)者想要進(jìn)行機(jī)器學(xué)習(xí),需要經(jīng)過一個(gè)什么樣的過程?

鄒博:如果以剛才談到的3個(gè)方向?yàn)榛A(chǔ),學(xué)習(xí)過程是不一樣的。這就是有人認(rèn)為“數(shù)學(xué)非常重要”,有人說“特征選擇才是根本”的原因。其實(shí),我覺得這個(gè)課程本身就是蠻好的學(xué)習(xí)過程,不是么?:)


DA:能否按照從入門到進(jìn)階的順序,推薦一些參考書目、學(xué)習(xí)網(wǎng)站和博客等資料?

鄒博:推薦看這幾本:

Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer-Verlag, 2006

Kevin P. Murphy, Machine Learning:A Probabilistic Perspective, The MIT Press, 2012

李航,統(tǒng)計(jì)學(xué)習(xí)方法,清華大學(xué)出版社,2012

Stephen Boyd,Lieven Vandenberghe, Convex Optimization, Cambridge University Press, 2004

Thomas M. Cover, Joy A. Thomas, Elements of Information Theory,2006

此外,各個(gè)章節(jié)有特定的經(jīng)典論文,如:

Alex Rodriguez, Alessandro Laio, Clustering by fast search and find of density peaks, Science 344.6191, 2014

David M. Blei, Andrew Y. Ng, Michael I. Jordan, Latent Dirichlet Allocation, 2003


鄒博

北師大計(jì)算機(jī)博士畢業(yè),在科學(xué)院從事機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘科研工作,主持完成三維計(jì)算幾何行業(yè)建模軟件,擅長(zhǎng)方向?yàn)?a href='/map/jiqixuexi/' style='color:#000;font-size:inherit;'>機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理、計(jì)算幾何。主持三維數(shù)字地質(zhì)圖制圖技術(shù)及其應(yīng)用、三維地質(zhì)建模應(yīng)用示范研究、遙感信息解譯與像元增強(qiáng)研究等多項(xiàng)部級(jí)科研項(xiàng)目,對(duì)大型軟件架構(gòu)有深刻理解,改進(jìn)了多項(xiàng)遙感圖像的分割、分類、增強(qiáng)算法并用于實(shí)際。在多家大學(xué)和教育機(jī)構(gòu)擔(dān)任機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘講師,實(shí)戰(zhàn)經(jīng)驗(yàn)豐富,算法推導(dǎo)細(xì)致透徹,廣受學(xué)員好評(píng)。





數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }