99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀一名合格的機器學習工程師需要具備的5項基本技能,你都get了嗎?
一名合格的機器學習工程師需要具備的5項基本技能,你都get了嗎?
2016-04-20
收藏
你是否對機器學習充滿興趣呢?其實到目前為止,每天有越來越多的工程師開始將好奇的目光轉(zhuǎn)向機器學習領(lǐng)域。實際上,你會發(fā)現(xiàn)現(xiàn)在沒有哪一個領(lǐng)域比機器學習能引起更多的曝光率和關(guān)注度。機器學習已經(jīng)以一種高調(diào)姿態(tài)闖入廣大民眾的意識當中,無論是采用機器學習等相關(guān)技術(shù)的Google AlphaGo以5局4勝的戰(zhàn)績打敗人類世界的圍棋冠軍,還是采用了機器學習技術(shù)的Twitter能夠鑒定是否你在酩酊大醉的時候發(fā)布了推文,無論你通過怎樣的方式發(fā)現(xiàn)并知道機器學習技術(shù)的存在,有一件事不言而喻:機器學習的時代已經(jīng)到來。

盡管機器學習技術(shù)看起來這般神器,但是對于機器學習技術(shù)的好奇心是一碼事兒,而想要讓該技術(shù)在相關(guān)產(chǎn)業(yè)當中發(fā)揮作用實際上又是另外一碼事兒。這篇文章將會幫助你了解作為一名機器學習工程師具備怎樣的思維方式以及需要什么樣的專業(yè)技能才可以開展工作。
如果你正在考慮投身機器學習工程師的職業(yè)生涯,那么在一開始的時候,你必須弄清楚兩件非常重要的事情。首先,機器學習工程師的崗位并不是一個“純粹的”學術(shù)角色,你不需要具備科學研究經(jīng)驗或者專業(yè)的學術(shù)教育背景。其次,如果你僅僅具備軟件工程師的能力或者僅僅具備數(shù)據(jù)科學的經(jīng)驗還遠無法成為一名合格的機器學習工程師,除非你同時掌握以上兩方面的技術(shù)經(jīng)驗。
數(shù)據(jù)分析 Vs. 機器學習工程師
如果想成為一名機器學習工程師,那么你必須弄清楚前者和數(shù)據(jù)分析師之間的區(qū)別,而且這非常重要。簡單來講,兩者之間最為關(guān)鍵的區(qū)別就是他們最終的目標大相徑庭。作為一位數(shù)據(jù)分析師,你的主要職責就是分析數(shù)據(jù),并從這些抽象的數(shù)據(jù)當中提煉出具體的能讓大家明白的故事,并從中產(chǎn)生具有可行性的洞察。數(shù)據(jù)分析工作的重點就是向公眾傳播并展示圖表、模型已經(jīng)可視化效果。數(shù)據(jù)的分析和展示由人類執(zhí)行,并且其他人會根據(jù)你展示的數(shù)據(jù)做出商業(yè)決策。尤其是這一點必須引起你足夠的重視——你數(shù)據(jù)分析后產(chǎn)生的結(jié)果的“受眾”是人。但是從機器學習工程師的角度來看的話,他們最終輸出的結(jié)果是一種可以工作的軟件(而不是你一路以來創(chuàng)建的分析結(jié)果或者可視化圖形),并且你所輸出結(jié)果的“受眾”通常由其他軟件插件組成,只需很少在少量人力勞動的監(jiān)護下這些軟件插件就可以自行運轉(zhuǎn)。軟件的智能性意味著可行性,但是在機器學習模型中,決策的制定由系統(tǒng)來決定,并且系統(tǒng)可以影響產(chǎn)品或者服務(wù)的行為方式。這就是軟件工程技術(shù)為什么對機器學習工程師而言如此重要。
Understanding The Ecosystem——弄懂軟件的生態(tài)系統(tǒng)
在你開始著手學習具體技能之前,我還要再向大家闡明另外一個概念。成為一名機器學習工程師必須要求你自己能夠清楚地了解你所設(shè)計的整個軟件系統(tǒng)。
讓我們打個比方,如果你正在為一個連鎖店項目工作,并且公司需要根據(jù)客戶以往的購買歷史開始有針對性的發(fā)放優(yōu)惠券,目的是想生成能夠讓消費者可以實際使用的優(yōu)惠券。在數(shù)據(jù)分析模型當中,你可以收集消費者的采購數(shù)據(jù),對這些數(shù)據(jù)分析之后可以觀察出消費者的采購行為趨勢,并據(jù)此提出響應(yīng)的策略。機器學習的方法是編寫一個可以自動生成優(yōu)惠券的系統(tǒng)。但是學習采取什么方式才能編寫出這樣一種系統(tǒng)呢?這種方式奏效嗎?你不得不去通盤了解項目開發(fā)所處的生態(tài)系統(tǒng)——包括商品庫存、商品類目、價格、采購訂單、銷售點終端軟件、CRM管理系統(tǒng)等等。
歸根結(jié)底,項目的處理流程和機器學習算法的理解關(guān)系不大,或者和應(yīng)用他們的方式和時間也沒有太多關(guān)系,但是卻需要你能夠?qū)ο到y(tǒng)的相互關(guān)聯(lián)性有很深入的了解,并需要你可以成功編寫一個具有高度集成和接口功能的軟件。請切記,機器學習輸出的結(jié)果實際上是一個可以有效運行的軟件!
現(xiàn)在,就讓我們開始了解成為一名機器學習工程師所需要注意的各種細節(jié)方面的事宜。我們會把這些信息分成兩個基本點進行闡述:技能簡介以及語言和庫。首先我們將從技能介紹開始,在日后的內(nèi)容中我們將介紹機器學習的語言和庫。
技能簡介
1. Computer Science Fundamentals and Programming
計算機科學基礎(chǔ)和編程
機器學習工程師而言,計算機科學基礎(chǔ)的重要性包括數(shù)據(jù)結(jié)構(gòu)(數(shù)據(jù)堆棧、隊列、多位數(shù)組、樹形以及圖像等等)、算法(搜索、分類、優(yōu)化、動態(tài)編程等)、科計算性與復雜性(P對NP、NP完全問題、大O符號以及近似算法等)和計算機架構(gòu)(存儲、緩存、帶寬、死鎖和分布式處理等等)。
當你在編程的時候必須能夠?qū)σ陨咸岬降倪@些基礎(chǔ)知識進行應(yīng)用、執(zhí)行、修改或者處理。課后練習、編碼競賽還有黑客馬拉松比賽都是你不可或缺的磨練技能的絕佳途徑。
2. Probability and Statistics
概率論和數(shù)理統(tǒng)計
概率的形式表征(條件概率、貝葉斯法則、可能性、獨立性等)和從其中衍生出的技術(shù)(貝葉斯網(wǎng)、馬爾科夫決策過程、隱藏式馬可夫模型等)是機器學習算法的核心,這些理論可以用來處理現(xiàn)實世界中存在的不確定性問題。和這個領(lǐng)域密切相關(guān)的還有統(tǒng)計學,這個學科提供了很多種衡量指標(平均值、中間值、方差等)、分布(均勻分布、正態(tài)分布、二項式分布、泊松分布等)和分析方法(ANOVA、假設(shè)實驗等),這些理論對于觀測數(shù)據(jù)模型的建立和驗證非常必要。很多機器學習算法的統(tǒng)計建模程序都是可以擴展的。
3. Data Modeling and Evaluation
數(shù)據(jù)建模及評估
數(shù)據(jù)建模就是對一個給定的數(shù)據(jù)庫的基本結(jié)構(gòu)進行評估的過程,目的就是發(fā)現(xiàn)其中所蘊含的有用模式(相互關(guān)系,聚合關(guān)系、特征矢量等)和/或者預(yù)測以前案例(分類,回歸、異常檢測等)的特征。評估過程的關(guān)鍵就是不斷地對所給模型的優(yōu)良性能進行評價。根據(jù)手中的任務(wù),你需要選取一種恰當?shù)木珳?誤差衡量指標(比如日志分類的損失、線性回歸的誤差平方和等等)和求值策略(培訓測試、連續(xù)Vs. 隨機交叉驗證等)。通過對算法的反復學習,我們可以發(fā)現(xiàn)其中會存在很多誤差,而我們可以根據(jù)這些誤差對模型(比如神經(jīng)網(wǎng)絡(luò)的反相傳播算法)進行細微的調(diào)整,因此即使你想能夠運用最基本的標準算法,也需要你對這些測量指標有所了解。
4. Applying Machine Learning Algorithms and Libraries
應(yīng)用機器學習算法和庫
盡管通過程式庫/軟件包/API(比如scikit-learn,Theano, Spark MLlib, H2O, TensorFlow等)可以廣泛地實現(xiàn)機器學習算法的標準化執(zhí)行,但是算法的應(yīng)用還包括選取合適的模型(決策、樹形結(jié)構(gòu)、最近鄰點、神經(jīng)網(wǎng)絡(luò)、支持向量機器、多模型集成等)、適用于數(shù)據(jù)的學習程序(線性回歸、梯度下降法、基因遺傳算法、袋翻法、模型特定性方法等),同時還需要你能夠了解超參數(shù)對學習產(chǎn)生影響的方式。你也需要注意不同方式之間存在的優(yōu)勢和劣勢,以及那些可能會讓你受牽絆的大量陷阱(偏差和方差、高擬合度與低擬合度、數(shù)據(jù)缺失、數(shù)據(jù)丟失等)。對于數(shù)據(jù)科學和機器學習所帶來的這些方面的挑戰(zhàn),大家可以去Kaggle網(wǎng)站獲取很多學習參考,你可發(fā)現(xiàn)不同的問題當中存在的細微差別,從而可以讓你更好的掌握機器學習的算法。
5. Software Engineering and System Design
軟件工程和系統(tǒng)設(shè)計
在每天工作結(jié)束的時候,機器學習工程師通常產(chǎn)生的成果或者應(yīng)交付的產(chǎn)品就是一種軟件。這種軟件其實也是一種小型插件,它可以適用于相對更大型的產(chǎn)品或者服務(wù)的生態(tài)系統(tǒng)。你需要很好地掌握如何才能讓這些彼此不同的小插件協(xié)同工作,并與彼此進行流暢的溝通(使用庫函數(shù)調(diào)用、數(shù)據(jù)接口、數(shù)據(jù)庫查詢等)的方法,為了讓其他的插件可以依附你的插件進行很好的工作,你也得需要為你的差價建立合適的接口。精心設(shè)計的系統(tǒng)可以避免以后可能出現(xiàn)的瓶頸問題,并讓你的算法系統(tǒng)滿足數(shù)據(jù)量激增時候的擴展性能。軟件工程的最佳的實踐經(jīng)驗(需求分析、系統(tǒng)設(shè)計、模塊化、版本控制、測試以及歸檔等)對于產(chǎn)能、協(xié)作、質(zhì)量和可維護性而言是不可獲取的無價之寶。
Machine Learning Job Roles——機器學習的工作角色
由于現(xiàn)在越來越多的公司開始嘗試采用新興技術(shù)為自己挖掘更多的利潤,于是和機器學習相關(guān)的崗位需求也在不斷的增加。下面這幅圖片為大家展示了和數(shù)據(jù)分析師相比,對于一名典型的機器學習工程師而言,相對重要的核心技能包含以下內(nèi)容:

The Future of Machine Learning——機器學技術(shù)的發(fā)展展望
機器學習工程師最讓人欲罷不能的特征或許就是這個崗位角色擁有看起來無所不能的廣泛適應(yīng)性。包括教育行業(yè)、計算機科學還有更多領(lǐng)域在內(nèi)的很多行業(yè)已經(jīng)受到了機器學習的積極影響。實際上你會發(fā)現(xiàn)沒有哪個領(lǐng)域不會應(yīng)用機器學習技術(shù)。對于某些行業(yè)案例而言,他們對機器學習技術(shù)有極其迫切的需求。健康醫(yī)療產(chǎn)業(yè)就是一個顯而易見的例子。機器學習技術(shù)已經(jīng)在健康醫(yī)療長夜中的很多重要領(lǐng)域得到了廣泛的應(yīng)用,無論是致力于減少護理差異,還是醫(yī)學掃描分析,機器學習技術(shù)正在潛移默化地為這些領(lǐng)域帶來改變。來自紐約大學的數(shù)學科學克朗學院和數(shù)據(jù)科學中心的助理教授David Sontag先生最近發(fā)表了關(guān)于機器學習技術(shù)和健康醫(yī)療系統(tǒng)的演講,在演講中他討論了機器學習是如何通過自己的潛力改變了整個醫(yī)療產(chǎn)業(yè)。

毫無疑問,這個世界正在發(fā)生著快速和戲劇性的轉(zhuǎn)變。對于機器學習工程師的需求正在呈現(xiàn)指數(shù)型的增長趨勢。世間充滿了復雜的挑戰(zhàn),并因此需要更加復雜的系統(tǒng)才可以將這些挑戰(zhàn)迎刃而解。而機器學習工程師們就是可以建造這些系統(tǒng)的最佳人選。如果你的未來需要借助機器學習技術(shù)獲得更好的發(fā)展,那么此時此刻就是你邁出腳步掌握相關(guān)技能并開發(fā)你思維的最佳時機!

來源 | 化學數(shù)據(jù)聯(lián)盟

責任編輯 | 李佳燕



數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }