99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀初學(xué)者必看丨如何成為一名數(shù)據(jù)科學(xué)家
初學(xué)者必看丨如何成為一名數(shù)據(jù)科學(xué)家
2017-12-22
收藏

初學(xué)者必看丨如何成為一名數(shù)據(jù)科學(xué)家

想從事數(shù)據(jù)科學(xué)領(lǐng)域的初學(xué)者總是很困惑:應(yīng)該學(xué)習(xí)哪種編程語言?專業(yè)重要嗎?需要掌握哪些工具和技能?在這篇文章中,你的這些問題都能得到解答。

幾星期前,我發(fā)布了我的第二篇Kaggle Kernel( Kernel: Kaggle 中用于探索概念、展示技術(shù)或分享解決方案的短腳本)。我對Kaggle最近發(fā)布的“機器學(xué)習(xí)和數(shù)據(jù)科學(xué)現(xiàn)狀”調(diào)查很感興趣,并認(rèn)為我可以從中得出一些有趣的見解。我以為大多數(shù)寫Kernel的人都已經(jīng)是數(shù)據(jù)科學(xué)家了,比起如何入門,他們應(yīng)該對其他的內(nèi)容更感興趣。

令我驚訝的是,我贏得了每周一次的Kernel獎,我的這篇Kernel最終獲得了超過預(yù)期的關(guān)注度。

在這里我把這篇分享給大家,探究如何成為一名數(shù)據(jù)科學(xué)家。

一、編程語言

據(jù)我所知,數(shù)據(jù)科學(xué)領(lǐng)域有兩種語言是最常用的,即Python和R語言。我個人比較喜歡R語言,但是好奇在實際情況中是什么樣的。

我根據(jù)受訪者的職位,比較選擇Python或R語言作為主要編程語言的人數(shù)。事實證明,除了統(tǒng)計學(xué)和運籌學(xué)之外,其他職位中使用Python的人數(shù)更多。然而這兩個領(lǐng)域,特別是運籌學(xué)由于樣本量太小,以至于結(jié)果的參考價值并不高。

二、專業(yè)和職位

我想知道哪些專業(yè)傾向選擇哪些職位,因此我創(chuàng)建了比較大學(xué)專業(yè)和所選職位的圖表。

當(dāng)然,計算機科學(xué)專業(yè)的人群會成為計算機科學(xué)家,程序員和軟件工程師。數(shù)學(xué)專業(yè)的人群會選擇預(yù)測建模,數(shù)據(jù)科學(xué)和統(tǒng)計學(xué)職位,物理專業(yè)則傾向于進入研究領(lǐng)域。

圖表中一個有趣的信息是,每個職位都有至少一名非此專業(yè)的人士。這表明,只要你有理想,所學(xué)專業(yè)不是限制做你想做的事情的理由。

三、學(xué)習(xí)資源

用來學(xué)習(xí)數(shù)據(jù)科學(xué)的在線資源特別豐富。我很好奇對于調(diào)查的受訪者來說哪些在線資源是最有用的。

事實證明,人們認(rèn)為創(chuàng)建項目,參加課程,參加Kaggle挑戰(zhàn)是學(xué)習(xí)和了解數(shù)據(jù)科學(xué)最有用的方法。我很喜歡從事數(shù)據(jù)科學(xué)的項目,并在完成項目的過程中一步步成長為一名數(shù)據(jù)科學(xué)家。

四、重要的工作技能

調(diào)查的另一個問題是詢問受訪者,他們認(rèn)為在工作中最有用的技能是什么。

掌握Python和統(tǒng)計知識被認(rèn)為是最有用的工作技能。這方面R語言略微落后于Python,這反映了第一張圖的情況。有趣的是,MOOC(大型開放式網(wǎng)絡(luò)課程)在實用性方面得分最低。然而上一張圖中,人們認(rèn)為在線課程是學(xué)習(xí)數(shù)據(jù)科學(xué)最有用的資源之一。這也讓我感覺不是跟確定,是不是受訪者認(rèn)為在找工作時,MOOC不應(yīng)該被用作認(rèn)證。

五、實際運用的工具

受訪者也被問到,他們認(rèn)為哪些技術(shù)在日常工作中最有用。在以下圖表中,我分析了所有受訪者的情況,以及具體的職位情況。

Python被評為整個行業(yè)中最需要掌握的技術(shù)。R語言排名第三位。每個職位都說要用到SQL、Jupyter、Unix和TensorFlow了。表明這些可能是不久之后需要掌握的重要技術(shù)。

六、實際運用的方法

與上一個問題類似,受訪者被問到,他們在工作中實際運用到的數(shù)據(jù)科學(xué)方法。

我們可以看到,每個職業(yè)的人群都用到了數(shù)據(jù)可視化、交叉驗證、邏輯回歸決策樹。機器學(xué)習(xí)工程師則要經(jīng)常使用自然語言處理和神經(jīng)網(wǎng)絡(luò)技術(shù)。其他職位有相應(yīng)的方法需要經(jīng)常使用。

結(jié)論

我喜歡運用龐大的數(shù)據(jù)集,這將非常適合我今后的工作。如果你是一名數(shù)據(jù)科學(xué)家新手,并且正在找工作,那么我給你列出以下幾幾條建議:

1.學(xué)習(xí) Python

Python和R語言都已經(jīng)存在數(shù)十年了。但正如我們在第一張圖中看到的那樣,在大多數(shù)情況下Python是勝出的。圖四和圖五也反應(yīng)了這一情況。很難找到一家不使用Python的公司,所以學(xué)好Python絕對是沒錯的。

2.專業(yè)選擇計算機科學(xué)或數(shù)學(xué)

正如圖二所示,每個職位都有不同的專業(yè)。然而根據(jù)圖中的比例來看,每個職位中計算機科學(xué)和數(shù)學(xué)人數(shù)是最多的。雖然這不是必須的,但這兩個專業(yè)能讓你在求職中獲得一些優(yōu)勢。

3.創(chuàng)建項目、參加課程、參與Kaggle挑戰(zhàn)

正如圖三所示,學(xué)習(xí)數(shù)據(jù)科學(xué)方面有些方法特別實用。

4.了解廣泛使用的工具

有無數(shù)的工具可供我們使用,但通過這次調(diào)查,我們了解到哪些是主流的工具。

我希望以上幾點能夠幫助你起步,逐步成為一名數(shù)據(jù)科學(xué)家。祝你好運!



數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }