99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀想入門數(shù)據(jù)科學(xué)領(lǐng)域?明確方向更重要
想入門數(shù)據(jù)科學(xué)領(lǐng)域?明確方向更重要
2018-12-18
收藏

作者 | Jeremie Harris

翻譯 | Mika

CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)

 

我在一家數(shù)據(jù)科學(xué)培訓(xùn)公司工作。對(duì)于學(xué)員,我常常給出的建議并不是推薦庫(kù)或者工具,而是讓他們首先明確自己想成為什么樣的數(shù)據(jù)科學(xué)家,確定自己的方向。


當(dāng)中的原因在于,數(shù)據(jù)科學(xué)并不是單一且定義明確的領(lǐng)域,公司并不會(huì)雇用所謂的全能型數(shù)據(jù)科學(xué)家,而是會(huì)選擇有擁專業(yè)技能的個(gè)人。


為了更好的理解,假設(shè)你們公司想聘請(qǐng)數(shù)據(jù)科學(xué)家。那么,你們肯定有明確的問(wèn)題需要解決,而這需要具體的技術(shù)知識(shí)和專業(yè)知識(shí)。例如,有些公司將簡(jiǎn)單模型應(yīng)用于大型數(shù)據(jù)集;有些公司將復(fù)雜模型應(yīng)用于小型模型;有些公司需要?jiǎng)討B(tài)訓(xùn)練模型;有些公司根本不使用(傳統(tǒng))模型。


以上這些都需要完全不同的技能。對(duì)于想進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的人群收到的建議往往是:學(xué)習(xí)使用Python,構(gòu)建分類/回歸/聚類等項(xiàng)目在開(kāi)始找工作,這其實(shí)是不太合理的。


數(shù)據(jù)科學(xué)家在工作中承擔(dān)了很多責(zé)任。人們會(huì)將過(guò)多的內(nèi)容歸入“數(shù)據(jù)科學(xué)”的范疇。為生產(chǎn)構(gòu)建強(qiáng)大的數(shù)據(jù)管道,這應(yīng)該是數(shù)據(jù)科學(xué)方面的問(wèn)題。開(kāi)發(fā)一種新的神經(jīng)網(wǎng)絡(luò),這應(yīng)該是數(shù)據(jù)科學(xué)方面的問(wèn)題。


這種現(xiàn)象并不好,因?yàn)檫@會(huì)讓有抱負(fù)的數(shù)據(jù)科學(xué)家失去方向和對(duì)特定問(wèn)題的關(guān)注。


為了避免成為全能型數(shù)據(jù)科學(xué)家,再次之前讓我們先了解數(shù)據(jù)科學(xué)領(lǐng)域主要有哪些職位,以及他們常常被混淆的原因:


1. 數(shù)據(jù)工程師


> 職位描述

為處理大量數(shù)據(jù)的公司管理數(shù)據(jù)管道。這意味著在數(shù)據(jù)需要從源頭進(jìn)行有效地收集和檢索,而且在使用前需要進(jìn)行清理和預(yù)處理。


> 重要性

如果你只使用過(guò)存儲(chǔ)在.csv或.txt文件中的相對(duì)較小的數(shù)據(jù)集(小于5G),那么你可能很難理解為什么需要專人維護(hù)數(shù)據(jù)管道。

當(dāng)中的原因在于:1)計(jì)算機(jī)很難承載大小為50 G的數(shù)據(jù)集,因此需要以其他方式將其提供給模型;2)大量數(shù)據(jù)可能需要花費(fèi)大量時(shí)間來(lái)處理,并且經(jīng)常需要冗余存儲(chǔ)。進(jìn)行管理存儲(chǔ)需要專業(yè)的技術(shù)知識(shí)。


> 技能要求

你需要使用Apache Spark、Hadoop、HiveKafka。還需要有扎實(shí)的SQL的基礎(chǔ)。


> 處理的問(wèn)題

如何構(gòu)建每分鐘能處理1萬(wàn)個(gè)請(qǐng)求的管道?

如何在不將其全部加載到RAM的情況下清理該數(shù)據(jù)集?



2. 數(shù)據(jù)分析師


> 職位描述

將數(shù)據(jù)轉(zhuǎn)化為可操作的商業(yè)見(jiàn)解。你通常會(huì)成為技術(shù)團(tuán)隊(duì)和商業(yè)策略業(yè),銷售或營(yíng)銷團(tuán)隊(duì)之間的中間人。數(shù)據(jù)可視化是你日常工作的重要組成部分。


> 重要性

有些人很難理解為什么數(shù)據(jù)分析師如此重要,但他們確實(shí)如此。數(shù)據(jù)分析師需要將經(jīng)過(guò)訓(xùn)練和測(cè)試的模型,以及大量用戶數(shù)據(jù)轉(zhuǎn)換為易于理解的格式,以便轉(zhuǎn)化為圍商業(yè)策略。數(shù)據(jù)分析師幫助確保數(shù)據(jù)科學(xué)團(tuán)隊(duì)不會(huì)浪費(fèi)時(shí)間來(lái)解決無(wú)法提供商業(yè)價(jià)值的問(wèn)題。


> 技能要求

技能包括Python,SQL,Tableau和Excel。你還需要出色的溝通能力。


> 處理的問(wèn)題

是什么帶來(lái)了用戶增長(zhǎng)?

如何向管理層解釋最近的使用費(fèi)讓用戶望而卻步?


3. 數(shù)據(jù)科學(xué)家


> 職位描述

清理和探索數(shù)據(jù)集,并進(jìn)行能帶來(lái)商業(yè)價(jià)值的預(yù)測(cè)。你的日常工作包括訓(xùn)練和優(yōu)化模型,并將其部署到生產(chǎn)中。


> 重要性

當(dāng)你有大量難以被解析的數(shù)據(jù),你需要從中提取出可理解的分析見(jiàn)解。這是數(shù)據(jù)科學(xué)家的基本工作:將數(shù)據(jù)集轉(zhuǎn)換為易于理解的結(jié)論。


> 技能要求

包括Python、scikit-learn、Pandas、SQL、也許還需要掌握Flask、Spark、TensorFlow、PyTorch。有些數(shù)據(jù)科學(xué)職位純粹是技術(shù)性的,但大多數(shù)人要求你具備一定的商業(yè)意識(shí)。


> 處理的問(wèn)題

我們有多少種不同的用戶類型?

是否能建立一個(gè)模型來(lái)預(yù)測(cè)哪些產(chǎn)品將銷售給哪些用戶?



4. 機(jī)器學(xué)習(xí)工程師


> 職位描述

構(gòu)建、優(yōu)化機(jī)器學(xué)習(xí)模型,以及部署到生產(chǎn)。你的工作離不開(kāi)機(jī)器學(xué)習(xí)模型,而且需要將其放入全棧應(yīng)用程序或硬件中,但也需要自己設(shè)計(jì)模型。


> 技能要求

需要掌握Python、Javascript、scikit-learn,TensorFlow 、PyTorch,以及SQL或MongoDB。


> 處理的問(wèn)題

如何將此Keras模型集成到我們的Javascript應(yīng)用程序中?

如何減少推薦系統(tǒng)的預(yù)測(cè)時(shí)間和預(yù)測(cè)成本?


5. 機(jī)器學(xué)習(xí)研究員


> 職位描述

找到解決數(shù)據(jù)科學(xué)和深度學(xué)習(xí)中的挑戰(zhàn)性問(wèn)題的新方法。你不會(huì)使用開(kāi)箱即用的解決方案,而是需要?jiǎng)?chuàng)建解決方案。


> 技能要求

需要用到Python、TensorFlow、PyTorchSQL。


> 處理的問(wèn)題

如何將模型的準(zhǔn)確性提高到最高水平?

自定義優(yōu)化器有助于減少訓(xùn)練時(shí)間嗎?


結(jié)語(yǔ)

我在這里列出的五個(gè)職位絕對(duì)不是孤立的。例如,在早期創(chuàng)業(yè)公司,數(shù)據(jù)科學(xué)家也需要充當(dāng)數(shù)據(jù)工程師或數(shù)據(jù)分析師的角色。但是大多數(shù)工作會(huì)按類別分類,公司規(guī)模越大,類別則越具體。

總的來(lái)說(shuō),為了找到心儀的工作,你需要明確具體的方向。如果你想成為一名數(shù)據(jù)分析師,就不用學(xué)習(xí)TensorFlow;如果你想成為一名機(jī)器學(xué)習(xí)研究員,那么不用先學(xué)Pyspark。

可以思考一下你希望為公司帶來(lái)哪方面的價(jià)值,并朝著這個(gè)方向努力,這是入門的最佳方式。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }