99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數(shù)據(jù)時代在我的數(shù)據(jù)科學(xué)生涯的3年里,我學(xué)到的3個最重要的教訓(xùn)
在我的數(shù)據(jù)科學(xué)生涯的3年里,我學(xué)到的3個最重要的教訓(xùn)
2022-02-28
收藏

我相信這些課程是如此重要,因為它們有助于擁有一個成功的數(shù)據(jù)科學(xué)職業(yè)生涯。讀完這篇文章后,您會意識到,要成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家,不僅僅是構(gòu)建復(fù)雜的模型。

話雖如此,以下是我在數(shù)據(jù)科學(xué)生涯中學(xué)到的3個最重要的教訓(xùn)!

1.很大一部分時間實際上花在你的項目之間(之前和之后)。

其中一件事是,幾乎所有的數(shù)據(jù)科學(xué)課程和訓(xùn)練營都強調(diào)并詳細(xì)闡述了項目生命周期中的建模階段,而實際上,這只是整個過程的一個很小的組成部分。

如果在工作中構(gòu)建一個初步的機器學(xué)習(xí)模型需要一個月的時間,那么您可能需要花一個月的時間來事先理解業(yè)務(wù)問題,然后記錄和社交項目。

不僅建議您在構(gòu)建模型之前和之后完成這些步驟,而且這對項目的成功至關(guān)重要

讓我們深入探討每一個問題的重要性:

  • 業(yè)務(wù)理解:理解手頭的業(yè)務(wù)問題對您的成功至關(guān)重要。例如,如果您正在構(gòu)建一個機器學(xué)習(xí)模型,您應(yīng)該知道該模型應(yīng)該預(yù)測什么,誰將使用它,它將如何實際使用,您將使用什么度量來評估該模型,等等。您必須花時間了解關(guān)于業(yè)務(wù)目標(biāo)的所有以創(chuàng)建適用的模型。
  • 文檔:雖然我同意文檔不如瀏覽數(shù)據(jù)和構(gòu)建模型那么令人興奮,但對于代碼、構(gòu)建的任何表以及如何構(gòu)建模型,有清晰簡潔的文檔是很重要的。這一點非常重要,這樣您或其他人在使用模型或修復(fù)模型時就可以輕松地參考這些資源。
  • 社會化:社會化很少被談?wù)摚绻麡I(yè)務(wù)不使用您的項目,它們就不會成功。使你的項目社會化需要向相關(guān)的利益相關(guān)者展示它們,解釋它們的價值,以及如何使用它們。您可以向更多的利益相關(guān)者推銷您的想法,他們就越有可能采用您的數(shù)據(jù)產(chǎn)品,您的項目也就越成功。

這三個步驟有什么共同點?它們都是交流的一種形式。事實上,我認(rèn)為良好的交流是數(shù)據(jù)科學(xué)家和高級數(shù)據(jù)科學(xué)家之間的區(qū)別。

2.基本面會讓你超過80%的成功。

當(dāng)我開始學(xué)習(xí)數(shù)據(jù)科學(xué)時,我試圖學(xué)習(xí)最復(fù)雜的概念,而不學(xué)習(xí)基礎(chǔ)知識。

經(jīng)過多年的經(jīng)驗,我已經(jīng)意識到,基礎(chǔ)知識足以讓你在職業(yè)生涯中取得80%以上的成功。為什么?簡單的解決方案總是會贏。它們更容易理解,更容易實現(xiàn),也更容易維護。一旦一個簡單的解決方案證明了它對公司的價值,只有這樣,您才能研究更復(fù)雜的解決方案。

那么基本面到底是什么呢?

A)SQL

經(jīng)過3年的工作,我確信掌握SQL是成功職業(yè)生涯的關(guān)鍵。SQL并不是一項難以學(xué)習(xí)的技能(例如,從哪里選擇),但它肯定是一項難以完善的技能。SQL對于數(shù)據(jù)爭論、數(shù)據(jù)探索數(shù)據(jù)可視化(構(gòu)建儀表板)、構(gòu)建報表和構(gòu)建數(shù)據(jù)管道至關(guān)重要。

如果你想掌握SQL,請看下面我的指南:一個完整的15周的課程來掌握數(shù)據(jù)科學(xué)的SQL

B)描述性和推論性統(tǒng)計

對基本的描述性和推論性統(tǒng)計有一個很好的理解也是非常重要的。

描述性統(tǒng)計信息允許您以簡單的方式總結(jié)和理解數(shù)據(jù)。

推理統(tǒng)計允許您根據(jù)有限數(shù)量的數(shù)據(jù)(樣本)做出結(jié)論。這對于建立解釋模型和A/B測試是必不可少的。

C)用于EDA和特征工程的Python

Python主要用于執(zhí)行EDA和特性工程。也就是說,這兩個步驟也可以使用SQL來完成,所以要記住這一點。我個人喜歡在我的技術(shù)棧中使用Python,因為我發(fā)現(xiàn)在Jupyter筆記本中執(zhí)行EDA比在SQL控制臺或儀表板中執(zhí)行EDA更容易。查看:探索性數(shù)據(jù)分析的一個詳細(xì)的一步一步指南

3.迭代并構(gòu)建一個模型的多個版本比花費大量時間構(gòu)建一個最終模型要好。

構(gòu)建、測試、迭代、重復(fù)。

通常,在一個模型上花費更少的時間來將初始版本投入生產(chǎn)并從那里進行迭代總是更好的。為什么?

  1. 在初始模型上分配更少的時間激勵您提出更簡單的解決方案。正如我在本文前面所說的,簡單的解決方案有幾個好處。
  2. 你提出POC(概念證明)的速度越快,你就能越快地從其他人那里得到改進的反饋。
  3. 業(yè)務(wù)需要不斷變化,因此如果能夠盡早部署項目,那么成功的可能性更大。

我想說明的一點是不是催促您的項目,而是快速部署它們,以便您可以接收反饋、迭代和改進您的項目。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }