99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀機器學(xué)習(xí)中容易犯的錯誤——不注重樣本精細(xì)化處理
機器學(xué)習(xí)中容易犯的錯誤——不注重樣本精細(xì)化處理
2019-04-02
收藏


接觸過機器學(xué)習(xí)的朋友應(yīng)該知道,樣本是機器學(xué)習(xí)模型的核心,這是因為樣本直接關(guān)系到模型效果的好壞,不過在大多數(shù)情況下,很多人對待樣本的態(tài)度根本不夠,這就導(dǎo)致的機器學(xué)習(xí)中的錯誤。很多人關(guān)注樣本不像在乎特征那樣在乎樣本的質(zhì)量一樣,其實這樣就容易出現(xiàn)兩種情況,那么到底是什么呢?下面我們就給大家介紹一下。


首先我們給大家講解一下第一種情況,其實第一種情況就是對負(fù)樣本的界定不夠細(xì)致。那么什么是負(fù)樣本呢?其實負(fù)樣本的含義一般來說是曝光但是未點擊的樣本,但是曝光是一件需要仔細(xì)琢磨的事情。最直接的方式是用服務(wù)器后臺日志中的數(shù)據(jù)作為曝光,但是這樣做會帶來一個顯然的問題,就是日志中的item不一定全部真正曝光,也就是不一定真的被用戶看到了。更好的方式是通過頁面埋點來記錄真正曝光的東西,不過這種方法也會存在問題,那就是即使頁面上曝光了,用戶也不一定真正看到了,或者說用戶的眼睛不一定掃到了曝光的區(qū)域,畢竟頁面那么大,用戶的關(guān)注點我們根本不知道。有人提出了一種解決方法是把最后一個被點擊的商品以上的作為真正曝光的,因為用戶既然點擊了這一個,那么可以認(rèn)為這個以上的用戶都是看到了的。


而第二種情況就是對樣本這個概念的理解不到位。統(tǒng)計機器學(xué)習(xí)的根本思路是根據(jù)歷史行為學(xué)習(xí)模式,從而預(yù)測未來。所以樣本代表歷史是很容易被接受的,但是在實際工作中,更好的樣本代表的應(yīng)該是我們希望的結(jié)果,而不是那種真實的歷史。我們需要考慮一個問題,那就是我們訓(xùn)練模型出來,真正希望服務(wù)的用戶是哪種用戶?所以說,我們需要注意的是除了特征工程,樣本工程也同樣重要,在某些情況下甚至?xí)匾?。所以在進行訓(xùn)練之前,以及模型調(diào)優(yōu)的過程中,都要仔細(xì)思考樣本是否真正反映了我們的需求,有必要時要對樣本做針對性選擇。


在這篇文章中我們給大家介紹了在機器學(xué)習(xí)中容易出現(xiàn)的問題,那就是不注重樣本精細(xì)化處理,現(xiàn)在很多人不怎么關(guān)注樣本,其實這樣的做法是錯誤的,我們只有關(guān)注樣本才能夠更好的利用機器學(xué)習(xí)為我們解決更多的事情。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }