99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀關(guān)于模型優(yōu)化的幾個(gè)思考
關(guān)于模型優(yōu)化的幾個(gè)思考
2020-04-16
收藏


目前模型的問法優(yōu)化看似進(jìn)入了一個(gè)瓶頸期,在這個(gè)階段模型的同學(xué)一直在調(diào)數(shù)據(jù)跑模型,但見效甚微,大家難免會(huì)有些感到手足無措,或者沮喪,這種情況在咱們做模型的過程中肯定會(huì)經(jīng)常遇到的。那么如果碰到這種情況了,我們應(yīng)該如何去進(jìn)一步實(shí)現(xiàn)我們的目標(biāo),體現(xiàn)我們作為算法的價(jià)值呢?我覺得有幾個(gè)點(diǎn)可以和大家分享下看法。

首先,定位問題。

對于算法建模來說,我們的目標(biāo)不是為了找到最好的模型,最先進(jìn)的模型,而是用模型加數(shù)據(jù)來構(gòu)建我們對目標(biāo)的認(rèn)識(shí)。模型在這個(gè)過程中起到的作用是生產(chǎn)工具,是實(shí)現(xiàn)手段,是網(wǎng);而數(shù)據(jù)在這個(gè)過程中是生產(chǎn)原料,是池塘。結(jié)合我們的優(yōu)化問題,我們看到的現(xiàn)象是模型效果不好,那么從咱們數(shù)據(jù)和模型的角度來看,導(dǎo)致模型不好的原因有哪些?這個(gè)是需要我們仔細(xì)考量的。我先拋磚引玉,提幾個(gè)關(guān)于效果不好方面的問題:

a)從模型角度來說,我們當(dāng)前的模型假設(shè)是什么?模型表達(dá)能力夠么?還是太復(fù)雜了?模型能夠快速迭代么?

b)從模型和數(shù)據(jù)結(jié)合來說,對結(jié)果不好的數(shù)據(jù),為什么學(xué)不好?模型學(xué)到的是數(shù)據(jù)中的哪部分信息?模型是欠擬合還是過擬合?如果是過擬合,那么結(jié)合模型來看,我們有什么泛化調(diào)優(yōu)手段,刪掉一些數(shù)據(jù)能解決不?如果是欠擬合,我們?nèi)绾螖U(kuò)充數(shù)據(jù)?

c)從數(shù)據(jù)角度。我們的數(shù)據(jù)哪些是期望模型可以學(xué)到的?什么樣的數(shù)據(jù),什么規(guī)模的數(shù)據(jù),模型是可以學(xué)習(xí)的?我們對于數(shù)據(jù)的認(rèn)識(shí)是什么?通過模型對數(shù)據(jù)的認(rèn)識(shí)是什么?數(shù)據(jù)是均衡的么?數(shù)據(jù)是干凈的么?

其次,排優(yōu)先次序。

在確定了我們的效果由不同維度的原因造成后,我們該如何做呢?一股腦亂燉?肯定不行,這里面首先要分清楚哪些對我們的目標(biāo)來說影響范圍的是如何的。這個(gè)影響范圍在界定的時(shí)候一定要有一個(gè)鏈路反饋到最終結(jié)果上,這個(gè)鏈路我們得清晰。比如我們在預(yù)測結(jié)果上看到某類badcase,那么這類badcase的規(guī)模如何?



這類badcase是如何出現(xiàn)的,對我們的模型指標(biāo)的影響是多少?如何評估?badcase是模型效果不好的直接展現(xiàn),那么這個(gè)到底是由模型還是數(shù)據(jù)造成的?由模型的哪些方面影響的?由哪些數(shù)據(jù)導(dǎo)致的?這些得我們通過數(shù)據(jù)分析確定,最終形成我們對于效果不好這個(gè)宏觀問題的深入認(rèn)識(shí)。

最后,解決方案。

作為算法建模同學(xué),最近這兩年NLP領(lǐng)域發(fā)展迅猛,各種新模型百花齊放,ELMo,BERT,AlBERT等等,根本不給人喘息的機(jī)會(huì)。我相信大家在每次碰到新算法模型出現(xiàn)的時(shí)候是興奮的。說實(shí)話,我是既焦慮又興奮的。興奮的是學(xué)術(shù)界對于NLP的難點(diǎn)問題又有了新的進(jìn)展,我們又有了“新鋤頭”,焦慮的是不知道自己什么時(shí)候有時(shí)間來掌握這個(gè)“新鋤頭”的用法。

但是對于新模型的嘗試在我們實(shí)際業(yè)務(wù)場景下的運(yùn)用,是要結(jié)合我們的問題和目標(biāo)來的。對于模型的認(rèn)知咱們要有個(gè)相對的評估。學(xué)術(shù)界的模型是為了在最好的模型上再往前走,是登山,而我們是在業(yè)務(wù)場景落地,更像是修路。我們不用只要是能讓我們的業(yè)務(wù)數(shù)據(jù)價(jià)值通過充分發(fā)揮出來,就夠了。學(xué)術(shù)界的標(biāo)準(zhǔn)集是標(biāo)準(zhǔn)的,業(yè)務(wù)的標(biāo)準(zhǔn)集是一坨的。

上面說那么多,其實(shí)簡單來說,就是要多從數(shù)據(jù)出發(fā)選模型,從快速解決可解問題出發(fā)選模型。另外,在模型組合方案上,我們可以多做試錯(cuò)。Boosting,Bagging,甚至強(qiáng)化學(xué)習(xí),可以是單一模型,但是我們可不可以把這些思想用在我們的模型組合方案上呢?模型不是萬能的。業(yè)務(wù)落地的時(shí)候一定是在解決方案上要做些設(shè)計(jì)的。模型是對數(shù)據(jù)的抽象,規(guī)則也是的(正則也算),也是模型的一種形式。

我們本質(zhì)上在用高效的工具對數(shù)據(jù)進(jìn)行抽象組織的。所以對于選擇工具上可以不用局限自己。我們的核心價(jià)值在于用模型作為杠桿來撬動(dòng)需要大量人力或者人力不可解的數(shù)據(jù)問題的。整體來說,模型優(yōu)化是不管做什么業(yè)務(wù)問題,都會(huì)碰到的,對我們來說,我們只需要在我們的業(yè)務(wù)場景下解決業(yè)務(wù)問題就行。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }