99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀機器學(xué)習(xí)如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

機器學(xué)習(xí)如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

2021-09-16

<a href='/map/jiqixuexi/' style='color:#000;font-size:inherit;'>機器學(xué)習(xí)</a>如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

在國富如荷這些年的教學(xué)過程中，很多同學(xué)問到了一個問題：

在現(xiàn)實的商業(yè)世界中如何應(yīng)用機器學(xué)習(xí)？

也就是說，雖然現(xiàn)在我們一直被各種算法文章和教程轟炸，但是關(guān)于企業(yè)中一個機器學(xué)習(xí)項目的“上下文”卻總是缺失的。

今天CDA數(shù)據(jù)分析師教研副總監(jiān)徐楊老師將給同學(xué)們介紹我們最近采集到的三個真實的企業(yè)機器學(xué)習(xí)項目，以讓同學(xué)們更好地理解機器學(xué)習(xí)和數(shù)據(jù)科學(xué)在實踐中是如何工作的。

01、掃描 eBay 是否有假冒商品或贓物

這個項目來源于我們美國部門的反饋。這是一家娛樂行業(yè)的企業(yè)，由于保密協(xié)議的原因老師無法給出企業(yè)的名稱。他們有一個專門的分析團隊，在購物網(wǎng)站(如eBay)上搜索帶有客戶品牌的被盜或假冒商品。

在eBay上數(shù)以百萬計的商品清單列表中，只有很小一部分是企業(yè)感興趣的。于是分析團隊上線了爬蟲算法，抓取包含相關(guān)關(guān)鍵字的網(wǎng)頁，并將網(wǎng)頁圖片存儲在特定的文件夾中。每天，該團隊都會登錄到相關(guān)的門戶網(wǎng)站，爬取并查看這些圖片，以確定它們是否侵犯了企業(yè)的版權(quán)。這是一個非常昂貴卻無聊的過程，昂貴在負(fù)責(zé)查看圖片的人工成本，無聊在于這個查看工作本身沒有太多技術(shù)含量卻非常消耗工時。但是這個問題可以通過一點機器學(xué)習(xí)得到很大改善。

尷尬的是，現(xiàn)在很多很多討論計算機視覺的文章都在關(guān)注一些"不務(wù)正業(yè)"的問題，例如貓 vs 狗、汽車 vs 摩托車、手繪數(shù)字等等。但在這個項目中，我們必須在圖像中尋找侵犯版權(quán)的東西。

決定使用哪種機器學(xué)習(xí)算法來解決問題通常很復(fù)雜，這個項目也不例外。一方面，我們有大量被標(biāo)記為侵權(quán)或非侵權(quán)的數(shù)據(jù)，在這種情況下，很容易能看出這是一個有監(jiān)督的分類問題。那么，我們考慮試一下神經(jīng)網(wǎng)絡(luò)算法？

另一方面，由于門戶網(wǎng)站的設(shè)計，檢索負(fù)面信息非常耗時（它不存儲圖像，只是一個鏈接），因此我們只有一個有限的數(shù)據(jù)集。此外，企業(yè)的徽標(biāo)經(jīng)常與其他企業(yè)的徽標(biāo)一起出現(xiàn)在圖像中（侵犯版權(quán)通常是很微妙的），并且足夠深的神經(jīng)網(wǎng)絡(luò)很有可能會識別出類似商標(biāo)的存在而不是單獨某個公司的標(biāo)志（就像神經(jīng)網(wǎng)絡(luò)通常會識別所有犬種而不僅僅是德國牧羊犬一樣）。在這種情況下，關(guān)鍵是訓(xùn)練一個更淺的卷積神經(jīng)網(wǎng)絡(luò)來進行目標(biāo)檢測而不是分類。這阻止了網(wǎng)絡(luò)學(xué)習(xí) logo-general 特征并迫使它學(xué)習(xí) logo-specific 特征。（這兩個單詞顯然用英文來表述會更加準(zhǔn)確，因此我們不給出翻譯）

CNN（卷積神經(jīng)網(wǎng)絡(luò)）的算法本身是成熟的，那么這個項目的關(guān)鍵就在于生成訓(xùn)練集以供訓(xùn)練目標(biāo)檢測。它需要由來自原始訓(xùn)練集的大量不同角度和排列的圖像組成，具有各種傾斜和對齊方式，每個圖像都有一個包圍框圍繞著我們想要檢測的對象(徽標(biāo))。在花費了相當(dāng)大的精力完成訓(xùn)練集的工作后，這個項目的后續(xù)工作也順利完成。

02、預(yù)測零售店是否會被盜

這個項目來源于與我們合作的一家企業(yè)，這是一家跨國零售連鎖企業(yè)（同樣是基于保密協(xié)議，這里不能給出企業(yè)名稱）。由于這家企業(yè)的分支店鋪遍布全球，包括一些不太安全的地區(qū)。因此需要構(gòu)建一個算法，根據(jù)入室盜竊的歷史實例生成入室盜竊的風(fēng)險評分。

由于業(yè)務(wù)的性質(zhì)，企業(yè)認(rèn)為盜竊的風(fēng)險隨著周邊地區(qū)的犯罪而增加，而不是由于商店的任何特定特征（易碎的窗戶等）而增加。

該算法工具的目的不是直接防止盜竊，而是評估如何對整個商店組合分配固定預(yù)算，以減少盜竊損失。因此，算法輸出的必須是更新每個安全設(shè)施的好處，或者說是推薦更新哪些安全設(shè)施，有點像推薦引擎。

與我們上一個示例類似，找出解決問題的關(guān)鍵是最大的挑戰(zhàn)之一。分析團隊首先嘗試了生存分析，定制了 Cox Proportional Hazards 模型以接受多個事件。雖然它在洞察各種安全設(shè)施的防護性方面做得很好，但它對于地理因素的識別效果非常差，而地理區(qū)域因素正是客戶想要識別的一個重要因素。

最后，分析團隊決定為客戶想要識別的每個因素構(gòu)建單獨的分類器(使用XGBoost)，為每個時期設(shè)置固定的訓(xùn)練集日期范圍，以解決較長時期的預(yù)測更有可能高估長期風(fēng)險的問題。接下來，將這些因素導(dǎo)入回歸模型來計算每個零售商店的預(yù)估損失，并使用該度量(結(jié)合地理度量)來生成具體的推薦。

03、向1.5億位訪問者推薦內(nèi)容

Infinite Scroll，一般稱為無限滾動模式，對于有很多相似條目需要展示的頁面，可以用無限下拉的方式來避免用戶通過點擊下一頁來獲取更多內(nèi)容。比如今日頭條網(wǎng)站，打開后，可以一直向下滾動，當(dāng)滾動到頁面底部后，就會加載更多新聞條目。

之前，一個和我們美國部門有長期合作的網(wǎng)站轉(zhuǎn)向了無限滾動模式，但對拉到底后接下來要顯示哪篇文章發(fā)了愁。一開始，他們的分析團隊提出的方法與強化學(xué)習(xí)非常相似——從10篇最受歡迎的文章中選擇一篇或隨機選擇。

不幸的是，這個想法并沒有給他們帶來他們所希望的轉(zhuǎn)化率，而無限滾動條也大大降低了他們的廣告點擊量(盡管這對用戶來說是一種更好的體驗)。

后來，分析團隊使用詞嵌入和用戶嵌入，構(gòu)建了一個協(xié)同過濾推薦引擎，為用戶提供符合他們興趣的文章，而不僅僅是最流行的。

這個項目最大的挑戰(zhàn)不是選擇哪個算法的問題，而是海量數(shù)據(jù)的處理問題：必須確保系統(tǒng)非常快速地返回推薦——這是無限滾動體驗的本質(zhì)。

另一個挑戰(zhàn)是數(shù)據(jù)埋點和備份，因為用戶的每個行為都有非常多個特征可以提取，因此需要找到一種方法來存儲這些信息，且存儲成本不會呈指數(shù)級增長。

分析團隊決定按站點、類別和用戶信息拆分模型，以減少嵌入矩陣的大小。同時還部署了各種降維技術(shù)以使其更易于管理，并密切監(jiān)視系統(tǒng)以確定備份的理想截止日期。

總結(jié)

通過上述三個項目同學(xué)們可以發(fā)現(xiàn)，很多時候，算法選擇和參數(shù)調(diào)參并不是企業(yè)中一個機器學(xué)習(xí)項目最重要的階段。而客戶需求、數(shù)據(jù)類型、計算速度、預(yù)測用法，甚至數(shù)據(jù)庫優(yōu)化都會影響到一個項目的成功。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認(rèn)證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

機器學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò) 特征目標(biāo)檢測 XGBoost 計算機視覺數(shù)據(jù)類型有監(jiān)督

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇為什么懂應(yīng)用的數(shù)據(jù)挖掘人才更值錢？這9套模板絕對值得收藏

下一篇未來兩年這個類型的人才最緊缺，現(xiàn)在考慮還來得及？

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

^{<ruby id="lyvm0"></ruby>}

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

機器學(xué)習(xí)如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

01、掃描 eBay 是否有假冒商品或贓物

02、預(yù)測零售店是否會被盜

03、向1.5億位訪問者推薦內(nèi)容

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

機器學(xué)習(xí)如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

01、掃描 eBay 是否有假冒商品或贓物

02、預(yù)測零售店是否會被盜

03、向1.5億位訪問者推薦內(nèi)容

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

機器學(xué)習(xí)如何應(yīng)用于商業(yè)場景？三個真實的商業(yè)項目

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...