99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀忘掉大數(shù)據(jù)之“術(shù)”,點(diǎn)“數(shù)”成金

忘掉大數(shù)據(jù)之“術(shù)”,點(diǎn)“數(shù)”成金

2017-03-25

忘掉大數(shù)據(jù)之“術(shù)”,點(diǎn)“數(shù)”成金

在剛剛結(jié)束的兩會(huì)上“互聯(lián)網(wǎng)金融”成為了代表委員們熱議的話題。從政府工作報(bào)告對(duì)互聯(lián)網(wǎng)金融發(fā)展的表述中可以看到，金融行業(yè)新一輪淘汰洗牌不可避免。在3月9日華夏互金私董會(huì)上，多位行業(yè)內(nèi)人士分析認(rèn)為，互聯(lián)網(wǎng)金融淘汰賽進(jìn)入到2.0時(shí)代。金融的本質(zhì)決定你能否活著，而互聯(lián)網(wǎng)則決定你的平臺(tái)能活多久。大數(shù)據(jù)已經(jīng)成為許多金融企業(yè)的核心資產(chǎn)，通過機(jī)器學(xué)習(xí)和大規(guī)模的大數(shù)據(jù)分析，以一種完全不同的方式來更快更精準(zhǔn)的作出決策(如金融產(chǎn)品推薦)，為企業(yè)創(chuàng)造更豐盛的價(jià)值，在眾多競爭對(duì)手中脫穎而出。但由于大數(shù)據(jù)行業(yè)普遍存在數(shù)據(jù)開放共享不足、基礎(chǔ)薄弱、應(yīng)用領(lǐng)域單一等問題，這些問題會(huì)直接影響到模型的好壞。本文由極光大數(shù)據(jù)研究院數(shù)據(jù)挖掘工程師余承樂撰寫，探討金融產(chǎn)品推薦中一種完美插補(bǔ)用戶行為數(shù)據(jù)缺失的算法。

研究背景：

基于海量的用戶行為數(shù)據(jù)，極光大數(shù)據(jù)可提供全行業(yè)的綜合營銷整體解決方案，并且在低價(jià)值數(shù)據(jù)稠密、高價(jià)值數(shù)據(jù)稀疏處理上也有一定的研究。以金融產(chǎn)品智能推薦為例，眾所周知，數(shù)據(jù)稀疏性問題是影響推薦系統(tǒng)質(zhì)量的一個(gè)關(guān)鍵因素，它會(huì)直接造成推薦的準(zhǔn)確性不高。針對(duì)推薦系統(tǒng)中存在的數(shù)據(jù)稀疏性問題，最直接的解決辦法就是給空缺值設(shè)定一個(gè)固定的缺省值，一般設(shè)為評(píng)分域的中間值(如7分制評(píng)分中設(shè)為4)，或者設(shè)為用戶對(duì)應(yīng)標(biāo)簽所有評(píng)分的平均值，這種方法在一定程度上可以提高推薦的精度，但是并不能從根本上解決用戶標(biāo)簽數(shù)據(jù)的稀疏性問題。

目前，已有很多專家提出了一些有效的解決數(shù)據(jù)稀疏性的方法。這些方法基本可以分為兩大類，一種是在數(shù)據(jù)稀疏性不變的情況下提高已有算法的精度，另一種就是采用一些可行的方法來盡量減小數(shù)據(jù)集的稀疏性。其中有用到奇異值分解(SVD)技術(shù)，通過對(duì)輸入矩陣降維來降低數(shù)據(jù)稀疏性的。也有結(jié)合奇異值分解與最近鄰算法，通過奇異值分解平滑輸入矩陣，然后采用最近鄰算法預(yù)測目標(biāo)用戶的標(biāo)簽缺失值。但是降維通常會(huì)導(dǎo)致用戶標(biāo)簽信息丟失，并且分解算法復(fù)雜度高，在標(biāo)簽數(shù)據(jù)極端稀疏的情況下，效果并不理想。也有通過計(jì)算項(xiàng)目相似度來填充標(biāo)簽矩陣的方法，通過項(xiàng)目聚類，確保在同一類用戶中，所有用戶的標(biāo)簽評(píng)分最為相似。還有提出一種基于k-means 聚類的方法，首先對(duì)用戶聚類，利用同類中的平均評(píng)分來預(yù)測標(biāo)簽矩陣中的缺失評(píng)分，這在一定程度上解決了數(shù)據(jù)稀疏的問題。不過這些插補(bǔ)方法都有其局限性，并不能很好的應(yīng)用于全場景。

極光研究方案：

本文將重點(diǎn)講述極光大數(shù)據(jù)是怎樣利用改進(jìn)后的RBF神經(jīng)網(wǎng)絡(luò)算法來高效預(yù)測用戶標(biāo)簽缺失值填充稀疏矩陣，并對(duì)最終的推薦系統(tǒng)產(chǎn)生積極作用的。

首先我們需要構(gòu)建一個(gè)RBF神經(jīng)網(wǎng)絡(luò)。RBF神經(jīng)網(wǎng)絡(luò)的構(gòu)建過程關(guān)鍵在于隱含層的設(shè)計(jì)。好的隱含層架構(gòu)可以有效地提高神經(jīng)網(wǎng)絡(luò)性能，反之則會(huì)讓網(wǎng)絡(luò)性能大打折扣或者增加學(xué)習(xí)代價(jià)。隱含層的設(shè)計(jì)關(guān)鍵在于隱含層中心節(jié)點(diǎn)的選擇。和傳統(tǒng)的指定節(jié)點(diǎn)個(gè)數(shù)不同的是，我們?cè)O(shè)計(jì)了一種動(dòng)態(tài)自適應(yīng)的選擇方法。首先隨機(jī)確定一批中心節(jié)點(diǎn)，然后在此基礎(chǔ)上運(yùn)用自適應(yīng)算法動(dòng)態(tài)確定中心節(jié)點(diǎn)數(shù)。設(shè)隨機(jī)選擇的中心節(jié)點(diǎn)數(shù)目為n，每個(gè)中心節(jié)點(diǎn)對(duì)應(yīng)的節(jié)點(diǎn)為ki。

這樣就可以有效的解決依靠經(jīng)驗(yàn)指定RBF神經(jīng)網(wǎng)絡(luò)隱含層中心節(jié)點(diǎn)個(gè)數(shù)存在的問題了。

在構(gòu)建的用戶標(biāo)簽評(píng)分矩陣中，由于用戶標(biāo)簽數(shù)據(jù)的稀疏性，會(huì)直接影響到用戶相似度的計(jì)算，造成推薦系統(tǒng)的推薦質(zhì)量難以保證。針對(duì)稀疏矩陣的補(bǔ)全，我們利用已構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)來預(yù)測標(biāo)簽評(píng)分矩陣中的空缺值，填充到原始稀疏矩陣中。

實(shí)證效果：

為了驗(yàn)證算法的有效性，我們采用了極光用戶畫像數(shù)據(jù)集進(jìn)行試驗(yàn)。數(shù)據(jù)集通過**銀行客戶對(duì)其七類金融產(chǎn)品的購買行為做正樣本，為其他客戶提供相應(yīng)的產(chǎn)品推薦列表。樣本數(shù)據(jù)集由10000名用戶的有效行為特征標(biāo)簽評(píng)分和對(duì)該網(wǎng)推出的七類金融產(chǎn)品的購買行為數(shù)據(jù)組成。根據(jù)試驗(yàn)需要，我們將數(shù)據(jù)分為訓(xùn)練集(80%)和測試集(20%)兩部分。

分別采用常用的均值插補(bǔ)和文中提出的算法進(jìn)行稀疏矩陣填充，各自生成新的用戶評(píng)分矩陣。這里舉例展示矩陣插補(bǔ)的效果，U表示評(píng)分用戶，L表示有效行為特征標(biāo)簽。表1是原始用戶行為特征評(píng)分矩陣，表2是均值插補(bǔ)后的矩陣，表3是改進(jìn)算法填充后的矩陣。

通過經(jīng)典協(xié)同過濾算法對(duì)測試用戶進(jìn)行推薦，得出兩套推薦結(jié)果。我們采用推薦系統(tǒng)評(píng)價(jià)指標(biāo)中的多樣性作為此次評(píng)價(jià)標(biāo)準(zhǔn)。好的推薦結(jié)果中要體現(xiàn)多樣性，比如看電影，我既喜歡看格斗類的電影，同時(shí)又喜歡愛文藝，那么給我的推薦列表中就應(yīng)該這兩個(gè)類型的電影都有，而且得根據(jù)我愛好比例來推薦，比如我平時(shí)80%是看格斗類的，20%是看文藝類的，那么推薦結(jié)果中最好也是這個(gè)比例?？梢愿鶕?jù)物品間的相似度來計(jì)算，一個(gè)推薦列表中如果所有物品間的相似度都比較高，那么往往說明都是同一類物品，缺乏多樣性。表4、5分別為兩種插補(bǔ)后的用戶推薦列表，F(xiàn)IN1~7分別代表消費(fèi)金融類、借貸金融類、小額現(xiàn)金借貸類、金融中介、支付金融類、傳統(tǒng)金融(銀行類)和汽車金融共七類金融產(chǎn)品。

這里我們用差異系數(shù)(CV)來評(píng)價(jià)推薦的多樣性?？梢院苤庇^的看到表2的差異系數(shù)遠(yuǎn)遠(yuǎn)大于表1，而且表2中對(duì)任一用戶七類金融產(chǎn)品的推薦強(qiáng)弱排序與表1是保持一致的。這不僅說明了改進(jìn)算法插補(bǔ)后的用戶推薦更具多樣性，而且進(jìn)一步證明了改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)算法既能很好的解決標(biāo)簽稀疏問題，又可以完整的保持用戶的原始行為特征。實(shí)驗(yàn)結(jié)果表明，改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)算法可以很好的解決用戶標(biāo)簽的稀疏性問題，提高推薦系統(tǒng)的準(zhǔn)確度，豐富推薦結(jié)果的多樣性。

總結(jié)：

在金融行業(yè)中，大數(shù)據(jù)的應(yīng)用范圍很廣，例如花旗銀行通過大數(shù)據(jù)分析為財(cái)富管理客戶推薦產(chǎn)品，美國銀行利用積累的客戶點(diǎn)擊數(shù)據(jù)為客戶提供有競爭的信用額度服務(wù)，招商銀行利用客戶行為數(shù)據(jù)定時(shí)給客戶推送針對(duì)性的廣告，里面有客戶可能感興趣的理財(cái)產(chǎn)品和優(yōu)惠信息。不僅是金融領(lǐng)域，醫(yī) 療行業(yè)、生物技術(shù)、零售業(yè)、電商、農(nóng)牧業(yè)等等，各行各業(yè)的發(fā)展都一直在依賴著數(shù)據(jù)，通過機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析，決策者將會(huì)發(fā)現(xiàn)決定一件事、判斷一件事、了解一件事不再變得困難。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報(bào)名CDA認(rèn)證考試，點(diǎn)擊>>> “CDA報(bào)名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點(diǎn)擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點(diǎn)擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點(diǎn)擊>>> “CDA含金量” 了解CDA考試詳情；

大數(shù)據(jù) 神經(jīng)網(wǎng)絡(luò) 推薦系統(tǒng) 特征大數(shù)據(jù)分析聚類數(shù)據(jù)分析降維

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼，搜微信號(hào)：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統(tǒng)競選大戲開鑼，川普當(dāng)選的奇跡會(huì)再發(fā)生嗎？

CDA報(bào)考指南

報(bào)考流程
考試時(shí)間
報(bào)名費(fèi)用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號(hào) 經(jīng)營許可證編號(hào)：京B2-20210330

聯(lián)系電話：13321103290 (微信同號(hào))

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗(yàn)證后自動(dòng)注冊(cè)

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

忘掉大數(shù)據(jù)之“術(shù)”,點(diǎn)“數(shù)”成金

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對(duì)象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 ...

【CDA干貨】Python HTTP 請(qǐng)求工具對(duì)比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點(diǎn)數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu) ...

【CDA干貨】用 SQL 驗(yàn)證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動(dòng)下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實(shí)踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計(jì)模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

忘掉大數(shù)據(jù)之“術(shù)”,點(diǎn)“數(shù)”成金

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對(duì)象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 ...

【CDA干貨】Python HTTP 請(qǐng)求工具對(duì)比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點(diǎn)數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu) ...

【CDA干貨】用 SQL 驗(yàn)證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動(dòng)下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實(shí)踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計(jì)模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...