99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

矩陣分解在協(xié)同過濾推薦算法中的應用

2018-03-24

矩陣分解在協(xié)同過濾推薦算法中的應用

推薦系統(tǒng)是當下越來越熱的一個研究問題，無論在學術界還是在工業(yè)界都有很多優(yōu)秀的人才參與其中。近幾年舉辦的推薦系統(tǒng)比賽更是一次又一次地把推薦系統(tǒng)的研究推向了高潮，比如幾年前的Neflix百萬大獎賽，KDD CUP 2011的音樂推薦比賽，去年的百度電影推薦競賽，還有最近的阿里巴巴大數據競賽。這些比賽對推薦系統(tǒng)的發(fā)展都起到了很大的推動作用，使我們有機會接觸到真實的工業(yè)界數據。我們利用這些數據可以更好地學習掌握推薦系統(tǒng)，這些數據網上很多，大家可以到網上下載。

推薦系統(tǒng)在工業(yè)領域中取得了巨大的成功，尤其是在電子商務中。很多電子商務網站利用推薦系統(tǒng)來提高銷售收入，推薦系統(tǒng)為Amazon網站每年帶來30%的銷售收入。推薦系統(tǒng)在不同網站上應用的方式不同，這個不是本文的重點，如果感興趣可以閱讀《推薦系統(tǒng)實踐》（人民郵電出版社，項亮）第一章內容。下面進入主題。

為了方便介紹，假設推薦系統(tǒng)中有用戶集合有6個用戶，即U={u1,u2,u3,u4,u5,u6}，項目（物品）集合有7個項目，即V={v1,v2,v3,v4,v5,v6,v7}，用戶對項目的評分結合為R，用戶對項目的評分范圍是[0, 5]。R具體表示如下：

推薦系統(tǒng)的目標就是預測出符號“？”對應位置的分值。推薦系統(tǒng)基于這樣一個假設：用戶對項目的打分越高，表明用戶越喜歡。因此，預測出用戶對未評分項目的評分后，根據分值大小排序，把分值高的項目推薦給用戶。怎么預測這些評分呢，方法大體上可以分為基于內容的推薦、協(xié)同過濾推薦和混合推薦三類，協(xié)同過濾算法進一步劃分又可分為基于基于內存的推薦（memory-based）和基于模型的推薦（model-based），本文介紹的矩陣分解算法屬于基于模型的推薦。

矩陣分解算法的數學理論基礎是矩陣的行列變換。在《線性代數》中，我們知道矩陣A進行行變換相當于A左乘一個矩陣，矩陣A進行列變換等價于矩陣A右乘一個矩陣，因此矩陣A可以表示為A=PEQ=PQ（E是標準陣）。

矩陣分解目標就是把用戶-項目評分矩陣R分解成用戶因子矩陣和項目因子矩陣乘的形式，即R=UV，這里R是n×m， n =6， m =7，U是n×k，V是k×m。直觀地表示如下：

高維的用戶-項目評分矩陣分解成為兩個低維的用戶因子矩陣和項目因子矩陣，因此矩陣分解和PCA不同，不是為了降維。用戶i對項目j的評分r_ij =innerproduct(u_i, v_j)，更一般的情況是r_ij =f(U_i, V_j)，這里為了介紹方便就是用u_i和v_j內積的形式。下面介紹評估低維矩陣乘積擬合評分矩陣的方法。

首先假設，用戶對項目的真實評分和預測評分之間的差服從高斯分布，基于這一假設，可推導出目標函數如下：

最后得到矩陣分解的目標函數如下：

從最終得到得目標函數可以直觀地理解，預測的分值就是盡量逼近真實的已知評分值。有了目標函數之后，下面就開始談優(yōu)化方法了，通常的優(yōu)化方法分為兩種：交叉最小二乘法（alternative least squares）和隨機梯度下降法（stochastic gradient descent）。

首先介紹交叉最小二乘法，之所以交叉最小二乘法能夠應用到這個目標函數主要是因為L對U和V都是凸函數。首先分別對用戶因子向量和項目因子向量求偏導，令偏導等于0求駐點，具體解法如下：

上面就是用戶因子向量和項目因子向量的更新公式，迭代更新公式即可找到可接受的局部最優(yōu)解。迭代終止的條件下面會講到。

接下來講解隨機梯度下降法，這個方法應用的最多。大致思想是讓變量沿著目標函數負梯度的方向移動，直到移動到極小值點。直觀的表示如下：

其實負梯度的負方向，當函數是凸函數時是函數值減小的方向走；當函數是凹函數時是往函數值增大的方向移動。而矩陣分解的目標函數L是凸函數，因此，通過梯度下降法我們能夠得到目標函數L的極小值（理想情況是最小值）。

言歸正傳，通過上面的講解，我們可以獲取梯度下降算法的因子矩陣更新公式，具體如下：

（3）和（4）中的γ指的是步長，也即是學習速率，它是一個超參數，需要調參確定。對于梯度見（1）和（2）。

下面說下迭代終止的條件。迭代終止的條件有很多種，就目前我了解的主要有

1）設置一個閾值，當L函數值小于閾值時就停止迭代，不常用

2）設置一個閾值，當前后兩次函數值變化絕對值小于閾值時，停止迭代

3）設置固定迭代次數

另外還有一個問題，當用戶-項目評分矩陣R非常稀疏時，就會出現過擬合（overfitting）的問題，過擬合問題的解決方法就是正則化（regularization）。正則化其實就是在目標函數中加上用戶因子向量和項目因子向量的二范數，當然也可以加上一范數。至于加上一范數還是二范數要看具體情況，一范數會使很多因子為0，從而減小模型大小，而二范數則不會它只能使因子接近于0，而不能使其為0，關于這個的介紹可參考論文Regression Shrinkage and Selection via the Lasso。引入正則化項后目標函數變?yōu)椋?

（5）中λ_1和λ_2是指正則項的權重，這兩個值可以取一樣，具體取值也需要根據數據集調參得到。優(yōu)化方法和前面一樣，只是梯度公式需要更新一下。

矩陣分解算法目前在推薦系統(tǒng)中應用非常廣泛，對于使用RMSE作為評價指標的系統(tǒng)尤為明顯，因為矩陣分解的目標就是使RMSE取值最小。但矩陣分解有其弱點，就是解釋性差，不能很好為推薦結果做出解釋。

后面會繼續(xù)介紹矩陣分解算法的擴展性問題，就是如何加入隱反饋信息，加入時間信息等。

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

推薦系統(tǒng) 協(xié)同過濾最小二乘過擬合降維 PCA 大數據

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇機器學習故事匯-線性回歸算法

下一篇sql語句實現行轉列的3種方法實例

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數1：配置參數 // 參數2：回調，回調的第一個參數驗證碼對象，之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式，包括：float，popup width: "280px", https: true // 更多配置參數說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

矩陣分解在協(xié)同過濾推薦算法中的應用

數據分析師考試動態(tài)

CDA報考指南

數據分析學習

數據分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數據分析師報考條件詳解與準備指南 ...

【CDA干貨】數據透視表中兩列相乘合計的實用指南 ...

CDA 認證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數據分析師：連接數據與業(yè)務的價值轉化者 ...

SQL 在預測分析中的應用：從數據查詢到趨勢預判 ...

數據查詢結束后：分析師的收尾工作與價值深化 ...

CDA 數據分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數據背后的時間 ...

year_month數據類型：時間維度的精準切片 ...

CDA 備考干貨：Python 在數據分析中的核心應用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數據趨勢 ...

備戰(zhàn) CDA 數據分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...

統(tǒng)計學方法在市場調研數據中的深度應用 ...

CDA數據分析師證書考試全攻略

剖析 CDA 數據分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉日期：解鎖數據 ...

CDA 數據分析師視角：從數據迷霧中探尋商業(yè)真相 ...

CDA 數據分析師：開啟數據職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數據分析師公眾號

CDA考試中心小程序

CDA數據分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

矩陣分解在協(xié)同過濾推薦算法中的應用

數據分析師考試動態(tài)

CDA報考指南

數據分析學習

數據分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數據分析師報考條件詳解與準備指南 ...

【CDA干貨】數據透視表中兩列相乘合計的實用指南 ...

CDA 認證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數據分析師：連接數據與業(yè)務的價值轉化者 ...

SQL 在預測分析中的應用：從數據查詢到趨勢預判 ...

數據查詢結束后：分析師的收尾工作與價值深化 ...

CDA 數據分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數據背后的時間 ...

year_month數據類型：時間維度的精準切片 ...

CDA 備考干貨：Python 在數據分析中的核心應用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數據趨勢 ...

備戰(zhàn) CDA 數據分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...

統(tǒng)計學方法在市場調研數據中的深度應用 ...

CDA數據分析師證書考試全攻略

剖析 CDA 數據分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉日期：解鎖數據 ...

CDA 數據分析師視角：從數據迷霧中探尋商業(yè)真相 ...

CDA 數據分析師：開啟數據職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數據分析師公眾號

CDA考試中心小程序

CDA數據分析師App下載

備戰(zhàn) CDA 數據分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...