99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

2017-03-25

簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

一、推薦系統(tǒng)的概念
    推薦系統(tǒng)(Recommendation System, RS)，簡單來說就是根據(jù)用戶的日常行為，自動預(yù)測用戶的喜好，為用戶提供更多完善的服務(wù)。舉個簡單的例子，在京東商城，我們?yōu)g覽一本書之后，系統(tǒng)會為我們推薦購買了這本書的其他用戶購買的其他的書：

推薦系統(tǒng)在很多方面都有很好的應(yīng)用，尤其在現(xiàn)在的個性化方面發(fā)揮著重要的作用。
二、推薦系統(tǒng)的分類
    推薦系統(tǒng)使用了一系列不同的技術(shù)，主要可以分為以下兩類：
基于內(nèi)容(content-based)的推薦。主要依據(jù)的是推薦項的性質(zhì)。
基于協(xié)同過濾(collaborative filtering)的推薦。主要依據(jù)的是用戶或者項之間的相似性。
    在協(xié)同過濾方法中，我們很顯然的會發(fā)現(xiàn)，基于協(xié)同過濾的推薦系統(tǒng)用可以分為兩類：
基于項(item-based)的推薦系統(tǒng)。主要依據(jù)的是項與項之間的相似性。
基于用戶(user-based)的推薦系統(tǒng)。主要依據(jù)的是用戶與用戶之間的相似性。
三、相似度的度量方法
    相似性的度量的方法有很多種，不同的度量方法的應(yīng)用范圍也不一樣。相似性度量方法的設(shè)計也是機器學(xué)習(xí)算法設(shè)計中很重要的一部分，尤其是對于聚類算法，推薦系統(tǒng)這類算法。
    相似性的度量方法必須滿足拓?fù)鋵W(xué)中的度量空間的基本條件：
假設(shè)d是度量空間上M的度量，其中度量d滿足：
非負(fù)性：，當(dāng)且僅當(dāng)時取等號；
對稱性：；
三角不等性：。
    這里主要介紹三種相似性的度量方法：歐式距離、皮爾遜相關(guān)系數(shù)和余弦相似度。
1、歐式距離
   歐式距離是使用較多的相似性的度量方法，在kMeans中就使用到歐式距離作為相似項的發(fā)現(xiàn)。
2、皮爾遜相關(guān)系數(shù)(Pearson Correlation)
   在歐氏距離的計算中，不同特征之間的量級對歐氏距離的影響比較大，例如，和我們就不能很好的利用歐式距離判斷和，和之間的相似性的大小。而皮爾遜相似性的度量對量級不敏感：

其中表示向量x和向量y內(nèi)積，表示向量x的二范數(shù)。
3、余弦相似度(Cosine Similarity)
   余弦相似度有著與皮爾遜相似度同樣的性質(zhì)，對量級不敏感，是計算兩個向量的夾角。在吳軍老師的《數(shù)學(xué)之美》上，在計算文本相似性的過程中，大量使用了余弦相似性的度量方法。

四、基于相似度的推薦系統(tǒng)
    協(xié)同過濾是通過將用戶和其他用戶的數(shù)據(jù)進(jìn)行對比來實現(xiàn)推薦的。我們通過一個評分系統(tǒng)對基于協(xié)同過濾的推薦系統(tǒng)作闡述。

（不同用戶對不同商品的評分）
如圖，橫軸為每個用戶對不同商品的評分，評分的范圍為1~5,0表示該用戶未對該商品評分。我們以用戶Tracy為例，Tracy未對日式炸雞排和壽司飯評分，我們利用協(xié)同過濾推薦系統(tǒng)預(yù)測Tracy對該兩個商品評分，并依據(jù)分?jǐn)?shù)的高低向Tracy推薦商品。
1、計算相似度
   在本例中，我們是依據(jù)物品的相似度，即計算日式炸雞排與鰻魚飯、烤牛肉和手撕豬肉的相似度實現(xiàn)對日式炸雞排的評分，用同樣的方法對壽司飯評分。數(shù)據(jù)分析師培訓(xùn)
2、排序
   排序的目的是實現(xiàn)在日式炸雞排與壽司飯這兩個商品中推薦給用戶Tracy。
3、實驗結(jié)果

（相似度的計算——基于余弦相似度）

（推薦結(jié)果）
從推薦結(jié)果，我們發(fā)現(xiàn)壽司飯的評分更高，首推壽司飯，日式炸雞排排在壽司飯后面。
4、MATLAB代碼
主程序
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
%% 主函數(shù)

% 導(dǎo)入數(shù)據(jù)
data = [4,4,0,2,2;4,0,0,3,3;4,0,0,1,1;1,1,1,2,0;2,2,2,0,0;1,1,1,0,0;5,5,5,0,0];

% reccomendation
[sortScore, sortIndex] = recommend(data, 3, 'cosSim');

len = size(sortScore);

finalRec = [sortIndex, sortScore];
disp(finalRec);

計算相似度的函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ score ] = evaluate( data, user, simMeas, item )
    [m,n] = size(data);
    simTotal = 0;
    ratSimTotal = 0;

    % 尋找用戶都評價的商品
    % data(user, item)為未評價的商品
    for j = 1:n
        userRating = data(user, j);%此用戶評價的商品
        ratedItem = zeros(m,1);
        numOfNon = 0;%統(tǒng)計已評價商品的數(shù)目
        if userRating == 0%只是找到已評分的商品
            continue;
        end
        for i = 1:m
            if data(i,item) ~= 0 && data(i,j) ~= 0
                ratedItem(i,1) = 1;
                numOfNon = numOfNon + 1;
            end
        end

        % 判斷有沒有都評分的項
        if numOfNon == 0
            similarity = 0;
        else
            % 構(gòu)造向量，便于計算相似性
            vectorA = zeros(1,numOfNon);
            vectorB = zeros(1,numOfNon);
            r = 0;
            for i = 1:m
                if ratedItem(i,1) == 1
                    r = r+1;
                    vectorA(1,r) = data(i, j);
                    vectorB(1,r) = data(i, item);
                end
            end
            switch simMeas
                case {'cosSim'}
                    similarity = cosSim(vectorA,vectorB);
                case {'ecludSim'}
                    similarity = ecludSim(vectorA,vectorB);
                case {'pearsSim'}
                    similarity = pearsSim(vectorA,vectorB);
            end
        end
        disp(['the ', num2str(item), ' and ', num2str(j), ' similarity is ', num2str(similarity)]);
        simTotal = simTotal + similarity;
        ratSimTotal = ratSimTotal + similarity * userRating;
    end
    if simTotal == 0
        score = 0;
    else
        score = ratSimTotal./simTotal;
    end
end

推薦函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ sortScore, sortIndex ] = recommend( data, user, simMeas )
    % 獲取data的大小
    [m, n] = size(data);%m為用戶，n為商品
    if user > m
        disp('The user is not in the dataBase');
    end

    % 尋找用戶user未評分的商品
    unratedItem = zeros(1,n);
    numOfUnrated = 0;
    for j = 1:n
        if data(user, j) == 0
            unratedItem(1,j) = 1;%0表示已經(jīng)評分，1表示未評分
            numOfUnrated = numOfUnrated + 1;
        end
    end

    if numOfUnrated == 0
        disp('the user has rated all items');
    end

    % 對未評分項打分，已達(dá)到推薦的作用
    itemScore = zeros(numOfUnrated,2);
    r = 0;
    for j = 1:n
        if unratedItem(1,j) == 1%找到未評分項
            r = r + 1;
            score = evaluate(data, user, simMeas, j);
            itemScore(r,1) = j;
            itemScore(r,2) = score;
        end
    end
    %排序，按照分?jǐn)?shù)的高低進(jìn)行推薦
    [sortScore, sortIndex_1] = sort(itemScore(:,2),'descend');
    [numOfIndex,x] = size(sortIndex_1(:,1));
    sortIndex = zeros(numOfIndex,1);
    for m = 1:numOfIndex
        sortIndex(m,:) = itemScore(sortIndex_1(m,:),1);
    end
end

相似度的函數(shù)：
歐式距離函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ ecludSimilarity ] = ecludSim( vectorA, vectorB )
    ecludSimilarity = 1./(1 + norm(vectorA - vectorB));
end

皮爾遜相關(guān)系數(shù)函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ pearsSimilarity ] = pearsSim( vectorA, vectorB )
    pearsSimilarityMatrix = 0.5 + 0.5 * corrcoef(vectorA, vectorB);
    pearsSimilarity = pearsSimilarityMatrix(1,2);
end

余弦相似度函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ cosSimilarity ] = cosSim( vectorA, vectorB )
    %注意vectorA和vectorB都是行向量
    num = vectorA * vectorB';
    denom = norm(vectorA) * norm(vectorB);
    cosSimilarity = 0.5 + 0.5 * (num./denom);
end

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認(rèn)證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

推薦系統(tǒng) 協(xié)同過濾相關(guān)系數(shù) 機器學(xué)習(xí) 聚類特征數(shù)據(jù)分析

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統(tǒng)競選大戲開鑼，川普當(dāng)選的奇跡會再發(fā)生嗎？

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...