99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)
簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)
2017-03-25
收藏

簡單易學(xué)的機器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1)

一、推薦系統(tǒng)的概念
    推薦系統(tǒng)(Recommendation System, RS),簡單來說就是根據(jù)用戶的日常行為,自動預(yù)測用戶的喜好,為用戶提供更多完善的服務(wù)。舉個簡單的例子,在京東商城,我們?yōu)g覽一本書之后,系統(tǒng)會為我們推薦購買了這本書的其他用戶購買的其他的書:

推薦系統(tǒng)在很多方面都有很好的應(yīng)用,尤其在現(xiàn)在的個性化方面發(fā)揮著重要的作用。
二、推薦系統(tǒng)的分類
    推薦系統(tǒng)使用了一系列不同的技術(shù),主要可以分為以下兩類:
基于內(nèi)容(content-based)的推薦。主要依據(jù)的是推薦項的性質(zhì)。
基于協(xié)同過濾(collaborative filtering)的推薦。主要依據(jù)的是用戶或者項之間的相似性。
    在協(xié)同過濾方法中,我們很顯然的會發(fā)現(xiàn),基于協(xié)同過濾推薦系統(tǒng)用可以分為兩類:
基于項(item-based)的推薦系統(tǒng)。主要依據(jù)的是項與項之間的相似性。
基于用戶(user-based)的推薦系統(tǒng)。主要依據(jù)的是用戶與用戶之間的相似性。
三、相似度的度量方法
    相似性的度量的方法有很多種,不同的度量方法的應(yīng)用范圍也不一樣。相似性度量方法的設(shè)計也是機器學(xué)習(xí)算法設(shè)計中很重要的一部分,尤其是對于聚類算法,推薦系統(tǒng)這類算法。
    相似性的度量方法必須滿足拓?fù)鋵W(xué)中的度量空間的基本條件:
假設(shè)d是度量空間上M的度量,其中度量d滿足:
非負(fù)性:,當(dāng)且僅當(dāng)時取等號;
對稱性:;
三角不等性:
    這里主要介紹三種相似性的度量方法:歐式距離、皮爾遜相關(guān)系數(shù)和余弦相似度。
1、歐式距離
   歐式距離是使用較多的相似性的度量方法,在kMeans中就使用到歐式距離作為相似項的發(fā)現(xiàn)。
2、皮爾遜相關(guān)系數(shù)(Pearson Correlation)
   在歐氏距離的計算中,不同特征之間的量級對歐氏距離的影響比較大,例如,我們就不能很好的利用歐式距離判斷和,和之間的相似性的大小。而皮爾遜相似性的度量對量級不敏感:

其中表示向量x和向量y內(nèi)積,表示向量x的二范數(shù)。
3、余弦相似度(Cosine Similarity)
   余弦相似度有著與皮爾遜相似度同樣的性質(zhì),對量級不敏感,是計算兩個向量的夾角。在吳軍老師的《數(shù)學(xué)之美》上,在計算文本相似性的過程中,大量使用了余弦相似性的度量方法。

四、基于相似度的推薦系統(tǒng)
    協(xié)同過濾是通過將用戶和其他用戶的數(shù)據(jù)進行對比來實現(xiàn)推薦的。我們通過一個評分系統(tǒng)對基于協(xié)同過濾推薦系統(tǒng)作闡述。

(不同用戶對不同商品的評分)
如圖,橫軸為每個用戶對不同商品的評分,評分的范圍為1~5,0表示該用戶未對該商品評分。我們以用戶Tracy為例,Tracy未對日式炸雞排和壽司飯評分,我們利用協(xié)同過濾推薦系統(tǒng)預(yù)測Tracy對該兩個商品評分,并依據(jù)分?jǐn)?shù)的高低向Tracy推薦商品。
1、計算相似度
   在本例中,我們是依據(jù)物品的相似度,即計算日式炸雞排與鰻魚飯、烤牛肉和手撕豬肉的相似度實現(xiàn)對日式炸雞排的評分,用同樣的方法對壽司飯評分。數(shù)據(jù)分析師培訓(xùn)
2、排序
   排序的目的是實現(xiàn)在日式炸雞排與壽司飯這兩個商品中推薦給用戶Tracy。
3、實驗結(jié)果

(相似度的計算——基于余弦相似度)

(推薦結(jié)果)
從推薦結(jié)果,我們發(fā)現(xiàn)壽司飯的評分更高,首推壽司飯,日式炸雞排排在壽司飯后面。
4、MATLAB代碼
主程序
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
%% 主函數(shù)  
 
% 導(dǎo)入數(shù)據(jù)  
data = [4,4,0,2,2;4,0,0,3,3;4,0,0,1,1;1,1,1,2,0;2,2,2,0,0;1,1,1,0,0;5,5,5,0,0];  
 
% reccomendation  
[sortScore, sortIndex] = recommend(data, 3, 'cosSim');  
 
len = size(sortScore);  
 
finalRec = [sortIndex, sortScore];  
disp(finalRec);  

計算相似度的函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ score ] = evaluate( data, user, simMeas, item )  
    [m,n] = size(data);  
    simTotal = 0;  
    ratSimTotal = 0;  
      
    % 尋找用戶都評價的商品  
    % data(user, item)為未評價的商品  
    for j = 1:n  
        userRating = data(user, j);%此用戶評價的商品  
        ratedItem = zeros(m,1);  
        numOfNon = 0;%統(tǒng)計已評價商品的數(shù)目  
        if userRating == 0%只是找到已評分的商品  
            continue;  
        end  
        for i = 1:m  
            if data(i,item) ~= 0 && data(i,j) ~= 0  
                ratedItem(i,1) = 1;  
                numOfNon = numOfNon + 1;  
            end  
        end  
          
        % 判斷有沒有都評分的項  
        if numOfNon == 0  
            similarity = 0;  
        else  
            % 構(gòu)造向量,便于計算相似性  
            vectorA = zeros(1,numOfNon);  
            vectorB = zeros(1,numOfNon);  
            r = 0;  
            for i = 1:m  
                if ratedItem(i,1) == 1  
                    r = r+1;  
                    vectorA(1,r) = data(i, j);  
                    vectorB(1,r) = data(i, item);  
                end  
            end  
            switch simMeas  
                case {'cosSim'}  
                    similarity = cosSim(vectorA,vectorB);  
                case {'ecludSim'}  
                    similarity = ecludSim(vectorA,vectorB);  
                case {'pearsSim'}  
                    similarity = pearsSim(vectorA,vectorB);  
            end  
        end  
        disp(['the ', num2str(item), ' and ', num2str(j), ' similarity is ', num2str(similarity)]);  
        simTotal = simTotal + similarity;  
        ratSimTotal = ratSimTotal + similarity * userRating;  
    end  
    if simTotal == 0  
        score = 0;  
    else  
        score = ratSimTotal./simTotal;  
    end  
end  

推薦函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ sortScore, sortIndex ] = recommend( data, user, simMeas )  
    % 獲取data的大小  
    [m, n] = size(data);%m為用戶,n為商品  
    if user > m  
        disp('The user is not in the dataBase');  
    end  
      
    % 尋找用戶user未評分的商品  
    unratedItem = zeros(1,n);  
    numOfUnrated = 0;  
    for j = 1:n  
        if data(user, j) == 0  
            unratedItem(1,j) = 1;%0表示已經(jīng)評分,1表示未評分  
            numOfUnrated = numOfUnrated + 1;  
        end  
    end  
      
    if numOfUnrated == 0  
        disp('the user has rated all items');  
    end  
      
    % 對未評分項打分,已達(dá)到推薦的作用  
    itemScore = zeros(numOfUnrated,2);  
    r = 0;  
    for j = 1:n  
        if unratedItem(1,j) == 1%找到未評分項  
            r = r + 1;  
            score = evaluate(data, user, simMeas, j);  
            itemScore(r,1) = j;  
            itemScore(r,2) = score;  
        end  
    end  
    %排序,按照分?jǐn)?shù)的高低進行推薦  
    [sortScore, sortIndex_1] = sort(itemScore(:,2),'descend');  
    [numOfIndex,x] = size(sortIndex_1(:,1));  
    sortIndex = zeros(numOfIndex,1);  
    for m = 1:numOfIndex  
        sortIndex(m,:) = itemScore(sortIndex_1(m,:),1);  
    end  
end  

相似度的函數(shù):
歐式距離函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ ecludSimilarity ] = ecludSim( vectorA, vectorB )  
    ecludSimilarity = 1./(1 + norm(vectorA - vectorB));  
end  

皮爾遜相關(guān)系數(shù)函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ pearsSimilarity ] = pearsSim( vectorA, vectorB )  
    pearsSimilarityMatrix = 0.5 + 0.5 * corrcoef(vectorA, vectorB);  
    pearsSimilarity = pearsSimilarityMatrix(1,2);  
end  

余弦相似度函數(shù)
[plain] view plain copy 在CODE上查看代碼片派生到我的代碼片
function [ cosSimilarity ] = cosSim( vectorA, vectorB )  
    %注意vectorA和vectorB都是行向量  
    num = vectorA * vectorB';  
    denom = norm(vectorA) * norm(vectorB);  
    cosSimilarity = 0.5 + 0.5 * (num./denom);  
end 

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }