99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀在SAS中進(jìn)行關(guān)聯(lián)規(guī)則分析_數(shù)據(jù)分析師考試
在SAS中進(jìn)行關(guān)聯(lián)規(guī)則分析_數(shù)據(jù)分析師考試
2015-07-07
收藏

在SAS中進(jìn)行關(guān)聯(lián)規(guī)則分析_數(shù)據(jù)分析師考試


SAS系統(tǒng)被譽(yù)為國際上的標(biāo)準(zhǔn)軟件系統(tǒng),本文將詳細(xì)介紹如何在SAS/EM模塊中進(jìn)行關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,使用的軟件版本是SAS 9.1.3下的Enterprise Miner 4.3:

從SAS頂端的【解決方案(S)】菜單下調(diào)出企業(yè)數(shù)據(jù)挖掘(也可以通過在命令行輸入miner):

SAS/EM的初始界面如下:

接下來,將數(shù)據(jù)挖掘外接程序示例數(shù)據(jù)集中的Associate表導(dǎo)入SAS邏輯庫。先將xlsx文件另存為xls文件,再雙擊SAS資源管理器中的邏輯庫,從【文件(F)】菜單下調(diào)出【導(dǎo)入數(shù)據(jù)】對(duì)話框:

點(diǎn)擊【Next >】,選擇xls文件及相應(yīng)的工作表:

點(diǎn)擊【Next >】,選擇相應(yīng)的SAS邏輯庫并命名:

點(diǎn)擊【Finish】,完成數(shù)據(jù)導(dǎo)入操作?;氐絊AS/EM界面,雙擊Untitled節(jié)點(diǎn)并重命名為Analysis。

鼠標(biāo)左鍵按住上方工具欄中的【Input Data Source】節(jié)點(diǎn)不放,拖入右邊的空白區(qū)域之后再放開鼠標(biāo),此時(shí)SAS/EM界面如下:

雙擊剛剛拖入的【Input Data Source】節(jié)點(diǎn),選擇前面導(dǎo)入的數(shù)據(jù)集Sasuser.Associate:

切換到【Variables】選項(xiàng)卡,在【Model Role】列【CATEGORY】行處點(diǎn)擊右鍵,選擇【Set Model Role】菜單:

分別將【CATEGORY】行設(shè)置為target,其他兩行設(shè)置為rejected:

關(guān)閉對(duì)話框,詢問是否保存變化時(shí),點(diǎn)擊【是(Y)】。若關(guān)閉SAS后重新打開EM項(xiàng)目時(shí)彈出Diagram被鎖,則刪除emproj文件夾中后綴是.lck的文件即可繼續(xù)編輯。

鼠標(biāo)左鍵按住上方工具欄中的【Association】節(jié)點(diǎn)不放,拖入右邊的空白區(qū)域之后再放開鼠標(biāo)。將鼠標(biāo)移向旁邊的【SASUSER.ASSOCIATE】節(jié)點(diǎn)周圍,當(dāng)變成十字型時(shí),鼠標(biāo)左鍵按住不放,拖向【Association】節(jié)點(diǎn),此時(shí)SAS/EM界面如下:

雙擊右邊的【Association】節(jié)點(diǎn)在SAS中進(jìn)行數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則圖標(biāo),切換到【General】選項(xiàng)卡的界面如下:

默認(rèn)的分析模式是【By Context】,它根據(jù)輸入數(shù)據(jù)源的結(jié)點(diǎn)信息選擇合適的分析方法。如果輸入數(shù)據(jù)集包括一個(gè)id變量和target變量,該結(jié)點(diǎn)自動(dòng)執(zhí)行關(guān)聯(lián)分析。下面的選項(xiàng)是設(shè)置關(guān)聯(lián)最小支持度、項(xiàng)集最大數(shù)目和規(guī)則最小置信度。

關(guān)閉【Association】對(duì)話框,右鍵【Association】節(jié)點(diǎn)圖標(biāo),在彈出的下拉選項(xiàng)中選擇【Run】,得到運(yùn)行結(jié)果如下:

此時(shí)在【Rules】選項(xiàng)卡上右鍵單擊,會(huì)彈出查看圖形菜單:

選擇【圖形(G)】之后,將窗口拉伸到合適的寬度,有些圖例需要拉到更寬才會(huì)顯示出來,結(jié)果界面如下:

前面結(jié)果表中的19條關(guān)聯(lián)規(guī)則都體現(xiàn)在這張圖里面,此圖的信息量比較大。我們以右下方的圓圈為例來解讀它的含義:從縱橫坐標(biāo)軸來看,此圓圈對(duì)應(yīng)表中的第11條關(guān)聯(lián)規(guī)則,即{Road Bikes ==> Jerseys};從圓圈標(biāo)示對(duì)應(yīng)的圖例來看,它表示置信度(Confidence)在20.24%到24.13%區(qū)間內(nèi),從表中可以看出實(shí)際值為20.26%;從圓圈的顏色對(duì)應(yīng)的圖例來看,它表示支持度(Support)在3.12%到3.78%區(qū)間內(nèi),從表中可以看出實(shí)際值為3.68%;圓圈的大小表示提升度(Lift)的大小,從表中可以看出實(shí)際值為1.34。

上面提到的置信度(Confidence)、支持度(Support)、提升度(Lift)是關(guān)聯(lián)發(fā)現(xiàn)的三個(gè)重要評(píng)價(jià)指標(biāo),它們都是怎么計(jì)算出來的呢?我們還是以前面提到的第11條關(guān)聯(lián)規(guī)則{Road Bikes ==> Jerseys}為例進(jìn)行說明:

先簡(jiǎn)單統(tǒng)計(jì)一下數(shù)據(jù)源中相關(guān)數(shù)據(jù),總共13050個(gè)訂單,其中有購買Road Bikes訂單的2369個(gè),有購買Jerseys的訂單1978個(gè),同時(shí)購買了Road Bikes和Jerseys的訂單480個(gè),計(jì)算以下幾個(gè)概率:

P(Road Bikes) = 2369/13050 = 18.15%

P(Jerseys) = 1978/13050 = 15.16%

P(Road Bikes & Jerseys) = 480/13050 = 3.68%

置信度Confidence(Road Bikes ==> Jerseys)表示在客戶購買Road Bikes的條件下,同時(shí)又購買Jerseys的概率,即P(Jerseys|Road Bikes) = P(Road Bikes & Jerseys)/P(Road Bikes) = 3.68%/18.15% = 20.26%。置信度越高,說明相關(guān)聯(lián)的商品被交叉銷售的機(jī)會(huì)越大。

支持度Support(Road Bikes ==> Jerseys)表示客戶同時(shí)購買過Road Bikes和Jerseys的概率,即P(Road Bikes & Jerseys) = 3.68%。支持度越高,說明相關(guān)聯(lián)的商品被同時(shí)購買的越頻繁。

提升度Lift(Road Bikes ==> Jerseys)表示使用關(guān)聯(lián)規(guī)則可以提升的倍數(shù),是置信度與期望置信度的比值,公式為Confidence(Road Bikes ==> Jerseys)/P(Jerseys) = 20.26%/15.16% = 1.34。

在進(jìn)行關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘中,通過指定這三個(gè)標(biāo)準(zhǔn)的最小值,三個(gè)標(biāo)準(zhǔn)的值都大于臨界值的關(guān)聯(lián)規(guī)則就被列出。而且以上這三個(gè)標(biāo)準(zhǔn)缺一不可,孤立地使用這三個(gè)標(biāo)準(zhǔn)中的任意一個(gè),都可能導(dǎo)致錯(cuò)誤結(jié)果。

當(dāng)某種常見現(xiàn)象出現(xiàn)在關(guān)聯(lián)規(guī)則右邊時(shí),高置信度也會(huì)產(chǎn)生誤導(dǎo)。比如以下幾條規(guī)則的置信度都比較高,但幾乎是沒有作用的規(guī)則:“買方便面則買牛奶”、“買牙刷則買牛奶”、“喜歡野外休閑則會(huì)買牛奶”等等。這一類規(guī)則的置信度和支持度都會(huì)比較高,因?yàn)楹苌儆腥藭?huì)不買牛奶。但這一類規(guī)則沒有任何作用。

關(guān)聯(lián)規(guī)則結(jié)果界面是查看表的情況下,還可以在查看菜單下選擇【生成表子集(S)...】,通過設(shè)定篩選出想要的關(guān)聯(lián)規(guī)則出來,例如下圖是在【Confidence】選項(xiàng)卡中設(shè)定最小置信度為26:

點(diǎn)擊【Process】后,結(jié)果將篩選出8條關(guān)聯(lián)規(guī)則。

在置信度(Confidence)、支持度(Support)、提升度(Lift)這三個(gè)重要評(píng)價(jià)指標(biāo)之中,提升度是最有可能單獨(dú)使用而不致產(chǎn)生誤導(dǎo)的標(biāo)準(zhǔn),因?yàn)樗梢詼y(cè)量關(guān)聯(lián)規(guī)則增進(jìn)預(yù)測(cè)右邊現(xiàn)象的能力。但如果該規(guī)則的支持度很低,該規(guī)則也可能造成誤導(dǎo)。

除了以上三個(gè)對(duì)關(guān)聯(lián)規(guī)則的數(shù)量標(biāo)準(zhǔn)外,一條關(guān)聯(lián)規(guī)則真正可取,還需要具備以下兩個(gè)條件:一是該規(guī)則必須是人們常識(shí)之外、意料之外的關(guān)聯(lián),二是該規(guī)則必須具有潛在的作用,而目前任何技術(shù)與算法都無法判斷哪些知識(shí)屬于常識(shí),也無法判斷哪些屬于可能具有潛在作用的規(guī)則,因此關(guān)聯(lián)規(guī)則的挖掘離不開人的作用。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }