99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀一小時了解數(shù)據(jù)挖掘②:分類算法的應(yīng)用和成熟案例解析-數(shù)據(jù)分析師
一小時了解數(shù)據(jù)挖掘②:分類算法的應(yīng)用和成熟案例解析-數(shù)據(jù)分析師
2014-12-11
收藏

分類算法的應(yīng)用

本節(jié)將為大家介紹數(shù)據(jù)挖掘中的分類算法在一些行業(yè)中的代表性應(yīng)用。我們將算法應(yīng)用分為表述問題和解決過程兩個階段,表述問題即需要運用數(shù)據(jù)挖掘能夠理解和處理的語言來闡述業(yè)務(wù)問題,最重要的是能夠用正確且符合實際的方式把業(yè)務(wù)問題轉(zhuǎn)化成數(shù)據(jù)挖掘問題,這往往決定了后續(xù)工作是否能有效的展開,嘗試解決一個不符合實際的業(yè)務(wù)問題往往會使得數(shù)據(jù)挖掘的工作陷入數(shù)據(jù)的海洋中,既費時費力又得不到想要的結(jié)果。而解決過程,顧名思義就是將表述清楚的問題通過數(shù)據(jù)挖掘的方法加以解決的過程。在我們把業(yè)務(wù)領(lǐng)域的問題很清晰地轉(zhuǎn)化為數(shù)據(jù)挖掘領(lǐng)域的問題之后,解決問題也就變得相對直截了當(dāng)。

分類算法的應(yīng)用非常廣泛,只要是牽涉到把客戶、人群、地區(qū)、商品等按照不同屬性區(qū)分開的場景都可以使用分類算法。例如我們可以通過客戶分類構(gòu)造一個分類模型來對銀行貸款進行風(fēng)險評估,通過人群分類來評估酒店或飯店如何定價,通過商品分類來考慮市場整體營銷策略等。

在當(dāng)前的市場營銷行為中很重要的一個特點是強調(diào)目標(biāo)客戶細分。無論是銀行對貸款風(fēng)險的評估還是營銷中的目標(biāo)客戶(或市場)細分,其實都屬于分類算法中客戶類別分析的范疇。而客戶類別分析的功能也正在于此:采用數(shù)據(jù)挖掘中的分類技術(shù),將客戶分成不同的類別,以便于提高企業(yè)的決策效率和準(zhǔn)確度。例如呼叫中心設(shè)計時可以分為呼叫頻繁的客戶、偶然大量呼叫的客戶、穩(wěn)定呼叫的客戶和其他客戶,以幫助呼叫中心尋找出這些不同種類客戶的特征。這樣的分類模型可以讓呼叫中心了解不同行為類別客戶的分布特征。

下面是幾個做得比較成熟的具體分類應(yīng)用描述和解決過程。

直郵營銷(Direct Mail)

直郵營銷是直效行銷的一種,是把傳統(tǒng)郵件直接發(fā)送給消費者的營銷方式,而且很多傳統(tǒng)行業(yè)把直郵營銷作為整個營銷體系中一個重要的組成部分,涉及的行業(yè)主要是大型商場、大賣場、商業(yè)連鎖店鋪、專賣店等。當(dāng)然由于直郵營銷的應(yīng)用很廣,所以這種方式也同樣適用于其他行業(yè)。

案例闡述:A公司是一家汽車4S店,公司擁有完備的客戶歷史消費數(shù)據(jù)庫,現(xiàn)公司準(zhǔn)備舉辦一次高端品牌汽車的促銷活動,為配合這次促銷活動,公司計劃為潛在客戶(主要是新客戶)寄去一份精美的汽車銷售材料并附帶一份小禮品。由于資源有限,公司僅有1000份材料和禮品的預(yù)算額度。

表述問題:這里新客戶是指在店中留下過詳細資料但又沒有消費記錄的客戶。這次促銷活動的要求是轉(zhuǎn)化收到這1000份材料和禮品的新客戶,讓盡量多的新客戶能夠最終成為4S店的消費客戶。

解決問題:公司首先找出與這次促銷活動類似的已經(jīng)舉辦過的促銷活動的歷史消費數(shù)據(jù),再將這個歷史數(shù)據(jù)集中,把促銷結(jié)果分成正反兩類,正類用來表示可以最終消費的客戶。通過歷史數(shù)據(jù)的訓(xùn)練我們可以得出一個分類器,如果用的是決策樹,我們還能夠得出一個類似If-Then(如果-就)的規(guī)則,而這個規(guī)則能夠揭示參加促銷活動并最終消費的客戶的主要特征。由于分類結(jié)果最后可以表示成概率形式,如此,用經(jīng)過測試集測試過的分類器對新客戶進行分類,將得到的正類客戶的概率由大到小排序,這樣就可以生成一個客戶列表,營銷人員按著這個表由上至下數(shù)出前1000個客戶并向他們寄出材料和禮品即可。

客戶流失模型

這一模型的應(yīng)用出現(xiàn)在我國的移動通信行業(yè),其目的主要是為了降低客戶流失率。

案例闡述:我國的移動通信行業(yè)經(jīng)過了前幾年的高速發(fā)展,近一段時間的發(fā)展速度逐漸緩慢下來。注冊用戶常常處于一種動態(tài)變化的狀態(tài),即不斷有老客戶離網(wǎng),又不斷有新客戶入網(wǎng)。大量的低消費客戶和大量老客戶的離網(wǎng)使得移動通信公司無法快速向前發(fā)展。

表述問題:當(dāng)務(wù)之急在于降低客戶流失率,這里需要解決的問題是如何找出這些將要流失的客戶,如何采取適當(dāng)?shù)耐炝舸胧p少客戶的流失。

解決問題:我們需要建設(shè)客戶流失模型。和直郵營銷一樣,其目的也是為了對新客戶進行分類。只不過客戶流失模型是為了找出那些不穩(wěn)定易流失的客戶。整個建模過程與直郵營銷類似。移動通信企業(yè)的最大優(yōu)勢在于這類公司的規(guī)模往往很大,數(shù)據(jù)收集和存儲的能力也比一般企業(yè)強很多,所以它們會擁有較詳細的客戶消費數(shù)據(jù),這對于數(shù)據(jù)挖掘的最終成功有著非常重要的作用。

垃圾郵件處理

案例闡述:對于企業(yè)和個人,如何處理垃圾郵件都是很頭疼的一件事情。在盤石公司開發(fā)的磐郵系統(tǒng)中,每個客戶可以有300G的郵件儲存容量,雖然有足夠的容量容納垃圾郵件,但是沒有過濾掉的垃圾郵件仍然會造成糟糕的用戶體驗。表述問題:如何對每個郵箱中收到的每封郵件進行處理,將有用郵件保留而過濾掉垃圾郵件是用戶關(guān)心的一大問題。

解決問題:目前的垃圾郵件過濾方法主要是采用文本挖掘技術(shù)(Text Mining)。作為數(shù)據(jù)挖掘的重要分支,文本挖掘數(shù)據(jù)挖掘傳統(tǒng)方法的基礎(chǔ)上引入了語義處理等其他學(xué)科知識。在垃圾郵件過濾的分類技術(shù)中最常見的是貝葉斯分類法。貝葉斯分類法主要是通過對郵件的信封標(biāo)題、主題和內(nèi)容進行掃描和判別。

近來,因為垃圾郵件發(fā)送方式隨著各家企業(yè)郵箱開發(fā)商的反垃圾技術(shù)的提升而變化,通過附件(PDF、圖像等)方式發(fā)送垃圾郵件的專業(yè)戶也越來越多,所以掃描的內(nèi)容又增加了一項檢查附件的工作。

信用卡分級

案例闡述:現(xiàn)如今金融行業(yè)的競爭異常激烈。在美國,出現(xiàn)在每一家郵箱里最多的信件恐怕就是信用卡邀請信。如何吸引合適的用戶來使用信用卡,以及準(zhǔn)確分析申請人的信用風(fēng)險,是每個商業(yè)銀行最關(guān)注也是最頭痛的事情。銀行要不惜一切代價吸引低風(fēng)險高價值的客戶,但是對于高風(fēng)險的信用卡申請者要盡量避免。

表述問題:如何把信用卡申請者分類為低、中、高風(fēng)險。

解決問題:我們需要建設(shè)客戶風(fēng)險模型對客戶的風(fēng)險進行分類。整個建模過程與直郵營銷類似。不過因為行業(yè)的特殊性,申請表中包含了大量關(guān)于用戶的個人信息,再加上通常會做的客戶信用查詢,可以用來參考的數(shù)據(jù)維度比前面的三個案例都要多一些,所以相對來說建模的精準(zhǔn)度也會高很多。

除了上面列出的四種典型問題之外,分類數(shù)據(jù)挖掘還有很多不同類型的應(yīng)用,例如文獻檢索和搜索引擎中的自動文本分類技術(shù),安全領(lǐng)域的入侵檢測等。

不過,不是所有分類的場景使用分類數(shù)據(jù)挖掘都有實際操作性。美國政府曾在“9·11”發(fā)生后提出一項全面信息識別計劃(Total Information Awareness Project),這項計劃的目的是建立系統(tǒng),利用數(shù)據(jù)挖掘技術(shù)對全美居民的通話記錄和信用卡支付記錄等海量數(shù)據(jù)信息進行分析,并利用這個系統(tǒng)來識別隱藏在美國的全部恐怖分子。除去涉及的個人隱私問題和海量數(shù)據(jù)如何獲取和處理的問題之外,單純從數(shù)據(jù)挖掘問題本身來說,這個計劃的可行性就要打個大問號。假設(shè)通過數(shù)據(jù)挖掘技術(shù)建立了一個99%的分類器來識別恐怖分子,雖然這個分類器的精度已經(jīng)是相當(dāng)好了,但是整個美國一天之中可產(chǎn)生的相關(guān)數(shù)據(jù)保守估計就會有約十億條,在產(chǎn)生如此龐大的增量情況下,這個99%的分類器每天至少也要忽略掉近千萬條可疑數(shù)據(jù),那么就可以說這種分類器幾乎毫無用處??赡苁腔谶@個原因,2003年這個計劃被終止,雖然之后還是有若干個類似的計劃被提出并嘗試,但其效果都很有限。正如前所述,除非另辟捷徑,否則這項計劃能夠成功實施的可能性很小。

CDA數(shù)據(jù)分析師培訓(xùn)官網(wǎng)

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }