
關(guān)聯(lián)分析故事:從數(shù)據(jù)到信息到?jīng)Q策
俗話說(shuō),忘記歷史就是背叛自己,今天這篇用此做開場(chǎng)再合適不過(guò)。
這一篇將根據(jù)一個(gè)虛擬的故事,來(lái)介紹如何通過(guò)歷史數(shù)據(jù)來(lái)幫助一個(gè)銷售人員發(fā)現(xiàn)規(guī)律信息從而輔助他來(lái)做一些決策信息。
本文的主角是Tim,Tim在一個(gè)銷售部門,部門最近決定做新一輪銷售計(jì)劃,然后根據(jù)計(jì)劃結(jié)束時(shí),各個(gè)銷售人員的銷售業(yè)績(jī)來(lái)進(jìn)行KPI考核。
Tim的部門在確定了銷售任務(wù)后,其它人很快的投入到店面的銷售工作中去,而Tim則跑到了公司的IT維護(hù)部門,向IT 部門要了一份歷史的客戶數(shù)據(jù)。
此時(shí)已經(jīng)有人在責(zé)怪Tim,說(shuō)你一個(gè)銷售不去外面跑業(yè)務(wù),怎么跑到IT部門"不務(wù)正業(yè)"來(lái)了,而且,專門要以前的客戶數(shù)據(jù),居然不去不關(guān)心新客戶。
其實(shí),Tim還有一個(gè)搞IT的朋友,James,他是一位數(shù)據(jù)分析師,在零售行業(yè)也有一定的經(jīng)驗(yàn)。Tim的第一個(gè)想法就是找 James給些建議。
平時(shí)兩個(gè)人聊天的過(guò)程中,James給Tim講了無(wú)數(shù)多次關(guān)于商業(yè)智能的知識(shí)。雖然Tim是搞銷售的,但是受到James的經(jīng)常灌輸,自己對(duì)里面的知識(shí)也有了一些印象,比如,數(shù)據(jù)挖掘,當(dāng)然這個(gè)概念對(duì)于搞銷售的Tim來(lái)說(shuō)簡(jiǎn)直就是天書,正所謂隔行如隔山,但是有一點(diǎn)他非常理解,那么就是:從數(shù)據(jù)到信息,也就是說(shuō),從數(shù)據(jù)中獲取信息。
于是,銷售任務(wù)一開始,Tim就跑到了IT部門要了這樣一份數(shù)據(jù),來(lái)看看James到底能從這里頭得到什么樣的信息,從而能幫助Tim更準(zhǔn)確的知道因該給什么樣的人推薦產(chǎn)品才比較靠譜。
James拿到Tim的數(shù)據(jù)之后,大概的瀏覽了一下:
數(shù)據(jù)的具體結(jié)構(gòu)如下:
從這份數(shù)據(jù)中,James看到,里面包含了客戶的性別,婚姻狀況,年收入以及家庭相關(guān)的和教育等基本信息。其中最后一列關(guān)鍵信息,就是客戶是否購(gòu)買過(guò)產(chǎn)品。如果購(gòu)買過(guò)就記為1,否則就記為0。
James拿過(guò)來(lái)這個(gè)Excel文件,首先做了一個(gè)關(guān)鍵影響因素分析。
根據(jù)這個(gè)工具,首先指定關(guān)注的列,就是客戶是否購(gòu)買了產(chǎn)品的標(biāo)記:
這里選擇BikeBuyer。
然后再點(diǎn)擊Choose Columns to be used for analysis。
這里,James根據(jù)經(jīng)驗(yàn)指定了需要分析的列。很明顯,DataFirstPPurchase是沒(méi)什么用的,James果斷把這列剔除掉以免影響到分析的準(zhǔn)確性。
然后系統(tǒng)會(huì)根據(jù)James的設(shè)置自動(dòng)處理這些歷史數(shù)據(jù)。
處理完畢后,系統(tǒng)生成了一份報(bào)告:
于是,James給Tim發(fā)了一封郵件:
Dear Tim,
我分析了你提供給我的數(shù)據(jù),并且從數(shù)據(jù)里得到幾點(diǎn)規(guī)則。
首先,關(guān)注沒(méi)有車,有一個(gè)小孩,以及來(lái)自Pacific,還有平時(shí)上班路程不是太遠(yuǎn)的用戶,他們很有可能是你的潛在客戶。
此外,對(duì)于有兩臺(tái)車的客戶,就不要去推薦了,從你們的業(yè)務(wù)記錄來(lái)看這類客戶購(gòu)買產(chǎn)品的可能性實(shí)在不大。
還有小孩數(shù)量比較多,上班距離太遠(yuǎn),超過(guò)65歲的成為你客戶的可能性也很小。
以上。
Best wishes!
James.
某年某月某日
Tim收到這封郵件之后非常高興,因?yàn)檫@樣一下子就可以讓他判斷出一個(gè)新客戶是否會(huì)購(gòu)買產(chǎn)品,從而不會(huì)在本身就不會(huì)有購(gòu)買需求這類客戶身上花費(fèi)太多時(shí)間,這樣就能把精力投入到更多的目標(biāo)客戶中去。
不過(guò)很快,Tim又有了一個(gè)問(wèn)題,就是單憑這樣的判斷太籠統(tǒng),容易丟失部分極特殊的客戶,所以Tim希望能自己根據(jù)客戶的情況做更詳細(xì)的判斷。
收到Tim的這個(gè)請(qǐng)求之后,James在Excel中建立了一個(gè)挖掘計(jì)算器。
首先,點(diǎn)擊預(yù)測(cè)計(jì)算工具。
在工具中設(shè)置需要預(yù)測(cè)的列。
點(diǎn)擊Run,Excel通過(guò)SQL Server的分析服務(wù)開始處理數(shù)據(jù)。
數(shù)據(jù)處理完畢后,在Excel中生成了幾張報(bào)告:
在第一份報(bào)告中,James得到了列表,里面標(biāo)識(shí)了每個(gè)屬性對(duì)一個(gè)未知客戶會(huì)購(gòu)買產(chǎn)品的影響程度。
在另外一份報(bào)告中,根據(jù)這份分析數(shù)據(jù),包含一個(gè)動(dòng)態(tài)的操作表格。
每一個(gè)屬性的值都變成了一個(gè)下拉列表,各個(gè)屬性的Impact影響值加在一起最后得出一個(gè)分?jǐn)?shù),這個(gè)分?jǐn)?shù)如果達(dá)到一定的高度,那么就表明這個(gè)客戶很有可能會(huì)購(gòu)買產(chǎn)品。
于是,James把這個(gè)Excel文件發(fā)給了Tim,這樣Tim就可以根據(jù)收集到的客戶信息對(duì)應(yīng)選擇里面的項(xiàng),然后通過(guò)計(jì)算知道用戶是否是潛在客戶。
這個(gè)文件幫了Tim不少的忙,也準(zhǔn)確的識(shí)別了一些客戶。但Tim也往往抱怨,在出去跑業(yè)務(wù)的過(guò)程中,電腦不是總帶在身邊,所以往往很難及時(shí)的做出判斷。
James知道Tim的這個(gè)煩惱后,告訴他,你把第三份分析報(bào)告中的表格打印出來(lái)就可以了。
這個(gè)表格把每個(gè)屬性的值都列了出來(lái),并且它們對(duì)應(yīng)的分?jǐn)?shù)也在后面。Tim打印出來(lái)后,可以自己手動(dòng)在上面做計(jì)算。
算好總分后,對(duì)比下面的分?jǐn)?shù),也就是說(shuō)分?jǐn)?shù)最起碼要達(dá)到601才有可能是一個(gè)潛在客戶。
于是,對(duì)于IT系統(tǒng)的操作不是很熟悉的Tim就可以每次對(duì)著這個(gè)單子來(lái)對(duì)新客戶作出潛在客戶的判斷。
在這個(gè)故事里,James并沒(méi)有用到什么太復(fù)雜的數(shù)據(jù),通篇他只在用一個(gè)軟件,就是Excel,Excel從2007版本開始通過(guò)SQL Server的功能擴(kuò)充可以實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)挖掘功能,它通過(guò)SQL Server Analysis Services分析服務(wù)來(lái)生成臨時(shí)的挖掘模型,通過(guò)樣本數(shù)據(jù)以及挖掘模型和算法來(lái)發(fā)現(xiàn)數(shù)據(jù)中存在的一些規(guī)律,相關(guān)性等信息。
通過(guò)Excel對(duì)SQL Server數(shù)據(jù)挖掘功能的封裝,使得用戶即使不清楚數(shù)據(jù)挖掘的具體算法也可以實(shí)現(xiàn)數(shù)據(jù)挖掘的功能從而做挖掘預(yù)測(cè)分析來(lái)輔助決策,甚至都不需要用戶了解什么樣的挖掘模型算法適合解決什么樣的問(wèn)題,只需要關(guān)注Excel里所帶的表分析工具就可以做簡(jiǎn)單的預(yù)測(cè)分析。
總之,數(shù)據(jù)挖掘,不是已不是數(shù)據(jù)分析師們的專屬,有了Excel,你也可以。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04