
一種基于數(shù)據(jù)挖掘的通用CRM系統(tǒng)框架及關(guān)鍵技術(shù)研究
隨著客戶信息量的增加,客戶與公司的關(guān)系變得越來越復(fù)雜,單純操作性的客戶關(guān)系管理CRM(Customer Relationship Management)已難以滿足用戶的需要。在CRM中引入數(shù)據(jù)挖掘技術(shù),增強(qiáng)系統(tǒng)對相關(guān)海量客戶管理信息的有效整理、識別、歸類等功能,使CRM系統(tǒng)在一定程度上具有智能特點(diǎn),已經(jīng)成為當(dāng)前的研究熱點(diǎn)。傳統(tǒng)基于數(shù)據(jù)挖掘的CRM系統(tǒng)集中在對客戶數(shù)據(jù)本身的挖掘上,缺乏進(jìn)一步對這些數(shù)據(jù)的分析處理和優(yōu)化決策的功能,在一定程度上限制了它的推廣作用。
本文在充分分析當(dāng)前CRM的應(yīng)用現(xiàn)狀的基礎(chǔ)上,提出了一種新的基于數(shù)據(jù)挖掘技術(shù)的通用商業(yè)CRM系統(tǒng)框架,針對典型行業(yè)的商業(yè)應(yīng)用特點(diǎn)建立客戶分類準(zhǔn)則和響應(yīng)方式,即客戶商業(yè)應(yīng)用模型。系統(tǒng)通過集成數(shù)據(jù)挖掘、聯(lián)機(jī)數(shù)據(jù)分析(OLAP)技術(shù)以及知識庫技術(shù)形成支持基于客戶商業(yè)模型的客戶響應(yīng),該框架不僅能夠加強(qiáng)用戶對具體商業(yè)應(yīng)用的處理效率、處理質(zhì)量,而且框架的開放式體系使其具有可擴(kuò)展性和靈活性。
2 CRM系統(tǒng)框架
2.1 系統(tǒng)體系框架
該系統(tǒng)體系框架可以根據(jù)行業(yè)需求進(jìn)行定制,構(gòu)建基于客戶只能分析的數(shù)據(jù)挖掘解決方案。數(shù)據(jù)挖掘應(yīng)用平臺層次結(jié)構(gòu)如圖1所示。整個CRM系統(tǒng)分六個層次。
圖1 系統(tǒng)體系框架
(1)用戶層對客戶關(guān)系管理有需求的不同行業(yè)提供專用用戶接口開發(fā)工具,包括功能定制、界面設(shè)計、程序交互等功能接口函數(shù),從而實(shí)現(xiàn)不同行業(yè)客戶的客戶管理定制界面設(shè)計。
(2)應(yīng)用工具層是給用戶層提供解決方案的基本支撐。根據(jù)不同行業(yè)需求并考慮到傳統(tǒng)客戶關(guān)系管理的功能,抽取具有共性的面向客戶關(guān)系管理的功能單元模塊。功能單元模塊開發(fā)應(yīng)用面向?qū)ο蠹夹g(shù)術(shù)封裝,提供基于模板的功能屬性修改功能。
(3)決策分析層作為系統(tǒng)的核心模塊,提供一種組合輔助決策功能。從機(jī)制上又分為兩個相互關(guān)聯(lián)的組件,即決策分析組件與商業(yè)應(yīng)用模型庫。決策分析模塊既可以通過OLAP實(shí)現(xiàn)多維數(shù)據(jù)分析,運(yùn)用數(shù)據(jù)挖掘分析處理海量的客戶數(shù)據(jù),發(fā)現(xiàn)有價值的知識并預(yù)測客戶行為。
(4)算法層是數(shù)據(jù)挖掘應(yīng)用平臺的核心?,F(xiàn)實(shí)問題千差萬別,一個通用的數(shù)據(jù)挖掘工具集難以解決不同行業(yè)的問題。因此,算法層提供幾類當(dāng)前應(yīng)用較為廣泛且已證明行之有效的數(shù)據(jù)挖掘算法,如:關(guān)聯(lián)規(guī)則、序列模式、決策樹、神經(jīng)元網(wǎng)絡(luò)、聚集、異常檢測等。
(5)網(wǎng)絡(luò)層系統(tǒng)與其它軟件的集成通過客戶/服務(wù)器模式實(shí)現(xiàn),這種方式支持靈活的系統(tǒng)擴(kuò)展模式,為面向分布式的用戶應(yīng)用提供方便。
(6)數(shù)據(jù)層隨著信息技術(shù)的發(fā)展,企業(yè)中出現(xiàn)大量的、不同的包含企業(yè)客戶信息的數(shù)據(jù)源,如ERP、電子商務(wù)、數(shù)據(jù)庫等。因此,在數(shù)據(jù)倉庫的構(gòu)建中可以根據(jù)應(yīng)用對象的不同,實(shí)現(xiàn)在企業(yè)、公司或行業(yè)中數(shù)據(jù)的動態(tài)清洗、轉(zhuǎn)換、裝載等功能。
2.2 數(shù)據(jù)分析處理流程
(1)在數(shù)據(jù)采集和預(yù)處理部分,從客戶市場信息中抽取出所需數(shù)據(jù)并去除數(shù)據(jù)的不一致性,將所得數(shù)據(jù)進(jìn)行結(jié)構(gòu)和類型轉(zhuǎn)換并聚合成匯總數(shù)據(jù);將匯總數(shù)據(jù)加載進(jìn)多維數(shù)據(jù)倉庫,以供分析利用。
(2)在數(shù)據(jù)倉庫管理部分,基于模型庫、知識庫和方法庫的指導(dǎo),采用OLAP和挖掘工具進(jìn)行客戶概況、誠信度和贏利能力等的分析以及相關(guān)預(yù)測,并將這些分析和預(yù)測結(jié)果以圖形形式提供給執(zhí)行層和決策層。
(3)決策層和業(yè)務(wù)層將這些客戶信息和知識轉(zhuǎn)化為企業(yè)的戰(zhàn)略、決策和行動,以影響市場和客戶。
3 關(guān)鍵技術(shù)
3.1 數(shù)據(jù)倉庫建模
(1)數(shù)據(jù)清洗、轉(zhuǎn)換、裝載功能的實(shí)現(xiàn)
該系統(tǒng)的數(shù)據(jù)庫是建立在Microsoft SQL Server2000數(shù)據(jù)庫管理系統(tǒng)之上,并利用SQL Server2000的DTS(Data Transformation Service)構(gòu)件的數(shù)據(jù)清洗、轉(zhuǎn)換、裝載等預(yù)處理功能,DTS是一個基于COM標(biāo)準(zhǔn)的服務(wù),能夠進(jìn)行二次開發(fā),除了利用SQL語言外,還能利用VBScript或JavaScript語言對各種數(shù)據(jù)源進(jìn)行清洗、轉(zhuǎn)換及裝載。目前CIAS支持的數(shù)據(jù)源包括:關(guān)系數(shù)據(jù)庫,有結(jié)構(gòu)的文本數(shù)據(jù),XML數(shù)據(jù),數(shù)據(jù)立方體(Cube)。對于CDW中每個數(shù)據(jù)模式,都有一個可視化的用戶向?qū)?Wizard)程序幫助用戶完成數(shù)據(jù)的抽取工作。在向?qū)С绦蛑?,可以設(shè)置抽取任務(wù)執(zhí)行的時間。由于信息系統(tǒng)的數(shù)據(jù)在不斷的更新,為了保證及時性和有效性,需要同步CDW和信息系統(tǒng)的數(shù)據(jù)源。CDW采用數(shù)據(jù)倉庫的定時更新機(jī)制,對于數(shù)據(jù)量少的信息,比如客戶特征信息,采用增量覆蓋式更新,在每周或每月定時更新,對于產(chǎn)品使用等數(shù)據(jù)量大的信息,采用每天及時更新的方式。
(2)客戶對象建模
建立模型的關(guān)鍵是維度的選取、維度的分割、維度屬性的選取、事實(shí)數(shù)據(jù)項(xiàng)的選取。數(shù)據(jù)挖掘的目的是發(fā)現(xiàn)數(shù)據(jù)中的趨勢,一個自動化過程發(fā)現(xiàn)數(shù)據(jù)中的趨勢的能力在很大程度上受數(shù)據(jù)質(zhì)量的影響。在數(shù)據(jù)倉庫的對象層次中的關(guān)鍵對象是多維數(shù)據(jù)集、度量值、維度、級別和成員屬性。其中,多維數(shù)據(jù)集包含度量值和維度,維度從屬于多維數(shù)據(jù)集,級別從屬于維度,成員屬性從屬于級別。
根據(jù)CRM領(lǐng)域的應(yīng)用特點(diǎn),在數(shù)據(jù)倉庫內(nèi)創(chuàng)建了一個可擴(kuò)展的以客戶為中心的數(shù)據(jù)模式。具體的數(shù)據(jù)模式拓?fù)淙鐖D2所示。
圖2 基于多維數(shù)據(jù)集的客戶模型拓?fù)浣Y(jié)構(gòu)
用戶可以在具體的數(shù)據(jù)模式中增加字段,或者忽略其認(rèn)為沒有意義或是沒有數(shù)據(jù)的字段,在增加字段或忽略字段時,用戶通過填寫元數(shù)據(jù)信息,描述字段的實(shí)際含義,這些功能增加了系統(tǒng)的可擴(kuò)展性及靈活性。數(shù)據(jù)倉庫數(shù)據(jù)模式包括:客戶特征信息、客戶接觸、客戶事件、產(chǎn)品使用信息。
3.2 決策分析模塊
DW為OLAP和DM提供優(yōu)質(zhì)的數(shù)據(jù)源。基于數(shù)據(jù)倉庫來進(jìn)行OLAP,可以提高分析速度,而且OLAP可以采取更靈活的分析方式?;?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)挖掘,能更好地滿足高層戰(zhàn)略決策的要求。一般數(shù)據(jù)挖掘要花大量的精力進(jìn)行數(shù)據(jù)準(zhǔn)備。由于數(shù)據(jù)倉庫已經(jīng)完成了數(shù)據(jù)的收集、整理、合并等準(zhǔn)備工作,數(shù)據(jù)挖掘可以更專注于知識發(fā)現(xiàn)的核心處理階段。DM在OLAP的基礎(chǔ)上進(jìn)行進(jìn)一步的自動化知識發(fā)現(xiàn)處理.挖掘潛藏的模式預(yù)測未來趨勢。OLAP除了直接驗(yàn)證分析人員所提出的假設(shè)和問題,也可以驗(yàn)證DM得出的預(yù)測性結(jié)論,防止偏差。
在系統(tǒng)中,首先將數(shù)據(jù)源進(jìn)行預(yù)處理,按照數(shù)據(jù)倉庫的建模方式儲存在數(shù)據(jù)倉庫中。OLAP基于數(shù)據(jù)倉庫利用先驗(yàn)性規(guī)則(該規(guī)則直接來源于分析人員和知識庫)進(jìn)行驗(yàn)證性分析。數(shù)據(jù)挖掘基于數(shù)據(jù)倉庫進(jìn)行知識發(fā)現(xiàn)處理,即自動發(fā)現(xiàn)規(guī)則。通過知識庫來溝通OLAP與DM的交流。數(shù)據(jù)挖掘預(yù)測的規(guī)則輸入到知識庫中,OLAP從知識庫中提取規(guī)則來驗(yàn)證規(guī)則的有效性和可信度。知識庫中的規(guī)則還用于支持模型庫的構(gòu)建。DW、OLAP和DM需要的模型從模型庫中提取。
3.3 算法的映射
參考當(dāng)前CRM客戶信息管理技術(shù),本系統(tǒng)有五種商業(yè)模型。每種模型通過調(diào)用數(shù)據(jù)挖掘算法庫中的算法構(gòu)件得以實(shí)現(xiàn),它可能調(diào)用一個或多個數(shù)據(jù)挖掘算法。五種商業(yè)模型與數(shù)據(jù)挖掘算法映射關(guān)系如表1所示。
表1 數(shù)據(jù)挖掘算法映射表
3.4 基于XML的模型處理中間件機(jī)制
為了保證系統(tǒng)的開放性和可擴(kuò)展性,系統(tǒng)對商業(yè)模型的處理采用XML描述和存儲商業(yè)模型。采用這種開放的格式,可以將挖掘模型與數(shù)據(jù)及挖掘工具分離開,可以通過文本編輯器進(jìn)行編輯,使得用戶易于編輯商業(yè)模型。系統(tǒng)提供基于XML的模型處理的中間件機(jī)制,包括數(shù)據(jù)轉(zhuǎn)換器/監(jiān)視器和XML的虛擬數(shù)據(jù)倉庫。
(1)數(shù)據(jù)轉(zhuǎn)換器/監(jiān)視器。完成某種類型的數(shù)據(jù)源與虛擬數(shù)據(jù)庫之間的雙向映射。首先用XML描述集成數(shù)據(jù),用XSL定義用戶視圖,用XML文檔和格式文件DTD表示集成模式和數(shù)據(jù)源之間的映射。各個數(shù)據(jù)源的模式通過相應(yīng)的轉(zhuǎn)換器/監(jiān)視器溶入全局模式。在這個過程中,轉(zhuǎn)換器/監(jiān)視器數(shù)據(jù)源中的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為另一個DOM對象。一個關(guān)系轉(zhuǎn)換器/監(jiān)視器能決定關(guān)系模型和DOM對象數(shù)據(jù)模型之間的映射。
(2)XML虛擬數(shù)據(jù)倉庫。一方面將用戶對集成模式的訪問轉(zhuǎn)換成數(shù)據(jù)源可以執(zhí)行的請求;另一方面將各種數(shù)據(jù)源返回的數(shù)據(jù)轉(zhuǎn)換成集成模式的表示形式。具體步驟:①從數(shù)據(jù)倉庫中讀取數(shù)據(jù),生成XML文件,統(tǒng)一格式表示;②將XML轉(zhuǎn)換成一個DOM對象模型,為上層提供訪問服務(wù)。具體程序的實(shí)現(xiàn)采用ASP作為設(shè)計語言,利用XML的DOM來操作XML文檔。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03