
數(shù)據(jù)挖掘在企業(yè)中應(yīng)用的四種途徑
數(shù)據(jù)激增是當(dāng)今社會(huì)的一大特性,如何有效的利用數(shù)據(jù)挖掘方法,從海量信息中提取出有用的模式和規(guī)律而不僅僅是“望洋興嘆”,已經(jīng)成為人們迫切的需求。企業(yè)應(yīng)該將數(shù)據(jù)挖掘視為一大法寶,利用它將數(shù)據(jù)轉(zhuǎn)化為商業(yè)智能,提高企業(yè)的核心競(jìng)爭(zhēng)力。從投資的角度來(lái)看,如果對(duì)數(shù)據(jù)研究所支付的費(fèi)用少于研究成果所帶來(lái)的價(jià)值,數(shù)據(jù)挖掘就值得去做。
正如修行的省悟過(guò)程一樣,要將數(shù)據(jù)挖掘引入公司,并非只有一種途徑。我們的最終目的是解決企業(yè)的業(yè)務(wù)問(wèn)題,為企業(yè)提供更大的商機(jī)。本文簡(jiǎn)要介紹了將數(shù)據(jù)挖掘技術(shù)應(yīng)用到企業(yè)中的四種有效途徑。
一、購(gòu)買成熟的模型
如果企業(yè)的問(wèn)題已經(jīng)有了現(xiàn)成的解決方案,便沒(méi)有必要再去耗費(fèi)時(shí)間和資金去建立一個(gè)新的模型了。這個(gè)模型的形式可能是一系列的關(guān)聯(lián)規(guī)則,也可能是一個(gè)確定了系數(shù)的回歸模型,或是一個(gè)訓(xùn)練好了的神經(jīng)網(wǎng)絡(luò)模型——它可以直接應(yīng)用到實(shí)際問(wèn)題中。我們要做的只是將自己的數(shù)據(jù)“喂”給它,模型經(jīng)過(guò)自動(dòng)消化處理,得出一個(gè)精簡(jiǎn)的答案:諸如哪些老客戶面臨流失的危險(xiǎn)?哪些新客戶是最有潛力帶給公司價(jià)值的?
這種方法采用了“拿來(lái)主義”,是最節(jié)省氣力的,不失為一個(gè)好辦法。美國(guó)的銀行大都采用了信用評(píng)估系統(tǒng),當(dāng)客戶遞交貸款申請(qǐng)后,該系統(tǒng)根據(jù)用戶填寫(xiě)的一大串資料快速對(duì)客戶信用風(fēng)險(xiǎn)做出預(yù)測(cè)。實(shí)際表明,該系統(tǒng)能夠大大提高工作的效率,而且效果也不會(huì)遜于信貸員的經(jīng)驗(yàn)判斷。但是,這種評(píng)分機(jī)制將眾多不同的數(shù)據(jù)濃縮為一個(gè)結(jié)果,很多細(xì)節(jié)上的差別無(wú)疑被忽視了——客戶信用評(píng)分高或低的具體原因沒(méi)有被體現(xiàn)出來(lái)。
另外,這種方便、快捷的方法也極其缺少靈活性:如果使用的條件發(fā)生了變化,模型難以隨之做出改動(dòng)。因此,必須要注意使用購(gòu)買模型的先決條件:你目前的形式包括產(chǎn)品、市場(chǎng)、客戶關(guān)系等必須和該模型當(dāng)初建立時(shí)的假設(shè)是一致的。盲目生搬硬套,勢(shì)必會(huì)產(chǎn)生毫無(wú)價(jià)值甚至荒謬的結(jié)果,一旦不經(jīng)意的應(yīng)用,危害就難說(shuō)了。
二、使用行業(yè)應(yīng)用軟件
顧名思義,行業(yè)應(yīng)用軟件是為某一行業(yè)領(lǐng)域量身定做的。從底層的數(shù)據(jù)分析處理一直到頂層的交互界面都是結(jié)合特定行業(yè)的業(yè)務(wù)流程和專業(yè)特色來(lái)設(shè)計(jì)、開(kāi)發(fā)的。雖然它的應(yīng)用領(lǐng)域比較狹窄,但較之直接購(gòu)買的模型,它可以更多的融入和結(jié)合人的判斷,提高了靈活性。而且,相對(duì)于通用數(shù)據(jù)挖掘軟件,它能夠很好的利用專業(yè)領(lǐng)域的各種知識(shí)。
目前比較流行的客戶流失管理軟件,被電信、超市、電子商務(wù)等許多不同類型的企業(yè)所應(yīng)用,他們共同的目標(biāo)是為了提前發(fā)現(xiàn)有可能流失的客戶群,及時(shí)反應(yīng),做出相應(yīng)的挽留措施。此類軟件可以結(jié)合企業(yè)自身的規(guī)模、用戶、產(chǎn)品、交易額、市場(chǎng)環(huán)境、挖掘目標(biāo)等具體條件來(lái)控制和實(shí)施數(shù)據(jù)挖掘的過(guò)程。
通常,行業(yè)應(yīng)用軟件里嵌入了多個(gè)建模的模板,使用向?qū)У姆绞捷o助用戶完成模型的建立,然后從中選取最優(yōu)。其實(shí),這種“最優(yōu)選擇”也只是相對(duì)的,因?yàn)檩o助建模的過(guò)程是僵硬的,它無(wú)法完成數(shù)據(jù)挖掘中最重要的部分,包括正確理解和定義商業(yè)問(wèn)題、將有用的數(shù)據(jù)挑選出來(lái)轉(zhuǎn)換為潛在的信息、對(duì)建模結(jié)果進(jìn)行理性的解釋和評(píng)價(jià)。
固然,這類軟件采用了專業(yè)領(lǐng)域的表達(dá)方式和解決特定問(wèn)題的用戶界面,從而易于理解而且自動(dòng)性高,使實(shí)施的過(guò)程變得相對(duì)簡(jiǎn)單。但是,如果你的企業(yè)擁有更加復(fù)雜的數(shù)據(jù)和更加具體的挖掘目標(biāo),就需要采用更加高級(jí)的數(shù)據(jù)挖掘方法了。
三、聘請(qǐng)專家實(shí)施項(xiàng)目
他山之石,可以攻玉。如果數(shù)據(jù)挖掘并非只是為了解決眼前的問(wèn)題,而是著眼于企業(yè)長(zhǎng)遠(yuǎn)的成長(zhǎng);如果企業(yè)的數(shù)據(jù)來(lái)自眾多系統(tǒng),格式復(fù)雜也并非純凈;如果不明確如何利用挖掘的成果創(chuàng)造新的商機(jī);如果企業(yè)內(nèi)部的成員沒(méi)有足夠的能力保證項(xiàng)目的順利實(shí)施——此時(shí),聘請(qǐng)外部專家來(lái)引導(dǎo)數(shù)據(jù)挖掘項(xiàng)目走向成功,才是明智的選擇。
你可以聯(lián)系數(shù)據(jù)挖掘軟件銷售商(諸如SAS、SPSS、Miner等),邀請(qǐng)數(shù)據(jù)挖掘工程師帶著功能強(qiáng)大(操作同樣復(fù)雜)的數(shù)據(jù)挖掘軟件來(lái)到企業(yè),將他們的專業(yè)知識(shí)應(yīng)用到企業(yè)的數(shù)據(jù)挖掘過(guò)程中;你也可以帶著企業(yè)的數(shù)據(jù)到高?;蜃稍児镜?a href='/map/shujuwajue/' style='color:#000;font-size:inherit;'>數(shù)據(jù)挖掘中心,利用他們的軟件和硬件,和他們一起工作。
如本文開(kāi)始所言,數(shù)據(jù)挖掘的過(guò)程絕非一蹴而就,而是如同僧人的修行省悟,可能漫長(zhǎng)而反復(fù)。建模方法千變?nèi)f化,而數(shù)據(jù)靜靜的呆在那里,十足一副以不變應(yīng)萬(wàn)變的姿態(tài)。這里有條條大路,但并非都能通向羅馬,為了找到最有效的模型,我們通常需要反復(fù)檢驗(yàn),做出選擇。一般存在以下幾個(gè)決定性的步驟需要放慢腳步,仔細(xì)考察:首先,根據(jù)現(xiàn)有的人力、物力選取建模工具;其次,根據(jù)數(shù)據(jù)的特點(diǎn)對(duì)模型分類,制定標(biāo)準(zhǔn)來(lái)拆分?jǐn)?shù)據(jù),從而建立不同的模型;然后,調(diào)整參數(shù),從決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等算法中選取最有效的建立最終模型;另外,建模過(guò)程中要具體問(wèn)題具體分析,有效的抽取、清洗、轉(zhuǎn)換、重組數(shù)據(jù)。
需要強(qiáng)調(diào)的是,在這個(gè)過(guò)程中一定要注意企業(yè)人員和挖掘人員之間的溝通和協(xié)調(diào),才能將企業(yè)積累的商業(yè)智慧和挖掘人員的專業(yè)知識(shí)完美結(jié)合。
四、量身定做開(kāi)發(fā)自己的數(shù)據(jù)挖掘平臺(tái)
由于商業(yè)問(wèn)題的特殊性,數(shù)據(jù)挖掘工具并非像某些促銷廣告所言:“總有一款適合您”。通過(guò)考察企業(yè)問(wèn)題的特殊性,對(duì)購(gòu)買軟件、聘請(qǐng)專家所需要的投資和挖掘成果應(yīng)用后可能帶來(lái)的回報(bào)等因素進(jìn)行綜合比較,你也可以考慮開(kāi)發(fā)一個(gè)適合自身環(huán)境的數(shù)據(jù)挖掘工具。雖然可能會(huì)花去較長(zhǎng)的時(shí)間,但成功之后,受益久遠(yuǎn)。這個(gè)量身定做的數(shù)據(jù)挖掘工具可以隨時(shí)根據(jù)企業(yè)環(huán)境的變化做出修正和調(diào)整,并且有堅(jiān)實(shí)的技術(shù)支持作為保障。
這類狀況在商業(yè)范圍內(nèi)比較少見(jiàn),通常在醫(yī)藥、體育等自身數(shù)據(jù)差異較大、數(shù)據(jù)挖掘研究尚不全面成熟的領(lǐng)域使用。主要表現(xiàn)為走進(jìn)高校,和具有專業(yè)知識(shí)的導(dǎo)師及其研究生小組互動(dòng)完成。
以上方法的選擇由企業(yè)環(huán)境所決定,可以選其一,也可以將幾種方法捆綁起來(lái),優(yōu)勢(shì)互補(bǔ)。最后還要強(qiáng)調(diào)兩點(diǎn):第一,并非所有的軟件都能完全實(shí)現(xiàn)自動(dòng)化,也并非所有的軟件都能取代人的智慧,如果沒(méi)有專業(yè)的數(shù)據(jù)挖掘技能,即使數(shù)據(jù)挖掘工具的功能再?gòu)?qiáng)大,也很難產(chǎn)生好的結(jié)果。所以,必須有數(shù)據(jù)挖掘領(lǐng)域的專家參與,以人為本,才能保證企業(yè)數(shù)據(jù)挖掘流程沿著安全、有效的軌道進(jìn)行。第二,企業(yè)自身遠(yuǎn)比外部更了解自己的業(yè)務(wù)和客戶,最好的方法是在企業(yè)內(nèi)部培養(yǎng)數(shù)據(jù)挖掘骨干人員——只有同時(shí)做到精通企業(yè)問(wèn)題和數(shù)據(jù)分析方法,才能將數(shù)據(jù)挖掘的效用發(fā)揮到極致。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03