
數(shù)據(jù)挖掘技術的應用領域_數(shù)據(jù)挖掘應用前景
很多公司已成功地部署了數(shù)據(jù)挖掘應用系統(tǒng)。隨著這一技術的早期采用者已經(jīng)逐步趨于信息密集型工業(yè)時,例如財務服務和直郵市場公司,這一技術已經(jīng)對任何想利用一個大的數(shù)據(jù)倉庫去較好地管理他們的客戶關系的公司均是適用的。數(shù)據(jù)挖掘成功的兩個關鍵因素是:一個大且完整的數(shù)據(jù)倉庫,和一個可挖掘的定義、理解都明確的商務流程,如客戶展望、保持,商業(yè)活動管理,等等。
一些成功的應用領域包括:
(1) 一家制藥公司可以分析他最近的銷售行動及其結(jié)果以改進高位值醫(yī)師的目標市場,并決定哪些市場活動將在后續(xù)的幾個月有最大的效果。數(shù)據(jù)需要包括競爭對手的市場活動,信息和當?shù)蒯t(yī)療系統(tǒng)的信息一樣。結(jié)果可以通過廣域網(wǎng)分發(fā)到各銷售隊伍,它可以使地區(qū)代表從決策過程中關鍵屬性的視點來檢視這些建議。隨著這一過程的進行,數(shù)據(jù)倉庫的動態(tài)分析允許來自整個組織的最好的實踐應用于特定的銷售環(huán)境。
(2) 一個信用卡公司可利用他的巨大的客戶交易數(shù)據(jù)倉庫來確定客戶對新的信用卡中最感興趣的產(chǎn)品。使用一個小型的測試郵件,就可以確定一個客戶對新產(chǎn)品的親和力屬性。最近的項目已經(jīng)表明,采用超常規(guī)的方法對指定目標的郵寄活動,可以節(jié)省20倍的費用。
(3) 一家擁有很大的直銷隊伍的多樣化的運輸公司,可使用數(shù)據(jù)挖掘以確定其服務的最好模式。 用數(shù)據(jù)挖掘來分析他自己的客戶體驗,該公司可建立唯一的分段以確定高位值的預期。對諸如由 Dun & Bradstreet 提供的那些一般商務數(shù)據(jù)使用這些分段可以產(chǎn)生一張按地區(qū)排列的優(yōu)先列表。
(4) 一個大的消費者貨物包裹公司可以利用數(shù)據(jù)挖掘來改進對零售商的銷售流程。來自消費者組織、運輸商以及競爭對手活動的數(shù)據(jù),可以用于理解打上印記和倉儲轉(zhuǎn)移的原因。通過這些分析,制造商可選擇能最好地運抵目標客戶地區(qū)的運輸商推薦策略。
每一個這樣的例子有一個共同的清晰的基礎,他們利用在數(shù)據(jù)倉庫里隱藏的關于客戶篤信的知識,來減少費用并改善客戶關系的價值。這些組織現(xiàn)在可以集中精力于最重要的客戶和有前景的商務,并設計可以最好實現(xiàn)這些目標的市場策略。
數(shù)據(jù)挖掘(DM)、在線分析(OLAP)和決策支持(DSS)的差異
在在線分處理 OLAP 中,它采用的是演繹推理;在數(shù)據(jù)挖掘中,則是歸納推理。因此二者的區(qū)別是什么及分別采用什么技術差不多是一個問題。
數(shù)據(jù)挖掘(Data Mining)
數(shù)據(jù)挖掘的目標仍然很像是人工智能。數(shù)據(jù)挖掘用戶不能對系統(tǒng)嚴格地提出一個盡可能完整的問題,以在此模型中發(fā)現(xiàn)過去的模式來預測未來的行為。這可以產(chǎn)生以前不知曉的有價值的事實。
更開放的數(shù)據(jù)挖掘請求甚至可以像這樣:”給我一個人們購買敞蓬卡車時的特點預測模型”。通過從過去的模式的學習,數(shù)據(jù)挖掘系統(tǒng)應能提供下列類型的答案:”它取決于時間年份和所在地區(qū)。在冬季,在新英格蘭鄉(xiāng)下的人們,在特定的年齡組和收入水平,將比中西部的同類人,喜歡購買更多的該種卡車”。
數(shù)據(jù)挖掘可以發(fā)現(xiàn)復雜或精細的答案,而這些是 OLAP 處理所不能做到的。但拋去這些差別,一些不做數(shù)據(jù)挖掘的 OLAP 銷售商也聲稱他們能做。 Pilot 公司的專家說:”給出數(shù)據(jù)挖掘的較弱的定義,OLAP 銷售商說他們可以做數(shù)據(jù)挖掘。明顯的分界線一個是處理是否是自動的,另一個是對諸如’什么是感興趣的’和’什么是無關的’等問題,你是否有一個好的統(tǒng)計基礎?!?br />
在線分析(OLAP)和決策支持(DSS)
OLAP 和 DSS 配置有少數(shù)的算法,并且依賴于人們提供給問題和假設。這樣做的缺點在于”問題和假設”受限于人的一己之見。
一個典型的 OLAP 或 DSS 問題是問:”去年中西部的人比新英格蘭的人購買了更多的敞蓬卡車嗎?” 注意這里的問題隱含有某種假設。OLAP 或 DSS 處理將回答:”去年中西部的人購買了 12,000 輛卡車,而同一時間, 新英格蘭的人買了 10,000 輛。”這顯然是有幫助的,但這受限于假設。
特別查詢并生成報表一般用于很多商務活動,來為他們的決策提供輸入。決策支持系統(tǒng) DSS 和執(zhí)行信息系統(tǒng) EIS 大多用于這種目的。從基本面來看,需要使用報表生成工具。應用系統(tǒng)利用這些特別的關系數(shù)據(jù)庫系統(tǒng)的查詢能力是普遍的現(xiàn)象。數(shù)據(jù)挖掘幫助人們聚焦于這些系統(tǒng)和技術的使用使用,這樣關系信息可以快速獲取分析時間更加有效率。
分界線的消退。與此同時,數(shù)據(jù)挖掘、OLAP 和 DSS 的界線正在消退。數(shù)據(jù)挖掘的算法已經(jīng)進入了很多產(chǎn)品的議程,包括那些純粹的 DSS 和 OLAP 銷售商,和 AT&T 那樣,他們已經(jīng)在悄悄地工作于一個稱為”最近鄰居系統(tǒng)”的數(shù)據(jù)挖掘方案,它可以展示記錄間的相似性。因為 DSS 銷售商已經(jīng)有了前衛(wèi)的數(shù)據(jù)庫可視化系統(tǒng),如果數(shù)據(jù)挖掘功能很好地做出,那它的加入是自然而然的事。
編譯自 Kenneth S. Lubel Data Mining: A New Way to Find Answers
數(shù)據(jù)挖掘技術未來的發(fā)展方向
(1) 新的專門用于知識發(fā)現(xiàn)的類似 SQL 那樣的形式化和標準化的數(shù)據(jù)挖掘語言將會出現(xiàn)。
(2) 可視化的數(shù)據(jù)挖掘過程,用戶易于理解挖掘且能操縱它,它可使數(shù)據(jù)挖掘過程成為用戶業(yè)務流程的一部分。包括數(shù)據(jù)用戶化呈現(xiàn)與交互操縱兩部分。
(3) WEB 下的網(wǎng)絡挖掘的應用技術的發(fā)展,數(shù)據(jù)挖掘服務器與數(shù)據(jù)庫服務器配合,實現(xiàn)數(shù)據(jù)挖掘。屆時可在因特網(wǎng)上建立強大的數(shù)據(jù)挖掘引擎與數(shù)據(jù)挖掘服務市場。
融合各種異構(gòu)數(shù)據(jù)的挖掘技術。從而既可以在數(shù)據(jù)外的文本、圖形、多媒體上又可以在數(shù)據(jù)庫外的信息、新聞、廣播市場上實施挖掘。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03