
SPSS數(shù)據(jù)分析網(wǎng)絡(luò)游戲行業(yè)應(yīng)用范例
在網(wǎng)絡(luò)游戲運營中,如何把注冊用戶(免費用戶)轉(zhuǎn)化成付費用戶,是一個非常普遍且現(xiàn)實的問題。在網(wǎng)絡(luò)游戲試玩初期,游戲運營商為了測試和完善網(wǎng)絡(luò)游戲以及快速擴(kuò)大玩家群,通常都會推出一段相對較長的免費試玩期。因此,在網(wǎng)絡(luò)游戲正式運營前就會存在大量的注冊用戶,而且這些注冊用戶會在網(wǎng)絡(luò)游戲運行后存在很長一段時間。
那么如何把這些注冊用戶轉(zhuǎn)化成付費客戶,真正為游戲運營商帶來直觀的收益呢?通常市場人員會制定各種營銷方式來吸引注冊用戶成為網(wǎng)絡(luò)游戲的收費用戶,但是市場人員通常并不了解哪些注冊用戶會對哪種營銷方式產(chǎn)生興趣并產(chǎn)生響應(yīng)。市場人員往往只能通過廣而告知的方法進(jìn)行營銷。這種營銷方式的結(jié)果就是大量的營銷資源被浪費在無效的客戶營銷中。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)和發(fā)展使網(wǎng)絡(luò)游戲運營商能夠?qū)ψ杂脩舨扇〔顒e化營銷,對正確的注冊用戶采用正確的營銷手段,從而提高市場營銷活動效率,使企業(yè)利潤得到最大化。
一、CRISP-DM數(shù)據(jù)挖掘實施方法論
成功的數(shù)據(jù)挖掘項目需要有正確的實施方法論來確保項目成功。CRISP-DM挖掘?qū)嵤┓椒ㄕ摚缧袠I(yè)標(biāo)準(zhǔn)數(shù)據(jù)挖掘實施方法論)是SPSS公司和NCR公司1990年在德國克萊斯勒公司共同實施數(shù)據(jù)挖掘項目時制定的。截至目前為止,全球有60%以上的數(shù)據(jù)挖掘項目都是采用該數(shù)據(jù)挖掘方法論進(jìn)行實施。
CRISP-DM數(shù)據(jù)挖掘實施方法論幫助企業(yè)把注意力集中在解決業(yè)務(wù)問題本身,而不是技術(shù)層面上。CRISP-DM流程模型包括了六個步驟,涵蓋了數(shù)據(jù)挖掘的整個過程,它們是:
1、商業(yè)理解Business understanding
這一初始階段集中在從商業(yè)角度理解項目的目標(biāo)和要求,然后把理解轉(zhuǎn)化為數(shù)據(jù)挖掘問題,并制定出一個旨在實現(xiàn)目標(biāo)的初步計劃。
2、數(shù)據(jù)理解Data understanding
數(shù)據(jù)理解階段開始于原始數(shù)據(jù)的收集,接下來進(jìn)行的活動是熟悉數(shù)據(jù)、識別數(shù)據(jù)質(zhì)量問題、探索對數(shù)據(jù)的第一認(rèn)識,或挖掘有深層含義的數(shù)據(jù)子集來形成對隱藏信息的假設(shè)。
3、數(shù)據(jù)準(zhǔn)備Data preparation
數(shù)據(jù)準(zhǔn)備階段包括所有從原始未加工的數(shù)據(jù)構(gòu)造最終數(shù)據(jù)集的活動(這些數(shù)據(jù)集是指將要嵌入建模工具中的數(shù)據(jù))。數(shù)據(jù)準(zhǔn)備任務(wù)可能實施多次,而且不按任何規(guī)定的順序。這些任務(wù)包括表格、記錄和屬性選擇以及對建模工具中數(shù)據(jù)的轉(zhuǎn)換和清理。
4、建模Modeling
在此階段,主要是選擇各種建模技術(shù),同時對它們的參數(shù)進(jìn)行校準(zhǔn)以達(dá)到最優(yōu)值。通常對于同一個數(shù)據(jù)挖掘問題類型,會有多種方法。一些方法在數(shù)據(jù)形式上會有具體的要求。因此,常常必須返回到數(shù)據(jù)準(zhǔn)備階段。
5、評估Evaluation
進(jìn)入項目中的這個階段,你已經(jīng)建立了一個模型(或者多個),從數(shù)據(jù)分析的角度來看,該模型似乎有很高的質(zhì)量。在進(jìn)行到模型的最后發(fā)布前,有一點是很重要的——更為徹底地評估模型和檢查建立模型的各個步驟,從而確定它完全地達(dá)到了商業(yè)目標(biāo)。一個關(guān)鍵目標(biāo)為決定是否存在一些重要地商業(yè)問題仍未得到充分地考慮。關(guān)于數(shù)據(jù)挖掘結(jié)果的使用決定應(yīng)該在此階段結(jié)束時確定下來。
6、發(fā)布Deployment
模型的創(chuàng)建通常并不是項目的結(jié)尾。即使模型的目的是增加對數(shù)據(jù)的了解,所獲得的了解也需要進(jìn)行組織并以一種客戶能夠使用的方式呈現(xiàn)。這常常包括在一個組織的決策過程中應(yīng)用“現(xiàn)場”模型,如在網(wǎng)頁的實時個人化中或營銷數(shù)據(jù)的重復(fù)得分中。不過,根據(jù)需要,發(fā)布過程可以簡單到產(chǎn)生一個報告,也可以復(fù)雜到在整個企業(yè)中執(zhí)行一個可重復(fù)的數(shù)據(jù)挖掘過程。大部分情況下,是由客戶來實施發(fā)布的,而非數(shù)據(jù)分析師本身。盡管如此,即使分析師并不執(zhí)行發(fā)布,這對客戶也是十分重要的——提前理解需要采取什么行動來實際利用產(chǎn)生的模型。
此流程模型有幾個關(guān)鍵點。首先,有幾個步驟相互之間的影響比較大。比如,數(shù)據(jù)準(zhǔn)備通常在建模之前,但是在建模過程中做出的決策以及收集到的信息可能會導(dǎo)致重新準(zhǔn)備數(shù)據(jù),這兩個步驟相互交叉一直到兩個步驟都得到比較好的解決。類似的情況還有,評估步驟會導(dǎo)致重新評估最初的業(yè)務(wù)理解,用戶可能會覺得這是在回答錯誤的問題。在這一點上,用戶可能會重新修訂業(yè)務(wù)理解直到達(dá)到更好的目標(biāo)。
第二點是數(shù)據(jù)挖掘的迭代特性,很少能有一次性完成整個流程的情況。使用數(shù)據(jù)挖掘解決客戶需求是一個發(fā)展的過程。從數(shù)據(jù)挖掘循環(huán)中獲得的知識往往會帶來新的問題。這些新問題又通過進(jìn)一步的數(shù)據(jù)挖掘解決。這個挖掘與找到新問題的過程應(yīng)當(dāng)成為用戶考慮總體業(yè)務(wù)戰(zhàn)略的一部分。
二、游戲注冊用戶轉(zhuǎn)化數(shù)據(jù)挖掘項目實踐
CRISP-DM數(shù)據(jù)挖掘方法論——商業(yè)理解
某網(wǎng)絡(luò)運營商的市場人員了解到本公司目前擁有大量的注冊用戶,付費客戶相應(yīng)較少。而且大部分的注冊用戶因為目前只需要使用網(wǎng)站的基本功能,缺少對付費功能的內(nèi)在需求。因此,如果不采取客戶差異化的方式,采用電話呼叫以及服務(wù)優(yōu)惠對客戶進(jìn)行點對點的營銷效率很低。市場人員需要明確的了解那些經(jīng)過電話呼叫營銷方式成為本公司付費用戶和那些對電話呼叫營銷沒有響應(yīng)的注冊用戶之間行為特征和屬性特征的區(qū)別,從而對那些有內(nèi)在需求的客戶進(jìn)行電話營銷,提高營銷成功率,減少無謂的營銷成本。根據(jù)業(yè)務(wù)人員經(jīng)驗,在不采用數(shù)據(jù)挖掘分析結(jié)果前提下進(jìn)行電話營銷成功率只有1%不到,業(yè)務(wù)人員希望通過該項目的分析結(jié)果,能把電話營銷成功率提高到3%以上。
數(shù)據(jù)挖掘實施人員了解到呼叫中心每月最大的呼叫量大概只能覆蓋3萬個用戶。因此,數(shù)據(jù)挖掘結(jié)果只需能對營銷響應(yīng)概率最高的前10%用戶中做到盡可能高的準(zhǔn)確預(yù)測就足夠了。另外,數(shù)據(jù)挖掘人員還調(diào)查了企業(yè)的硬件資源和數(shù)據(jù)資源。基于經(jīng)驗,市場人員認(rèn)為影響注冊用戶成為付費用戶的主要因素有上網(wǎng)方式、性別、注冊的時間、最近一次登錄的時間等行為和屬性因素。另一方面,數(shù)據(jù)挖掘項目組認(rèn)為項目成功的主要風(fēng)險在于網(wǎng)站是否發(fā)生重大安全事故以及用戶是否能用其他手段非法登陸系統(tǒng)。最后,為了確保市場分析人員和技術(shù)人員對專業(yè)術(shù)語以及數(shù)據(jù)挖掘目標(biāo)見解的一致性(如何算響應(yīng)客戶,客戶在接受過電話營銷后多久時間內(nèi)成為付費用戶為響應(yīng)客戶),數(shù)據(jù)挖掘項目組用書面的方式對各類術(shù)語做出明確的解釋,并對數(shù)據(jù)挖掘項目的成本和收益計算方式進(jìn)行了明確的定義。
基于市場人員制定的商業(yè)目標(biāo),數(shù)據(jù)挖掘項目組把商業(yè)目標(biāo)細(xì)化為多個數(shù)據(jù)挖掘目標(biāo):發(fā)掘潛在的營銷響應(yīng)客戶以及根據(jù)用戶使用行為及屬性行為聚類,了解不同用戶群的特征及響應(yīng)程度,幫助市場人員定位客戶,了解客戶。最后,項目制定明確的項目計劃并選擇SPSS Clementine作為他們的數(shù)據(jù)挖掘產(chǎn)品。
CRISP-DM數(shù)據(jù)挖掘方法論——數(shù)據(jù)理解
完成商業(yè)理解后,該數(shù)據(jù)挖掘項目組根據(jù)前面的業(yè)務(wù)假設(shè)進(jìn)行數(shù)據(jù)收集、描述數(shù)據(jù)內(nèi)容、分析數(shù)據(jù)的分布、缺失、是否和預(yù)測目標(biāo)相關(guān)等內(nèi)容。通常,數(shù)據(jù)挖掘項目的數(shù)據(jù)來源于多個不同的數(shù)據(jù)源,例如數(shù)據(jù)倉庫、市場調(diào)研數(shù)據(jù)等等。
Clementine數(shù)據(jù)源功能面板
利用SPSS Clementine的數(shù)據(jù)源功能面板中的數(shù)據(jù)庫、文件、SPSS等數(shù)據(jù)導(dǎo)入節(jié)點導(dǎo)入數(shù)據(jù);通過SPSS Clementine輸出功能面板中的數(shù)據(jù)審核節(jié)點了解數(shù)據(jù)分布情況以及數(shù)據(jù)質(zhì)量情況,對進(jìn)入數(shù)據(jù)挖掘模型的數(shù)據(jù)進(jìn)行初選。通常,那些數(shù)據(jù)缺失嚴(yán)重,數(shù)據(jù)分布有問題(例如:大部分客戶的年齡分布在0-1歲等)都會在這一步進(jìn)行排除。另外,數(shù)據(jù)挖掘項目組還對重要因素用直方圖、條形圖觀察,分析這些因素是否和預(yù)測目標(biāo)之間有著強烈的關(guān)系以驗證先前業(yè)務(wù)假設(shè)是否正確。如果分析結(jié)果和業(yè)務(wù)假設(shè)不一致,則數(shù)據(jù)挖掘項目組需要返回到商業(yè)理解階段重新評估現(xiàn)有數(shù)據(jù)是否支持業(yè)務(wù)的商業(yè)目標(biāo);數(shù)據(jù)挖掘目標(biāo)是否正確;業(yè)務(wù)分析思路是否有問題等等。
CRISP-DM數(shù)據(jù)挖掘方法論——數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備在數(shù)據(jù)挖掘項目中是一個非常重要的環(huán)節(jié)。數(shù)據(jù)挖掘界有句俗話“垃圾進(jìn),垃圾出”。高質(zhì)量的數(shù)據(jù)加上高質(zhì)量的數(shù)據(jù)準(zhǔn)備是確保數(shù)據(jù)挖掘項目成功的重要保證。在數(shù)據(jù)準(zhǔn)備期間,數(shù)據(jù)挖掘實施人員需要基于業(yè)務(wù)分析思路,利用已有數(shù)據(jù)生成其他派生變量來提高模型的準(zhǔn)確性(例如:通過最近一個月的登錄頻度和前一個月的登錄頻度生成最近一個月登錄頻度變化率)。因為,模型算法本身并不能分析出因素之間的潛在關(guān)系和預(yù)測結(jié)果之間的關(guān)聯(lián)。
CRISP-DM數(shù)據(jù)挖掘方法論——建立模型
完成商業(yè)理解后,該數(shù)據(jù)挖掘項目組根據(jù)前面的業(yè)務(wù)假設(shè)對數(shù)據(jù)進(jìn)行收集,通過數(shù)據(jù)挖掘分析結(jié)果和營銷手段相結(jié)合。
附錄:SPSS Clementine簡介
SPSS Clementine的可視化、操作的簡便性以及豐富的算法,不但使SPSS Clementine成為全球所有數(shù)據(jù)分析人員最喜愛的數(shù)據(jù)分析產(chǎn)品,而且使業(yè)務(wù)分析人員在不需要掌握過多數(shù)據(jù)和IT知識的情況下,也能深入數(shù)據(jù)挖掘項目,最終保證數(shù)據(jù)挖掘項目的成功實施。根據(jù)Nucleus Research的調(diào)查結(jié)果,在使用SPSS Clementine的數(shù)據(jù)挖掘項目中,有81%的數(shù)據(jù)挖掘項目能夠按時部署,有75%的數(shù)據(jù)挖掘項目符合或低于預(yù)算。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03