
小白學數(shù)據(jù)分析--日活躍人數(shù)分析
在數(shù)據(jù)分析的道路上走的崎嶇坎坷,同時數(shù)據(jù)分析本身是一個多面和復雜的工作,要懂得理論(統(tǒng)計、概率、數(shù)據(jù)挖掘、算法、模型)更要懂得業(yè)務,懂得行業(yè)理論,還要有靈活多變的思維,想想還是很復雜和麻煩的,所講內容不但是理論,不僅是數(shù)據(jù),盡量把這些東西綜合起來,立體的來看,鄙人水平有限,很多的內容是嘗試和改進,參考了很多的材料,在木有高人指點和牛人幫助的情況下,我只能借助浩瀚的網絡知識和自己的悟性,今天決心拿出來給各位主要是幫助大家和我一起進步。
第一天就從一份數(shù)據(jù)的分析開始,這里面涉及了很多的內容,大家需要慢慢理解。
案例:
某位網友提供了一份游戲的日活躍賬號數(shù)的數(shù)據(jù)信息,游戲是從2011年9月份開始了測試,到2012年2月,但是產品究竟表現(xiàn)如何,從PLC(產品生命周期----《營銷管理》)來看,產品目前處于一個什么時期,下一步怎么來做營銷和運營工作,這是一個需要關注的問題。今天就從日活躍這個數(shù)據(jù)指標的解析上簡單看看PLC的解讀。
設計分析的數(shù)據(jù)指標有很多方面,總體來說就兩塊,收入+人氣,我們就從對人氣的分析上下手,考慮文章篇幅關系,今天單列每日活躍的分析過程,其他指標的把握和分析基本和此相同,大家可以自己嘗試完成。
術語解釋:
每日活躍用戶(DAU):每日登錄過游戲的玩家數(shù)量(重復登錄者不累加)
IB:Item-Billing,游戲中通過游戲幣交易流通的道具
APA:活躍付費賬號數(shù)
PLC:產品生命周期-----《營銷管理》
ARPU:平均每名玩家盈利能力
新登用戶:每日注冊成為游戲玩家的數(shù)量
每日有效活躍玩家:達到某一個指標(一般是在線時長)的日活躍玩家數(shù)量
每日有效新登用戶:達到注冊并成功登錄進行過游戲的玩家數(shù)量
為什么要看每日活躍用戶?
拋開游戲上線初期的推廣營銷因素影響后,版本隨后會進入真正意義上的成長和發(fā)展階段,這個階段也是對于游戲品質和開始階段投放影響的評估(當然這種靠推廣的影響會存在一定的時效性,在對于DAU分析時,要拋開這個階段)。每日活躍用戶的變化說明以下的原因:
人氣波動:建立每日活躍人數(shù)的彈性數(shù)值區(qū)間(閾值),當然這點的預警要按照每個月的具體情況來看,比如每個月的節(jié)日,假期,學生開學等其他因素的影響情況,建立一套因素影響指數(shù),并作用于人氣波動的預警。
趨勢走向:綜合一個階段的日活躍變化情況,對于重大拐點和趨勢進行分析,并預測下一個周期的變化形式。
產品質量:從日活躍的趨勢變化和人氣波動等其他因素綜合看產品版本更新,活動設置等對于產品的PLC的影響,以及產品質量是否符合玩家的預期(質量的定義很廣泛,這里比如IB設計,系統(tǒng)設計,交互體驗等等)。
影響因素:正如剛才所言,我們綜合一個周期的日活躍數(shù)據(jù) 和其他數(shù)據(jù)制定影響因素指數(shù),便于宏觀把控數(shù)據(jù)的變化,比如進入預警范圍的數(shù)據(jù)究竟因為這些影響因素的影響有多大。做到心中有數(shù)。
當然,以上是簡單的列舉了一下日活躍用戶參與的數(shù)據(jù)分析的幾個方面和作用,對于數(shù)據(jù)分析千萬不能局限在一個指標而進行所謂的分析,要全面的結合其他指標進行衡量和分析。比如新登用戶,收入數(shù)據(jù)(充值,ARPU,APA等等)。
怎么來分析DAU?
如之前文章所說,我們主要運用曲線圖和箱線圖來分析DAU數(shù)據(jù),如下圖,使用IBM SPSS 19進行箱線圖的分析(其詳細過程以后在敘述)。
再次箱線圖中涉及幾個術語指標,先給各位再解釋一下:
方差:度量隨機變量和其數(shù)學期望(即均值)之間的偏離程度,測度數(shù)據(jù)變異(離散)程度的最重要的指標,方差是各個數(shù)據(jù)與其算術平均數(shù)的離差平方和的平均數(shù),通常以σ2表示。方差的計量單位和量綱不便于從經濟意義上進行解釋,所以實際統(tǒng)計工作中多用方差的算術平方根——標準差來測度統(tǒng)計數(shù)據(jù)的差異程度。
方差和標準差也是根據(jù)全部數(shù)據(jù)計算的,它反映了每個數(shù)據(jù)與其均值相比平均相差的數(shù)值,因此它能準確地反映出數(shù)據(jù)的離散程度。比如,平均日活躍為A,通過方差判定整個這個月的DAU波動情況,以及距離A的離散程度。
期望:廣義的來說,是指人們對每樣東西的提前勾畫出的一種標準,達到了這個標準就是達到了期望值。從概率論和統(tǒng)計學中,離散型隨機變量的一切可能的取值xi與對應的概率Pi(=xi)之積的和稱為該離散型隨機變量的數(shù)學期望(設級數(shù)絕對收斂),記為E(x)),我們多數(shù)情況下只討論離散型期望。
中位數(shù):中位數(shù)是指將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的那個數(shù)據(jù)。中位數(shù)用Me表示。
從中位數(shù)的定義可知,所研究的數(shù)據(jù)中有一半小于中位數(shù),一半大于中位數(shù)。中位數(shù)的作用與算術平均數(shù)相近,也是作為所研究數(shù)據(jù)的代表值。在一個等差數(shù)列或一個正態(tài)分布數(shù)列中,中位數(shù)就等于算術平均數(shù)。
在數(shù)列中出現(xiàn)了極端變量值的情況下,用中位數(shù)作為代表值要比用算術平均數(shù)更好,因為中位數(shù)不受極端變量值的影響;如果研究目的就是為了反映中間水平,當然也應該用中位數(shù)。在統(tǒng)計數(shù)據(jù)的處理和分析時,可結合使用中位數(shù)。
四分位數(shù):將數(shù)據(jù)劃分為4個部分,每一個部分大約包含有1/4即25%的數(shù)據(jù)項。這種劃分的臨界點即為四分位數(shù)。它們定義如下:
Q1=第1四分位數(shù),即第25百分位數(shù);
Q2=第2四分位數(shù),即第50百分位數(shù);
Q3=第3四分位數(shù),即第75百分位數(shù)。
四分位差:四分位差又稱內距、也稱四分間距(inter-quartile range),是指將各個變量值按大小順序排列,然后將此數(shù)列分成四等份,所得第三個四分位上的值與第一個四分位上的值的差。四分位差用公式表示:
Q = Q3 ? Q1
其中:Q1的位置=(n+1)/4
Q3的位置=3(n+1)/4
四分位差反映了中間50%數(shù)據(jù)的離散程度。其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。與極差(最大值與最小值之差)相比,四分位差不受極值的影響。此外,由于中位數(shù)處于數(shù)據(jù)的中間位置,因此四分位差的大小在一定程度上也說明了中位數(shù)對一組數(shù)據(jù)的代表程度。主要用于測度順序數(shù)據(jù)的離散程度。當然,對于數(shù)值型數(shù)據(jù)也可以計算四分位差,但不適合于分類數(shù)據(jù)。
其以上的幾個信息的示意圖如下所示
下面我們從這個箱線圖來分析一下DAU的近期變化情況
除了2012-Jan以外,都沒有離群點或者極限值,相對而言,每個月游戲人數(shù)整體比較穩(wěn)定,沒有發(fā)生巨大的變化。而在2012-Jan出現(xiàn)了兩個離群值,調查發(fā)現(xiàn),是1月4日和1月5日出現(xiàn)的問題。經過CCU曲線分析,發(fā)現(xiàn)關鍵節(jié)點數(shù)據(jù)變化很小,但是24小時總體出現(xiàn)微下降,說明玩家4日和5日的活躍數(shù)據(jù)被稀釋了,此外,通過對競品的分析發(fā)現(xiàn)4日和5日有線上領取活動,再者,節(jié)后兩天學生基本需要返校和白領休假歸來,造成數(shù)據(jù)暫時下滑。
此外,我們拿到分析數(shù)據(jù)和上圖來看,12年二月份和11年9月份的中位數(shù)較高,說明這段時間內的平均日活躍相對于本月來說較高,這可以看出這段時間內,游戲內的用戶上線較為頻繁(當然此處要結合PCU,在線時長來看更加準確)。
9月份為開始測試的月份,而2月份為假期階段,因此玩家上線的意愿相對來說會比較高一些。這也是在意料之中的情況。
然而11年的11月份和12月份,中位數(shù)偏低,玩家上線意愿不夠強烈,11月份已經非常低了,主要原因在于這一時期玩家進入考試周期,四六級,中期考試等等,屬于淡季階段。
11年10月份國慶節(jié)期間,玩家上線意愿還算不錯,但是沒有達到理想的效果,中位數(shù)低于平均水平,因此國慶假期的活動或者推廣效果不是非常理想,間接也導致了下個月下滑的非常迅速,因此下次節(jié)日活動需要進行重新評估和調整。數(shù)據(jù)如下:
對于12年一月份的表現(xiàn)算是情理中,今年由于1月份過年,然而過年7天玩家的游戲時間其實是縮水的,沒有太多精力投入游戲,但是從箱線圖來看,表現(xiàn)還算正常。高于平均水平,活動效果應該比較不錯,一月份雖然出現(xiàn)了兩個離群值,但是一月份的標準差是最小的,也就是說一月份整體的活躍趨勢穩(wěn)定,沒有大的波動。
總體來看,如果要考察PLC,需要結合收益數(shù)據(jù),以及其他的諸如ACU,PCU,新登等數(shù)據(jù)來綜合看待PLC,但是從DAU來看(狹義來說),人氣在幾個月來保持相對的穩(wěn)定,但是整體上經歷了小幅的下滑,換個角度說,這款產品存在一些問題,人氣持續(xù)穩(wěn)中有降,可以說玩家度過初級的新手期后,中間的成長、競爭、追求階段出現(xiàn)了問題,訴求不能滿足,導致人氣下滑。更加詳細具體的原因需要更多的數(shù)據(jù)綜合分析。
注:以上分析皆建立在與數(shù)據(jù)的對比之上和其他輔助的數(shù)據(jù)綜合分析上,當分析者單純觀察一段數(shù)據(jù)時,不能通過中位數(shù)高低輕易下定論認為用戶上線頻繁與否。需要考慮很多的客觀因素。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03