
小白學數(shù)據(jù)分析--把握分析標準與敏感度
今天說說從另一個方面來分析一下數(shù)據(jù),如果通過Excel的復合圖表來分析一下DAU,同理分析其他數(shù)據(jù)指標的方法也是一樣的。在游戲數(shù)據(jù)分析方面,一般數(shù)據(jù)變化都是以周為周期進行有規(guī)律的變化的,所以無論我們進行什么時間周期的分析,一定要把握周期變化情況適時的做出分析,否則就會得出錯誤的結論和圖表。
如下圖所示,每逢周五到周日數(shù)據(jù)會較平日出現(xiàn)明顯的波峰情況,而且這種變化是一種以周為周期性的變化趨勢,也是我們做出分析時的考慮因素。
但是情況也不是固定的,比如在手機APP游戲中的情況如下所示:
其周末效應就不是非常的明顯,但是也存在變化的情況,說道這個分析還是要把握游戲類型和具體的客群情況來定。
但是有一點是必須說的,當我們要進行比較分析、趨勢分析等其他分析時,必須要為數(shù)據(jù)找到合適的參照環(huán)境,也就是說存在一個標準或者叫做基準去衡量這段時間的數(shù)據(jù)變化情況。如果沒有這標準就會出現(xiàn)下面的情況。
你會發(fā)現(xiàn)出現(xiàn)波峰交叉出現(xiàn)的情況,這是由于本月周末的DAU數(shù)據(jù)對應了上月DAU周四和周五的數(shù)據(jù),但是該圖的橫軸坐標使用的是本月的星期變化情況,這樣對于我們在分析數(shù)據(jù)時其實有很大的障礙和問題。
為此就需要我們?nèi)ソy(tǒng)一個參照環(huán)境,進行標準的分析和對照,比如我們參照本月的星期為統(tǒng)一的橫軸坐標,然后就會發(fā)現(xiàn)周末數(shù)據(jù)會出現(xiàn)在同一天,這樣便于我們衡量數(shù)據(jù)的周末效應。
下面就具體來說說怎么從曲線圖來進行分析DAU情況。
同比:為了消除數(shù)據(jù)周期性波動的影響,將本周期內(nèi)的數(shù)據(jù)與之前周期中相同時間點的數(shù)據(jù)進行比較。早期的應用是銷售業(yè)等受季節(jié)等影響較嚴重,為了消除趨勢分析中季節(jié)性的影響,引入了同比的概念,所以較多地就是當年的季度數(shù)據(jù)或者月數(shù)據(jù)與上一年度同期的比較,計算同比增長率。
環(huán)比:反應的是數(shù)據(jù)連續(xù)變化的趨勢,將本期的數(shù)據(jù)與上一周期的數(shù)據(jù)進行對比。最常見的是這個月的數(shù)據(jù)與上個月數(shù)據(jù)的比較,計算環(huán)比增長率,因為數(shù)據(jù)都是與之前最近一個周期的數(shù)據(jù)比較,所以是用于觀察數(shù)據(jù)持續(xù)變化的情況。
其實同比、環(huán)比沒有嚴格的適用范圍或者針對性的應用,一切需要分析在時間序列上的變化情況的數(shù)據(jù)或者指標都可以使用同比和環(huán)比。
在網(wǎng)游的數(shù)據(jù)分析中,我們要經(jīng)常使用這兩個術語,而且使用維度從日、周、月、年全部覆蓋,但是需要注意的是網(wǎng)游中的同環(huán)比應用要考慮很多因素,網(wǎng)游產(chǎn)品要考慮停服、事故、更新、活動等很多情況,所以諸如環(huán)比,同比的使用時要把在考慮這些情況下適度的使用,且不能沒有緣由的比較完畢后,但是沒告訴看報告的人為什么同環(huán)比下滑或者上浮這么大。同環(huán)比能夠為網(wǎng)游產(chǎn)品整體運營的發(fā)展狀況提供有力的參考,但是必須建立在一定的基礎上和環(huán)境的考慮上。
下面我們就從一個android平臺的手機游戲應用的數(shù)據(jù)開始說起曲線圖分析活躍用戶和相關的信息。
如下圖,為每日用戶的變化趨勢,這里使用了柱形圖,實際上,最好是用曲線圖,這是從系統(tǒng)上截取的圖片,大概表示了3個月的數(shù)據(jù)(12月17日-3月16日)。從下圖看得出來,圣誕節(jié),元旦,春節(jié),元宵節(jié)日活躍日數(shù)有小幅的提升,但是注意到春節(jié)只有除夕夜當日活躍較高,隨后下降明顯,這種情況基本上在節(jié)后都存在下降,而且非常明顯。
具體來看每日的新用戶變化情況,圣誕節(jié)出現(xiàn)一次新增用戶的明顯增長,元旦的增長空間明顯大于圣誕節(jié),這是因為,元旦基本都放假,符合中國人的習慣,但是很多公司把活動大都設置在了圣誕節(jié),某種意義上是有點問題的,元旦后新登用戶數(shù)開始下降,直到春節(jié)假期結束后,數(shù)據(jù)才恢復到12月中下旬的水平,這一點說明了一個問題,這款產(chǎn)品客群中,白領上班族會很多,因為2月份為假期,12月份為非假期,而這在數(shù)據(jù)表現(xiàn)上差異不大,說明學生群體的作用有限,此外3月份開學后,我們發(fā)現(xiàn)新登用戶的增長空間有限,因此可以證明剛才所說的結論,對于這一點的證明,可以參看百度指數(shù),側面能夠驗證是否說得準確。
對于啟動次數(shù)來看,出現(xiàn)了三個拐點,分別是,元旦、除夕夜、2月中旬。總的來說,節(jié)日期間手機的使用頻率會增加,相應的會刺激手機應用啟動,但是仔細觀察發(fā)現(xiàn),以除夕(1月22日)為節(jié)點,之后數(shù)據(jù)整體表現(xiàn)開始下滑,并開始加速,從某方面來看,說明學生客群不是非常多,因為開學后,啟動次數(shù)并沒有出現(xiàn)預測中的反彈,此外也要考慮根PLC有一定的關系,這也是觀察的重點,因為我們看到DAU整體的水平也是下降。
從新增用戶的變化趨勢來看,android market 依然是主要的渠道,從2月份后,進入一個相對穩(wěn)定波動的時期,過年期間,表現(xiàn)低迷,這是一種正?,F(xiàn)象,如之前所分析的情況,學生客群比例相對少,白領在過年休假結束后,數(shù)據(jù)上會出現(xiàn)反彈,并保持一個相對穩(wěn)定的波動,2月6日出現(xiàn)一個小高峰,原因在于該日為元宵節(jié),月末開學后,學生群逐漸涌入,在3月初拉起小高峰后,數(shù)據(jù)表現(xiàn)基本和2月份持平,學生群體帶動效果不明顯。
而刨除android market再看,來自于其他渠道的用戶很多,說明用戶選擇渠道相對寬泛,而且學生群體在這一方面的表現(xiàn)先對積極一些,整體來看,其他渠道新增用戶變化在一個合理的范圍內(nèi),在2月份效果好于春節(jié)假期和年前,可以從某一方面猜測,年后時間相對寬松,用戶選擇下載并成為用戶的渠道多樣化起來。
1018版本和1084版本變化差異比較大,尤其是在月末開學階段,1018版本對于學生用戶來說比較受歡迎,相比較假期而言,提升幅度比較大,然而1084版本在開學后卻處于開始大幅下降的階段,版本差異需要進一步查詢原因才能核實。此外年前,兩個版本的投放出去后,出現(xiàn)的異常情況比較多,這些異常信息需要引起注意,并結合版本的設置,研發(fā)情況,進行記錄和分析。
以上為今天說的內(nèi)容,說到底就是要把握數(shù)據(jù)分析中的參照和標準,同時還要仔細周到的考慮可能會涉及的一些影響因素,單一的數(shù)據(jù)分析是不能解決一些深層次的問題,我記得之前有人問我,怎么從數(shù)據(jù)分析中能把握客群,分析客群.今天就從數(shù)據(jù)分析中得到這些內(nèi)容,今天就到這里,明天會把質(zhì)量控制的內(nèi)容寫一寫,把一些問題回復一下,就到這里啦。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10