
數(shù)據(jù)分析-時間序列的趨勢分析
無論是網(wǎng)站分析工具、BI報表或者數(shù)據(jù)的報告,我們很難看到數(shù)據(jù)以孤立的點單獨地出現(xiàn),通常數(shù)據(jù)是以序列、分組等形式存在,理由其實很簡單,我們沒法從單一的數(shù)據(jù)中發(fā)現(xiàn)什么,用于分析的數(shù)據(jù)必須包含上下文(Context)。數(shù)據(jù)的上下文就像為每個指標設定了一個或者一些參考系,通過這些參照和比較的過程來分析數(shù)據(jù)的優(yōu)劣,就像中學物理上的例子,如果我們不以地面作為參照物,我們無法區(qū)分火車是靜止的還是行進的,朝北開還是朝南開。
在實際看數(shù)據(jù)中,我們可能已經(jīng)在不經(jīng)意間使用數(shù)據(jù)的上下文了,趨勢分析、比例分析、細分與分布等都是我們在為數(shù)據(jù)設置合適的參照環(huán)境。所以這邊通過一個專題——數(shù)據(jù)的上下文,來總結和整理我們在日常的數(shù)據(jù)分析中可以使用的數(shù)據(jù)參考系,前面幾篇主要是基于內部基準線(Internal Benchmark)的制定的,后面會涉及外部基準線(External Benchmark)的制定。今天這篇是第一篇,主要介紹基于時間序列的趨勢分析,重提下同比和環(huán)比,之前在網(wǎng)站新老用戶分析這篇文章,已經(jīng)使用同比和環(huán)比舉過簡單應用的例子。
定義這個東西在這里還是再嘮叨幾句,因為不了解定義就無法應用,熟悉的朋友可以跳過。
同比:為了消除數(shù)據(jù)周期性波動的影響,將本周期內的數(shù)據(jù)與之前周期中相同時間點的數(shù)據(jù)進行比較。早期的應用是銷售業(yè)等受季節(jié)等影響較嚴重,為了消除趨勢分析中季節(jié)性的影響,引入了同比的概念,所以較多地就是當年的季度數(shù)據(jù)或者月數(shù)據(jù)與上一年度同期的比較,計算同比增長率。
環(huán)比:反應的是數(shù)據(jù)連續(xù)變化的趨勢,將本期的數(shù)據(jù)與上一周期的數(shù)據(jù)進行對比。最常見的是這個月的數(shù)據(jù)與上個月數(shù)據(jù)的比較,計算環(huán)比增長率,因為數(shù)據(jù)都是與之前最近一個周期的數(shù)據(jù)比較,所以是用于觀察數(shù)據(jù)持續(xù)變化的情況。
買二送一,再贈送一個概念——定基比(其實是百度百科里附帶的 ):將所有的數(shù)據(jù)都與某個基準線的數(shù)據(jù)進行對比。通常這個基準線是公司或者產(chǎn)品發(fā)展的一個里程碑或者重要數(shù)據(jù)點,將之后的數(shù)據(jù)與這個基準線進行比較,從而反映公司在跨越這個重要的是基點后的發(fā)展狀況。
其實同比、環(huán)比沒有嚴格的適用范圍或者針對性的應用,一切需要分析在時間序列上的變化情況的數(shù)據(jù)或者指標都可以使用同比和環(huán)比。
但是我的建議是為網(wǎng)站的目標指標建立同比和環(huán)比的數(shù)據(jù)上下文,如網(wǎng)站的收益、網(wǎng)站的活躍用戶數(shù)、網(wǎng)站的關鍵動作數(shù)等,這類指標需要明確長期的增長趨勢,同比和環(huán)比能夠為網(wǎng)站整體運營的發(fā)展狀況提供有力的參考。
還有個建議就是不要被同比和環(huán)比最原始或者最普遍的應用所束縛?。和染褪墙衲昝總€月或每季度的數(shù)據(jù)與去年同期比,環(huán)比就是這個月的數(shù)據(jù)與上個月比。對于方法的應用需要根據(jù)實際的應用的環(huán)境,進行合理的變通,選擇最合適的途徑。所以同比和環(huán)比不一定以年為周期,也不一定是每月、季度為時間粒度的統(tǒng)計數(shù)據(jù),我們可以根據(jù)需要選擇任意合適的周期,比如你們公司的產(chǎn)品運營是以周、半月、甚至每年的特定幾個月為周期循環(huán)變動,那完全可以將這些作為同比的周期。
特別對于互聯(lián)網(wǎng)這個瞬息萬變的環(huán)境,常用的年與年之間的同比,以季度或月為粒度的統(tǒng)計可能不再合適,為了適應快速的變化,以月為周期、周為周期的同比,以天為粒度、小時為粒度的統(tǒng)計數(shù)據(jù)進行環(huán)比將變成常見的方式,因為要適應這種快速的變化,我們需要做出更迅速的決策和調整,當然數(shù)據(jù)要適應這種快速決策的需要。
同比和環(huán)比被廣泛地應用于各個領域,在Google的圖片中搜索同比和環(huán)比會有豐富的包含了同比環(huán)比的圖表顯示在你的眼前,所以這里只舉個簡單的例子:因為很多的互聯(lián)網(wǎng)產(chǎn)品的數(shù)據(jù)變化情況會以“周”為周期進行波動(周末會出現(xiàn)明顯的上升或者下降趨勢),所以這里以一周的數(shù)據(jù)為例來看下同比和環(huán)比的展現(xiàn)效果。還是虛擬數(shù)據(jù),為了展示上的需要而臨時設定的:
周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 | |
上周收益 | 113 | 134 | 123 | 145 | 137 | 196 | 187 |
本周收益 | 129 | 122 | 134 | 149 | 146 | 215 | 208 |
同比增長 | 12.40% | -9.84% | 8.21% | 2.68% | 6.16% | 8.84% | 10.10% |
環(huán)比增長 | -44.96% | -5.74% | 8.96% | 10.07% | -2.05% | 32.09% | -3.37% |
從圖中可以看出數(shù)據(jù)在一周中的變化趨勢,周中和周末之間存在明顯的差異,周末的收益會有明顯的上漲,在使用同比的時候需要抓到這類數(shù)據(jù)的周期性的變化規(guī)律,讓數(shù)據(jù)的對比能夠更加有效地反映數(shù)據(jù)的變化。同時在Excel里面可以直接為一組基于時間序列的數(shù)據(jù)繪制趨勢線,正如圖中的虛線所示,本周收益在一周中的變化趨勢就顯得非常明顯,這里用的是指數(shù)的擬合,Excel的趨勢線提供了線性、指數(shù)、對數(shù)、冪等回歸分析的方式,同時也包含多項式和移動平均等趨勢分析的方法。
最后看看我們經(jīng)常在使用的網(wǎng)站分析工具里面有沒有同比和環(huán)比的功能呢?這里以Google Analytics和百度統(tǒng)計為例截了兩張圖,首先看下百度統(tǒng)計登錄進去后的網(wǎng)站概況:
百度統(tǒng)計默認就為我們提供了一個比較環(huán)境,上方表格中是今天與昨天的數(shù)據(jù)對比及變化情況,還提供了預測的功能;下方的折線圖顯示的是每小時數(shù)據(jù)的變化,提供前一天或者上周的同一天(百度可能已經(jīng)意識到網(wǎng)站大部分會存在以周為變化周期的趨勢,所以很多地方都提供了以周為單位的參考數(shù)據(jù))的每個整點的數(shù)據(jù)對照,同時可以選擇不同的時間區(qū)間和各類指標。再看看Google Analytics的Dashboard:
Google不像百度那樣一進去就能看到對照數(shù)據(jù),需要我們手工去選擇,在時間區(qū)間的選擇界面提供了“Compare to Past”的勾選按鈕,如果默認是近一個月的數(shù)據(jù),那么參照數(shù)據(jù)就是再往前推一個月的每日變化數(shù)據(jù),Timeline的選擇面板做得非常炫,可以自定義地選擇任何有效的時間區(qū)間,當然也同樣提供不同的參考指標,鼠標移到圖中相應日期的點后會顯示具體的數(shù)據(jù)及差異的大小。
同比和環(huán)比是最簡單直觀的基于時間序列的趨勢分析方法,通過觀察關鍵指標的變化情況來洞察網(wǎng)站的發(fā)展和運營情況,同時衡量目標的實現(xiàn)程度。所以這篇文章的主題是使用趨勢分析的方法來為網(wǎng)站的目標設定數(shù)據(jù)的上下文,下一篇將主要針對KPI指標進行數(shù)據(jù)上下文的選擇和設定。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10