
網(wǎng)站數(shù)據(jù)分析:那些難以實現(xiàn)的細分_數(shù)據(jù)分析師
如果你從事網(wǎng)站分析相關(guān)工作,那么你一定用過或聽說過網(wǎng)站分析工具中的細分(Segment)功能。不得不說,用好Segment是一名合格的網(wǎng)站分析師必備的技能。關(guān)于Segment的重要性,恐怕無需我多言了,借用Sidney的一句話——“無細分,毋寧死!”
However,這次想跟大家分享的,是那些我認為難以實現(xiàn)的細分。這里需要強調(diào)下,只是“我認為”,并未向任何官方證實我的這些想法,因此請大家盡管質(zhì)疑,盡管拍磚。
在用具體的案例來說明問題之前,先簡單回顧下細分是如何工作的,下面引用一段Omniture官方文檔中的內(nèi)容,
Segmentation works by scanning through every single hit within the time period selected, checking to see if that image request matches your segmentation rules.
1. If it matches, then that hit will be part of your segment (along with additional data depending on the bucket)
2. If it does not match, the image request is thrown away and treated as if it didn’t exist in the context of the specific report you are viewing
這里要注意下,雖然平時如果你說“把Search Engine按Keyword細分”,大家都明白你的意思,但實際上,很可能潛移默化地就把多維度關(guān)聯(lián)和細分兩者的概念混淆了。
好了,廢話不多說,直接進入正題。
在同一個會話(Session)中,用戶可能對Page A產(chǎn)生了X個Page View(s),那么,是否可以通過細分,得到可以滿足下表的數(shù)據(jù)?
Page Views of Page A | Visits |
0(未查看過Page A的訪問) | |
1(查看過Page A 1次的訪問) | |
2(查看過Page A 2次的訪問) | |
… | |
X(查看過Page A X次的訪問) |
我們先嘗試第一項,0 Page Views of Page A(未查看過Page A的訪問),
很容易地,我們給出了細分規(guī)則,即在所有的數(shù)據(jù)中篩選出排除了訪問中訪問過Page A的訪問(似乎稍有拗口,在用文字表達細分規(guī)則的時候我總感覺很吃力,語言難以規(guī)范,請見諒了)。也就是說,如果某次訪問中包含了Page = Page A的hit,那么,這次訪問將不在細分后的數(shù)據(jù)集中。
事實上,得到這個數(shù)據(jù)如果不通過細分來實現(xiàn),也是非常容易,用Total Visits – Visits of Page A,得到的結(jié)果便是完全沒有訪問過Page A的Visits了。
細分后,我們來看看Page A的數(shù)據(jù)情況,順便驗證下細分是否正確,
(圖片已經(jīng)PS處理,數(shù)據(jù)為模擬數(shù)據(jù))
如上圖所示,細分后得到的Total Visits 是9,310,750,而未細分的話,得到的Total Visits是10,041,929,兩者之差正好是未細分時Page A的Visits 731,179,因此,細分成功。
順便提一下,不要試圖用下面的規(guī)則來得到這個數(shù)據(jù),也不要試圖把Visit Container修改成Page View Container,想一想為什么吧,我就先不多說了。
接著,我們繼續(xù)嘗試第二項任務(wù),即細分出“看且僅看了Page A 1次的訪問”。
我們可能試圖用以下規(guī)則來實現(xiàn),
乍一看,還真像那么回事,我們先直接看看結(jié)果如何,
(圖片已經(jīng)PS處理,數(shù)據(jù)為模擬數(shù)據(jù))
有沒有發(fā)現(xiàn),我們所期望的“看且僅看了Page A 1次的訪問”,其結(jié)果竟然與Page A Single Page Visits(訪問且僅訪問了Page A的訪問數(shù)量)相同,這說明我們的規(guī)則:Page Views equals 1,作用于整個visit,限定了符合規(guī)則的訪問必須僅包含1個Page View,而并非如我們所愿,用于限定Page A的Page Views為1 。
到這里,我想實驗可以結(jié)束了,之后的任務(wù)也同樣無法完成了。由于近兩年較少使用GA,因此我并不確定GA中是否可以實現(xiàn)這樣的細分,但是對于Omniture,我有至少99%的Confidence說這個細分是無法實現(xiàn)的(經(jīng)過針對性的部署的除外)。
還沒完,來試試總結(jié)出一個更具普遍性的結(jié)論:我們可以細分出某個特定變量發(fā)生過特定次數(shù)的訪問/訪客,但無法細分出某個特定變量的某個特定值發(fā)生過特定次數(shù)的訪問/訪客。
用這個結(jié)論來解釋這個案例的話,那就是我們可以細分出Page變量發(fā)生過X次(Page Views = X)的訪問,但無法細分出Page變量的值為A且發(fā)生過X次Page=A的訪問。
這個案例就到這里結(jié)束了,如果你有任何不同意見,請盡管拍磚,我雖然很堅信這個細分確實無法實現(xiàn),但我更希望我的想法是錯誤的。文章來源:CDA數(shù)據(jù)分析師培訓官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11