
數(shù)據(jù)分析入門(mén):初識(shí)數(shù)據(jù)埋點(diǎn)
計(jì)劃將實(shí)際工作中最高頻的與數(shù)據(jù)相關(guān)的一些工作經(jīng)驗(yàn)以及技巧與大家做一個(gè)交流溝通,初步計(jì)劃整體分6-8篇文章、每篇1-2周的頻率由外到里,由淺入深,并伴隨實(shí)際工作中案例系統(tǒng)性的分享。根據(jù)看官老爺?shù)姆磻?yīng)調(diào)整后面要寫(xiě)的內(nèi)容,以及更新文章的速度。
埋點(diǎn)概述
數(shù)據(jù)埋點(diǎn)是數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)運(yùn)營(yíng)以及數(shù)據(jù)分析師,基于業(yè)務(wù)需求(例如:CPC點(diǎn)擊付費(fèi)廣告中統(tǒng)計(jì)每一個(gè)廣告位的點(diǎn)擊次數(shù)),產(chǎn)品需求(例如:推薦系統(tǒng)中推薦商品的曝光次數(shù)以及點(diǎn)擊的人數(shù))對(duì)用戶(hù)行為的每一個(gè)事件對(duì)應(yīng)的位置進(jìn)行開(kāi)發(fā)埋點(diǎn),并通過(guò)SDK上報(bào)埋點(diǎn)的數(shù)據(jù)結(jié)果,記錄數(shù)據(jù)匯總后進(jìn)行分析,推動(dòng)產(chǎn)品優(yōu)化或指導(dǎo)運(yùn)營(yíng)。
埋點(diǎn)分析,是網(wǎng)站分析的一種常用的數(shù)據(jù)采集方法。數(shù)據(jù)埋點(diǎn)分為初級(jí)、中級(jí)、高級(jí)三種方式。數(shù)據(jù)埋點(diǎn)主流部署的方式有:
私有化部署(即部署在自己公司的服務(wù)器上,如果期望提高數(shù)據(jù)安全性,或者定制化的埋點(diǎn)方案較多,則適合私有部署,并開(kāi)發(fā)一套針對(duì)自己公司定制化的數(shù)據(jù)后臺(tái)查詢(xún)系統(tǒng)保證數(shù)據(jù)的安全性和精確性,缺點(diǎn)是成本較高)。
接入第三方服務(wù),比如國(guó)內(nèi)的某盟和國(guó)外的GA(Google Analytics)統(tǒng)計(jì),在以后的文章中會(huì)單獨(dú)介紹,此處不再展開(kāi)。(優(yōu)點(diǎn)是成本較低,部分基礎(chǔ)服務(wù)免費(fèi),缺點(diǎn)是:數(shù)據(jù)會(huì)存在不安全的風(fēng)險(xiǎn),另外一個(gè)就是只能進(jìn)行通用的簡(jiǎn)單分析,無(wú)法定制化埋點(diǎn)方案)
此處只展開(kāi)初級(jí):在產(chǎn)品、服務(wù)轉(zhuǎn)化關(guān)鍵點(diǎn)植入統(tǒng)計(jì)代碼,據(jù)其獨(dú)立ID確保數(shù)據(jù)采集不重復(fù)(如收藏按鈕點(diǎn)擊率);
主要的埋點(diǎn)事件分類(lèi):
點(diǎn)擊事件:
點(diǎn)擊事件,用戶(hù)點(diǎn)擊按鈕即算點(diǎn)擊事件,不管點(diǎn)擊后有無(wú)結(jié)果;如下圖紅框標(biāo)注所示,點(diǎn)擊一次記一次。
曝光事件:
成功打開(kāi)一次頁(yè)面記一次,刷新頁(yè)面一次記一次,加載下一頁(yè)新頁(yè),加載一次記一次。home鍵切換到后臺(tái)再進(jìn)入頁(yè)面,曝光事件不記;
頁(yè)面停留時(shí)間事件:
表示一個(gè)用戶(hù)在X頁(yè)面的停留時(shí)長(zhǎng)記為停留時(shí)長(zhǎng)。例如:小明9:00訪(fǎng)問(wèn)了X網(wǎng)站首頁(yè),此時(shí)分析工具則開(kāi)始為小明這個(gè)訪(fǎng)問(wèn)者記錄1個(gè)Session(會(huì)話(huà))。接著9:01小明又瀏覽了另外一個(gè)頁(yè)面列表頁(yè),然后離開(kāi)了網(wǎng)站(離開(kāi)網(wǎng)站可以是通過(guò)關(guān)閉瀏覽器,或在地址欄鍵入一個(gè)不同的網(wǎng)址,或是點(diǎn)擊了你網(wǎng)站上鏈接到其他網(wǎng)站的鏈接……)為了簡(jiǎn)單,我們把這個(gè)過(guò)程當(dāng)做一個(gè)Session。
則最終小明在首頁(yè)的頁(yè)面停留時(shí)間:
(Time on Page,簡(jiǎn)稱(chēng)Tp)Tp(首頁(yè)) = 9:01 – 9:00 = 1 分鐘
When?什么時(shí)間做?
產(chǎn)品經(jīng)理的需求來(lái)源眾多,可能來(lái)自一線(xiàn)市場(chǎng)人員,可能來(lái)自身旁油膩的領(lǐng)導(dǎo)??赡軄?lái)自用戶(hù)反饋的一條吐槽…無(wú)論需求來(lái)自哪里,首先要搞清楚的就是這個(gè)需求涉及的問(wèn)題:
在什么樣的場(chǎng)景下?
面向哪些目標(biāo)用戶(hù)?
解決了哪些問(wèn)題?
帶來(lái)了什么價(jià)值?
梳理清楚問(wèn)題后,拆分問(wèn)題:
哪些是主要問(wèn)題?
哪些是次要問(wèn)題?
重不重要?
緊不緊急?
將每個(gè)問(wèn)題拆解后下一步就是帶著PRD文檔找親愛(ài)的數(shù)據(jù)分析師童鞋與產(chǎn)品經(jīng)理汪一起溝通,解決以下問(wèn)題:
每個(gè)問(wèn)題應(yīng)該怎么量化?
量化指標(biāo)是什么?
怎么通過(guò)數(shù)據(jù)定義每個(gè)問(wèn)題以及整個(gè)需求的成功與否?
有哪些輔助指標(biāo)?
定義好數(shù)據(jù)指標(biāo)后,此時(shí)則需要數(shù)據(jù)產(chǎn)品或者數(shù)據(jù)分析師定義埋點(diǎn)。
How?怎么定義埋點(diǎn)?
無(wú)規(guī)則不成方圓,良好的定義規(guī)范可以幫助埋點(diǎn)相關(guān)人員更好的維護(hù),以及理解,極高的提升工作效率,降低推倒重來(lái)的風(fēng)險(xiǎn),基于此分享一份埋點(diǎn)的定義規(guī)范幫助各位看官老爺以后維護(hù)自己產(chǎn)品的埋點(diǎn)。
使用此規(guī)范后,本汪一人就可以維護(hù)一個(gè)APP版本(包含點(diǎn)擊事件、曝光事件、停留事件)累計(jì)1500多個(gè)埋點(diǎn),井然有序,完全不會(huì)亂。
(懷念那些加班維護(hù)埋點(diǎn)跑數(shù)的日日夜夜,讓我與看門(mén)大叔成了摯友,結(jié)下了深厚的友誼??瓤?,此處應(yīng)該有掌聲…)
埋點(diǎn)分類(lèi)概述:
首先從事件屬性這個(gè)維度上分為三份Excel(點(diǎn)擊事件表、曝光事件表、停留事件表)
其次每一個(gè)事件表中新建三份子表(Sheet),以點(diǎn)擊事件表為例拆分為:首頁(yè)事件集合、列表頁(yè)事件集合、詳情頁(yè)事件集合
每當(dāng)APP發(fā)布新版本時(shí),從上一個(gè)版本的埋點(diǎn)中做一份Copy,新版本中新增了哪些埋點(diǎn),刪除了哪些埋點(diǎn)?都用不同的顏色,或者時(shí)間標(biāo)記進(jìn)行標(biāo)注說(shuō)明。
真實(shí)環(huán)境中分類(lèi)更為復(fù)雜,僅以上面例子說(shuō)明分類(lèi)思路,各位看官老爺可以根據(jù)業(yè)務(wù)需求做針對(duì)自己產(chǎn)品更合適的分類(lèi)。
字段明細(xì):
功能字段:
用于說(shuō)明當(dāng)前埋點(diǎn)是在哪個(gè)頁(yè)面的哪個(gè)功能。例如:收藏功能,對(duì)應(yīng)功能字段名:自定義為我的收藏
中文名字段:
用于描述X功能模塊內(nèi)X位置,例如起名叫:收藏功能-文章收藏
事件類(lèi)型字段:
用于說(shuō)明當(dāng)前埋點(diǎn)是點(diǎn)擊事件還是曝光事件還是其他
事件ID字段:
如果是自己公司開(kāi)發(fā)的數(shù)據(jù)查詢(xún)系統(tǒng),則每一個(gè)埋點(diǎn)都對(duì)應(yīng)一個(gè)事件ID,上線(xiàn)后用于拿著事件ID去后臺(tái)取數(shù)使用。事件ID的命名規(guī)范:事件英文簡(jiǎn)寫(xiě)_哪一端的產(chǎn)品_產(chǎn)品名稱(chēng)簡(jiǎn)寫(xiě)_頁(yè)面名稱(chēng)_模塊名稱(chēng)_功能名稱(chēng)。
例如:點(diǎn)擊事件_APP端_二手車(chē)_個(gè)人中心_收藏_文章收藏 對(duì)應(yīng)事件ID== click_app_2sc_ Personal Center_ Collection_ Article Collection
如果是用的第三方統(tǒng)計(jì)工具:例如某盟,同理定義好事件ID,上線(xiàn)后去X盟后臺(tái),輸入事件ID查詢(xún)相應(yīng)的數(shù)據(jù)。
當(dāng)一個(gè)埋點(diǎn)對(duì)應(yīng)不同類(lèi)型的多種位置的埋點(diǎn)時(shí),則需要命名當(dāng)前埋點(diǎn)的key參數(shù)與value參數(shù),一個(gè)key可以對(duì)應(yīng)1個(gè)value或者多個(gè)value,但一個(gè)value不能對(duì)應(yīng)多個(gè)key.只能對(duì)應(yīng)唯一的一個(gè)key 例如:二手車(chē)信息網(wǎng)站有2個(gè)關(guān)鍵按鈕,一個(gè)是砍價(jià)按鈕,一個(gè)是撥打電話(huà)按鈕,但是在多個(gè)頻道中每個(gè)頻道都有多個(gè)砍價(jià)按鈕多個(gè)撥打電話(huà)按鈕,在這樣的場(chǎng)景下就可以設(shè)計(jì)2個(gè)KEY值:
key01=source用于標(biāo)記當(dāng)用戶(hù)點(diǎn)擊了一次按鈕后是在哪個(gè)頻道的頁(yè)面點(diǎn)擊的這個(gè)按鈕X value01=X1,value2=X2用于標(biāo)記不同位置同屬性的按鈕。
Key02=type用于標(biāo)記用戶(hù)是點(diǎn)的砍價(jià)還是點(diǎn)的撥打電話(huà)按鈕,例如:01value用于標(biāo)記砍價(jià)按鈕,02value對(duì)應(yīng)的撥打電話(huà)按鈕。
記錄規(guī)則字段:
定義什么情況下觸發(fā)埋點(diǎn),例如:在列表頁(yè)點(diǎn)擊一次記錄一次
備注:
用于描述當(dāng)前埋點(diǎn)什么時(shí)間新增?什么時(shí)間修改過(guò)?原因?什么時(shí)間被刪除?誰(shuí)刪除的?等信息記錄,此處好多看官可能以為寫(xiě)不寫(xiě)無(wú)所謂,但是為了信息的完整性和可追溯性最好每一次變動(dòng)都要備注。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線(xiàn)” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11