
網(wǎng)站數(shù)據(jù)分析實(shí)戰(zhàn)—用戶偏好分析_數(shù)據(jù)分析師
熟悉網(wǎng)站分析的朋友們都知道,GA(Google Analytics)中可以關(guān)聯(lián)不同的維度(Dimension),比如“城市”和“產(chǎn)品”,通過關(guān)聯(lián)(Sub-relation),我們可以得到不同城市下,各產(chǎn)品的相關(guān)數(shù)據(jù)。在Omniture的幾個(gè)網(wǎng)站分析工具中,也同樣能夠?qū)δ硞€(gè)eVar根據(jù)按另一個(gè)eVar來breakdown。
好了,廢話不多說,接下來就讓我們一起去發(fā)現(xiàn)一些有趣的事情!
Step 1. 獲取數(shù)據(jù)
1.a 請生成一張報(bào)表,
維度(Dimension):城市(Cities)
指標(biāo)(Metric):購買數(shù)量/銷量(Units)
時(shí)間段可根據(jù)需要設(shè)定,時(shí)間粒度(Granularity)在Omniture中選None/aggregate,表示把時(shí)間以聚合的方式展現(xiàn),而不是按daily、monthly等方式來劃分,GA中同理。
好了,我們得到了一張關(guān)于各個(gè)城市的訪客所產(chǎn)生的訂單數(shù)的報(bào)告,第三列Ratio是經(jīng)過計(jì)算得到的各城市訂單數(shù)占總體的比例。這里假定了只有圖表中所列出的10個(gè)城市,所有數(shù)據(jù)均為模擬數(shù)據(jù)。
1.b 類似上一張城市報(bào)告,我們再獲得一份產(chǎn)品類(Product Category)的報(bào)告,維度:Category, 指標(biāo):Units,獲得的報(bào)告如下
* 這里需要注意,你所看到的兩張表中的Units總量是一樣的,但如果你選擇了Orders作為Metric的話,那么品類報(bào)告中的Orders應(yīng)該會(huì)大一些,因?yàn)橛行┯脩舻膯蝹€(gè)訂單橫跨了不同的產(chǎn)品類。比如實(shí)際情況是你下了一個(gè)訂單,包含了一臺(tái)VAIO和一臺(tái)DSC,那么在產(chǎn)品類報(bào)告中這1個(gè)訂單會(huì)被分拆為2個(gè),各自歸屬到2個(gè)品類中。如果Orders總量相差不大,那不用太在意這個(gè)差異,如果你覺得差異讓你無法接受的話,那也不難,對城市報(bào)告中的數(shù)據(jù)做個(gè)簡單處理:處理后各城市訂單數(shù) = 處理前各城市訂單數(shù) * (產(chǎn)品類報(bào)告訂單總數(shù) / 處理前城市訂單總數(shù))。但是這樣的處理會(huì)稍許影響到后續(xù)介紹的計(jì)算過程,當(dāng)然,只要你保持頭腦清醒,相信在理解了算法后根據(jù)需要來修改也不是難事。
1.c 獲得一份Sub-relation的報(bào)告,第一個(gè)維度選擇城市,第二個(gè)維度選產(chǎn)品類,指標(biāo)仍然是Units,報(bào)表如下:
City Breakdown by Category
限于篇幅,圖中只顯示了Shanghai的數(shù)據(jù),實(shí)際應(yīng)該是所有其它城市都會(huì)得到跟Shanghai類似結(jié)構(gòu)的數(shù)據(jù)。由于本例中共有10個(gè)城市和10個(gè)產(chǎn)品類,因此得到的數(shù)據(jù)應(yīng)該是10*10=100行。同樣,這里的Units總量應(yīng)該與之前的相同。
從表中我們可以知道,在Shanghai所產(chǎn)生的962個(gè)Units中,VAIO占了378個(gè),DSC占了112個(gè),這個(gè)很容易理解。
Step 2. 數(shù)據(jù)處理
Difference
如上圖所示,我們在1.c報(bào)表的基礎(chǔ)上,新增一列Predicted Units,作為我們預(yù)測的商品銷量,怎么計(jì)算呢?Predicted Units = 1.a中Shanghai的 Units * 1.b中VAIO的Ratio(或者1.a中Shanghai 的 Ratio * 1.b中VAIO的Units也是一樣的)
然后我們再新增一列Difference,表示實(shí)際值與預(yù)測值的差異程度,計(jì)算方式為:
Difference = (Units – Predicted Units) / Predicted Units
Step 3. 數(shù)據(jù)解讀
不難理解,如果實(shí)際值大于預(yù)測值,Difference為正,反之為負(fù),實(shí)際值與預(yù)測值差異越大,Difference的絕對值越大。
既然需要的數(shù)據(jù)都有了,該怎么看我們用戶的偏好呢?如何去發(fā)現(xiàn)那些有價(jià)值的信息呢?
Difference 一列中,最抓人眼球(eye-catching)的顯然是Shanghai-DSC那行了,372%。這表示,Shanghai的用戶比我們想象中的更熱衷于DSC產(chǎn)品,而且是遠(yuǎn)遠(yuǎn)大于預(yù)期。同樣,VAIO、Tablet等產(chǎn)品在Shanghai用戶中的銷售情況也比我們的預(yù)期要好。而HIFI的-80%,MDR的-59%,說明了Shanghai的用戶對這些產(chǎn)品并不是非常感興趣。當(dāng)然,如果在做這個(gè)分析前,你已經(jīng)對你的某些產(chǎn)品做了定向投放,那么會(huì)一定程度上影響該報(bào)告的解讀,這時(shí)候,我的建議是:
1. case by case的來分析那些定向投放了的產(chǎn)品,需要綜合考慮你的投放情況及業(yè)務(wù)情況
2. 剔除那部分定向投放了的產(chǎn)品及密切相關(guān)的產(chǎn)品,從而解讀那些未受太大影響的產(chǎn)品數(shù)據(jù)。
到這里,如果在讀這篇文章的你正從事Online Marketing等相關(guān)的工作,不知道有沒有能夠觸動(dòng)到你的神經(jīng)呢?SEM、adwords等廣告投放平臺(tái)中的地理位置定位,能通過這個(gè)分析得到改進(jìn)嗎?花錢買的廣告,真的投放給那些感興趣的用戶了嗎?……
本文所謂的預(yù)測,并沒有基于什么很高級(jí)的算法,只是先假定了我們的所有用戶的偏好是一致的,基于這個(gè)假設(shè),兩個(gè)維度關(guān)聯(lián)后的情況應(yīng)當(dāng)與兩個(gè)維度獨(dú)立時(shí)所推斷的情況一致。還是舉個(gè)簡單的例子來說明吧。假定雙胞胎姐妹總共吃了4個(gè)水果,又知道水果中香蕉被吃了2個(gè),蘋果也被吃了2個(gè)。如果姐妹倆的偏好一致,我們可以認(rèn)為姐妹應(yīng)該各自吃了1個(gè)香蕉1個(gè)蘋果。然而真實(shí)的情況是姐姐吃了2兩個(gè)香蕉,妹妹吃了2兩個(gè)蘋果,也就是說,姐姐比我們所認(rèn)為的多吃了1個(gè)香蕉而少吃了1個(gè)蘋果,那么她的偏好應(yīng)該是愛吃香蕉而不愛吃蘋果。
當(dāng)然,這樣的預(yù)測方法由于少考慮了很多因素而并變得不是很精準(zhǔn),但筆者認(rèn)為,這不會(huì)是什么很大的問題。雖然我們的計(jì)算過程是定量的,但我們的目的只是定性而已,380%的Difference在這個(gè)方法中跟370%沒有什么太大的區(qū)別。而且,以損失一些精度為代價(jià),獲得更高的效率并非什么不可原諒的事,畢竟我們是在商場里作戰(zhàn),而不是在學(xué)校碼論文。
最后想說的是,本文所舉例子是不同城市用戶關(guān)于不同產(chǎn)品類的購買偏好分析,實(shí)際上,朋友們完全可以根據(jù)自己的業(yè)務(wù)需求來驅(qū)動(dòng)類似的分析,比如關(guān)聯(lián)用戶的操作系統(tǒng)(Operating System)和瀏覽器(Browser),指標(biāo)選擇訪問數(shù)(Visits),便能了解到你網(wǎng)站的用戶在不同操作平臺(tái)上更喜歡用哪種瀏覽器。
理論上來說,任意兩個(gè)維度都可以關(guān)聯(lián)起來,且能說明些問題,但不建議強(qiáng)行地去關(guān)聯(lián)兩個(gè)維度,然后絞盡腦汁地去賦予它某種意義,不要為了分析而分析。還是那句話,以業(yè)務(wù)需求來確定分析目標(biāo),再以分析結(jié)果來驅(qū)動(dòng)業(yè)務(wù)發(fā)展。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07