分析的最終目標(biāo)無非兩種:尋找解決方案,尋找更好的解決方案。第一步是保證數(shù)據(jù)的準(zhǔn)確性和穩(wěn)定性,第二步就是優(yōu)化,提高準(zhǔn)確性、提高效率和效益。優(yōu)化包含兩部分的內(nèi)容:縮小當(dāng)前和目標(biāo)的差距,直到達(dá)成并超越目標(biāo);在成本或者預(yù)算固定的前提下,使收益最大化。 1、縮小當(dāng)前和目標(biāo)的差距 e.g. 全公司各部門各業(yè)務(wù)線的同事們都在追逐和超越KPI的路上;e.g. 機(jī)器學(xué)習(xí)建模時,嘗試多種方案,調(diào)試各種參數(shù),使模型的精
劉思嬋
2020-08-29
5.2自下而上的組合 就是將個體組成群體,將小的指標(biāo)組合成一個綜合指標(biāo)。e.g. 用戶的標(biāo)簽分為基礎(chǔ)標(biāo)簽和復(fù)合標(biāo)簽,基礎(chǔ)標(biāo)簽就是單個用戶屬性來定義的(例如性別、婚否等),復(fù)合標(biāo)簽則是考慮多個基礎(chǔ)標(biāo)簽的組合(例如,某個典型的用戶群體畫像是:女性+單身+白領(lǐng)+一線城市);e.g. 規(guī)劃用戶標(biāo)簽時,先用頭腦風(fēng)暴想出一批指標(biāo),然后進(jìn)行歸類、篩選、組合;e.g. 風(fēng)控業(yè)務(wù)中累計壞賬計提的計算,是將不同的逾期
劉思嬋
2020-08-29
要有結(jié)構(gòu)化、系統(tǒng)化的思維,對影響因素自上而下的拆解和自下而上的組合。 5.1自上而下的拆解 可以理解為“分級鉆取”,如同金字塔結(jié)構(gòu)一樣,先從總體看到二級分支,然后再看更細(xì)的分支。e.g. 支付成功率的影響,可以對新老客、訂單來源、支付方式、銀行通道一層一層拆解,細(xì)化各個分支對整體變化的貢獻(xiàn)率; e.g. 銷售額 = 下單人數(shù)*客單價 (a)從登錄到下單是層層轉(zhuǎn)化后的,所以下單人數(shù) = 訪客人數(shù)
劉思嬋
2020-08-29
延時關(guān)聯(lián)現(xiàn)象的產(chǎn)生可能存在延遲效應(yīng),要考慮當(dāng)前現(xiàn)象(環(huán)節(jié))的前置的“因”和后置的“果”。e.g. 今天上線的營銷方案可能在幾天甚至幾十天后才會有顯著的效應(yīng),今天交易量上出現(xiàn)的波動也可能是因為一段時間前產(chǎn)品或者運(yùn)營策略上有改動。
劉思嬋
2020-08-29
看數(shù)據(jù)指標(biāo)不要只看一個“點(diǎn)”,還要看一條“線”上的前后連接的環(huán)節(jié),進(jìn)而從“面”或“體”的角度去看整個大環(huán)境中都有哪些因素相互作用。對現(xiàn)象的分析可以參考簡單的調(diào)節(jié)模型: 其中:X是自變量,Y是因變量,M是調(diào)節(jié)變量。尋找關(guān)聯(lián)關(guān)系時,不僅僅要找出對Y有直接影響的X(一個或者多個),還要找出影響X對Y作用的調(diào)節(jié)因素M。 關(guān)聯(lián)也可以分為同時關(guān)聯(lián)和延時關(guān)聯(lián)兩類。 4.1同時關(guān)聯(lián) 即多個因素(X)同時發(fā)生作用
劉思嬋
2020-08-29
縱向?qū)Ρ?橫向是和其他對象比較,縱向則是和自己的歷史數(shù)據(jù)對比。常見的縱向?qū)Ρ扔型群铜h(huán)比,對比的周期根據(jù)實際情況可以按日、周、月、季、年等。 注:一個常用的多組對比柱狀圖 對比的時候,除了比較相對量,也要看絕對量,以合理地評估數(shù)據(jù)差異的大小。e.g. 0.5%的波動是大還是小,需要找參考點(diǎn),如果歷史波動最高也就0.1%,那么這個波動就很大。e.g. 公眾號關(guān)注人數(shù)昨日環(huán)比增長20%(看著還不錯),
劉思嬋
2020-08-29
和同類(競品)比較,e.g. 對比不同品牌的女裝的銷售情況,不同銷售渠道(地區(qū))的交易情況;實驗對比,設(shè)置實驗組和對比組,對比兩組或多組之間的差異,以確定人為干預(yù)(實驗、方案)的效應(yīng)。e.g. 比較不同的產(chǎn)品或運(yùn)營方案的效果差異時,常采用AB Test,需要確保對比的兩組或者多組在數(shù)量和結(jié)構(gòu)上要具有可比性(e.g. 用戶的來源、等級等需要匹配);和整體比較,e.g. 華東地區(qū)的銷售情況和全國總體銷
劉思嬋
2020-08-29
“痛苦來自比較之中”(沒有比較就沒有傷害),其實幸福也來自比較之中,痛苦還是幸福,取決于選擇的參照點(diǎn)是高于還是低于你。對比就是找一個參照點(diǎn),來發(fā)現(xiàn)兩個數(shù)據(jù)間的差異量Δ大小如何。對比可以分為兩類:橫向?qū)Ρ?、縱向?qū)Ρ取?/p>
劉思嬋
2020-08-29
分類的規(guī)則大致有兩類:按主體分類,e.g. 按社會關(guān)系模型,用戶角色可以是父母、配偶、子女、朋友等;e.g. 按照群體劃分,可以分為一般情況和特殊情況、二八原則等;按屬性分類,依據(jù)主體(比如用戶)的屬性進(jìn)行類別劃分。e.g. 用戶畫像時可以考慮以下屬性:1. 社會屬性:收入水平、學(xué)歷、職業(yè)、婚姻情況等2. 位置屬性:居住地、工作地、從手機(jī)端還是PC端登錄等3. 生物屬性:年齡、性別、種族等4. 心
劉思嬋
2020-08-29
互聯(lián)網(wǎng)時代最核心的經(jīng)營理念是深耕客群,通過差異化運(yùn)營提升ARPU值(Average Revenue Per User,每用戶平均收入),而分類無疑是開展這項工作的重要前提。主要有4種分類方法:二分法,非此即彼,e.g. 網(wǎng)站新客、老客,貸款審批結(jié)果分為通過申請、拒絕申請等;并列分類,多個分類(子集)構(gòu)成一個全集,e.g. 用戶地域可以按省份劃分,按年齡可以將用戶分為70后、80后、90后、00后等
劉思嬋
2020-08-29
一般的閉環(huán)流程包括3部分:事前方案規(guī)劃,事中執(zhí)行監(jiān)控,事后復(fù)盤總結(jié)。e.g. 營銷活動事前:確定目標(biāo),選定用戶,制定方案,確定檢驗標(biāo)準(zhǔn)等;事中:實時數(shù)據(jù)監(jiān)控(是否達(dá)到預(yù)期),不同方案賽馬,備用方案啟用等;事后:對整個流程復(fù)盤,總結(jié)經(jīng)驗,CSS歸類(Continue做先前已驗證的正確的事,Stop做錯誤的事,Start做新的正確的事)常用的閉環(huán)迭代框架是PDCA,通過計劃(P)、實施(D)、檢查(C
劉思嬋
2020-08-29
分步轉(zhuǎn)化要連續(xù)完成多個步驟,有的人“淺嘗輒止”,有的人“半途而廢”,有的人則是“善始善終”。產(chǎn)品轉(zhuǎn)化的每個步驟都會有用戶流失,好比100個人參加有9個關(guān)卡的淘汰游戲,每個關(guān)卡會淘汰10個人,整個游戲最終會剩下10個獲勝者,把這個游戲看作產(chǎn)品,那么該產(chǎn)品的全流程轉(zhuǎn)化率就是10%(游戲獲勝率)。 e.g. 常見的電商流程如下:注冊-->登錄-->瀏覽商品-->加購物車-->支付-->售后將上述步驟整理
劉思嬋
2020-08-29
1. 商業(yè)理解:確定業(yè)務(wù)目標(biāo),評估現(xiàn)有資源,確定分析目標(biāo),制定解決方案;2. 數(shù)據(jù)理解:數(shù)據(jù)采集,探索分析,數(shù)據(jù)質(zhì)量驗證;3. 數(shù)據(jù)準(zhǔn)備:篩選數(shù)據(jù),數(shù)據(jù)清洗,整合數(shù)據(jù),變量衍生;4. 建立模型:模型選擇,檢驗設(shè)計,模型建立,結(jié)果評估;5. 模型評估:分析結(jié)果和業(yè)務(wù)目標(biāo)匹配度確認(rèn),檢查1-4步的執(zhí)行過程,確定下一步行動;6. 結(jié)果部署:規(guī)劃部署方案、監(jiān)控和維護(hù)方案,輸出項目報告,項目復(fù)盤;e.g.
劉思嬋
2020-08-29
e.g. 常見的數(shù)據(jù)分析路徑之一是SAS公司提出的SEMMA范式:1. Sample,數(shù)據(jù)抽樣,保證數(shù)據(jù)的效度和信度;效度是指數(shù)據(jù)的準(zhǔn)確性,也指選擇的數(shù)據(jù)和分析目標(biāo)及業(yè)務(wù)目標(biāo)是吻合的;信度是指數(shù)據(jù)的穩(wěn)定性,要保證樣本數(shù)據(jù)有代表性,且在一定周期內(nèi)不能有過大的波動(否則模型不穩(wěn)定);2. Explore,數(shù)據(jù)特征探索及預(yù)處理,e.g. 看數(shù)據(jù)的分布情況、對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化等;3. Modefy,明確問題
劉思嬋
2020-08-29
問題:銷售額下降,怎么辦?(問題太大,方法也多:優(yōu)化老客戶,提升流量,提升轉(zhuǎn)化率)答:了解涉及項目相關(guān)的所有業(yè)務(wù)部門的需求,邏輯,問題點(diǎn)拆分:銷售額=流量*轉(zhuǎn)化率*客單價待溝通部門:營銷部門(活動),推廣部門(流量),客服,售后,供應(yīng)鏈 a.營銷:精準(zhǔn)營銷(找到高價值客戶),客戶行為分析(響應(yīng)效果),組合營銷(購物籃) b.推廣:競價排名,買廣告位,點(diǎn)擊付費(fèi) c.退款和評論分析:優(yōu)化產(chǎn)品,優(yōu)
劉思嬋
2020-08-18
了解公司的背景和對接人員情況:公司的產(chǎn)品結(jié)構(gòu),市場環(huán)境,對接人的角色和權(quán)利等級溝通明確實際的項目需求(1)團(tuán)隊內(nèi)部理解的項目需求(2)和業(yè)務(wù)方溝通需求:從業(yè)務(wù)的角度理解需求可能的解決方案(3)優(yōu)化項目需求(4)核對項目需求 3. 確定分析工具和人員配置,進(jìn)行數(shù)據(jù)分析 4. 撰寫分析結(jié)論和方案
劉思嬋
2020-08-18
問題:流量急劇下降怎么分析?答:先看行業(yè)大盤,看看是不是全行業(yè)如此查看數(shù)據(jù)是否異常,如果大家數(shù)據(jù)都是來自于第三方,和同行交流看是否有同樣問題后臺分析是主推寶貝單個下滑,還是全店寶貝同步下滑(1)單個寶貝下滑:先查看評價和庫存,都沒有問題就繼續(xù)拆分,查看所有的流量入口a.單個入口下滑:針對這個入口補(bǔ)救,如果這個入口是搜索流量入口,查驗是否有強(qiáng)大的競爭對手b.所有入口下滑:拆分這個寶貝每一天的數(shù)據(jù)(收
劉思嬋
2020-08-18
基本思想首先二分-K均值是為了解決k-均值的用戶自定義輸入簇值k所延伸出來的自己判斷k數(shù)目,其基本思路是:為了得到k個簇,將所有點(diǎn)的集合分裂成兩個簇,從這些簇中選取一個繼續(xù)分裂,如此下去,直到產(chǎn)生k個簇。比如要分成5個組,第一次分裂產(chǎn)生2個組,然后從這2個組中選一個目標(biāo)函數(shù)產(chǎn)生的誤差比較大的,分裂這個組產(chǎn)生2個,這樣加上開始那1個就有3個組了,然后再從這3個組里選一個分裂,產(chǎn)生4個組,重復(fù)此過程,
劉思嬋
2020-08-12