
數(shù)據(jù)分析在應(yīng)用場景下究竟可以做什么?
數(shù)據(jù)分析在基本應(yīng)用場景下,我們現(xiàn)在能用數(shù)據(jù)干些什么呢?基于我在 eBay 和 Linkedin 工作的幾年,做了很多數(shù)據(jù)分析的場景,跟大家分享一下。
第一“數(shù)據(jù)分析師”可以用數(shù)據(jù)獲取用戶,今天上午我們有客戶也談到市場營銷 SEM 的解決方案,采用了 GrowingIO 的軟件和分析解決方案,大概在兩個星期就實現(xiàn)了市場營銷的分析。
第二個產(chǎn)品的互動,就是指當用戶登陸網(wǎng)站使用產(chǎn)品的時候,用戶用的是不是很爽,很流暢,很簡單。我們可以通過數(shù)據(jù)分析來優(yōu)化產(chǎn)品體驗。
第三個付費轉(zhuǎn)化,一開始很多網(wǎng)站會吸引用戶免費使用產(chǎn)品,我們?nèi)绾文軌蚩s短時間,快速把免費用戶轉(zhuǎn)化成為付費用戶,這個周期可長可短。
第四個是客戶留存,客戶變成我們的客戶之后,能夠持續(xù)的使用,不要流失。因為我們發(fā)現(xiàn)獲取新用戶的成本比挽留一個老用戶的成本要高。
我把這四個點簡單概括成幾個字。第一是拉新,找到新用戶。第二是盤活,我們有產(chǎn)品,希望用戶的使用非常地活躍。第三是轉(zhuǎn)化,希望從免費變成付費。第四是留存,不希望這個客戶/用戶流失。
一、拉新
作為大數(shù)據(jù)的解決方案來說,是能夠發(fā)現(xiàn)所有線上的入口。我們需要跟蹤市場營銷的每一個渠道,在每個渠道投入多少資源,回報是怎樣的。我們要跟蹤用戶在哪個渠道,哪個購買入口,在哪一個點,成功的轉(zhuǎn)化。也就是計算渠道的效率是什么樣的,衡量每個渠道的轉(zhuǎn)化率,資源投放是多少。
客戶的區(qū)隔。主要是在做市場營銷的時候希望能夠降低營銷成本,能夠把不同的客戶區(qū)分出來,在區(qū)分客戶之后,用不同的打法去給客戶做一些市場營銷的手段。比如說是有郵件的方式,有社交網(wǎng)絡(luò)推送的方式等等,還是說要找銷售直接去跟客戶聊。
最重要要有一個 ROI 工具。ROI 算法就是你要能夠清楚的計算出來,這個市場營銷的投入和產(chǎn)出到底是多少。
這里有兩個層次,第一個層次,你作為企業(yè),你去做市場營銷,你要知道你自己的 ROI。第二個層次,你企業(yè)平臺上還有你服務(wù)那些客戶的 ROI,你能不能算出來。就是你的這些客戶在使用你提供的產(chǎn)品,如何能夠證明說,你的客戶在使用了在你的平臺軟件和服務(wù)之后,在為客戶創(chuàng)造價值,創(chuàng)造了多少價值。
簡單講一個 Linkedin 的例子。用戶在 Linkedin 上搜索企業(yè)信息或者申請職位,或者他跟隨一個公司,或者說他的簡歷被搜索了一次,這些主動的,被動的,公司與個人,個人與個人的交互,總共大概是 300 億的級別,網(wǎng)站上 3 億多用戶之間的所有交互。
我們做了一個大數(shù)據(jù)分析,然后我們能夠把這個 ROI 算出來,從而我們計算出來一個叫做企業(yè)雇主品牌指標,這個指標可以衡量企業(yè)對于全球所有的人才的吸引指數(shù)是多少,這是有一個全球的排名,會非常有意思。中國的一些企業(yè)想在走國際化道路,希望提高企業(yè)品牌在全球的影響,這個指標特別能幫助中國企業(yè)吸引國際化人才。
二、盤活
產(chǎn)品,最重要是讓用戶在你網(wǎng)站上使用非常流暢。怎么樣說流暢不流暢,我們需要知道用戶,在你網(wǎng)站中或者在你的移動應(yīng)用當中,它的每一個操作,它的每一次交互,都有一條記錄在那里,就是我之前說的時間、地點、人物、內(nèi)容和交互方法。
再說一下用戶畫像,比如用戶的性別、年齡、收入等等,但這些是用戶的基本畫像。還有一些更深層次的,比如說用戶的行為,他最近一段時間登陸了我們網(wǎng)站多少次,使用了我們的移動應(yīng)用多少次,它最近這段時間購買了多少商品,或者他在您的移動 APP/網(wǎng)站中搜索了多少次,這些都是用戶自發(fā)的行為,他主動的行為。
美國有一家做視頻播放的網(wǎng)站 Netflix,他們在一段時間內(nèi),有兩種盈利方式一個是租 DVD,一種方式是線上的視頻播放,他們把 DVD 業(yè)務(wù)全部砍掉,因為這部分很難掌握用戶觀看視頻的行為,而且用戶行為是不會欺騙你的,比如說用戶注冊的時候,有個選項讓用戶輸入喜好的影片類型,比如動作、恐怖、科幻、動畫,當你開始寫的這些東西并不是符合你的用戶行為,真正行為還是在海量數(shù)據(jù)當中,海量的歷史記錄當中把它提煉出來,才會知道你這個用戶真正的傾向性和喜好是什么,然后大數(shù)據(jù)才會正確的給您推送你喜歡的內(nèi)容。
比如說國內(nèi)非常著名的媒體公司“今日頭條”,他們在推送方面就做得非常好。
核心 KPI,我們?nèi)绻軌蛄私饪蛻羲行袨橹?,可以快速制定這些核心 KPI,能夠知道我們企業(yè)的健康度。
我們之前在沒有大數(shù)據(jù)處理技術(shù)能力的情況下,我們經(jīng)常做的是,采樣,或者拿小部分數(shù)據(jù)先算一下。但當這個數(shù)據(jù)量非常大的時候,比如說 Linkedin 全球有 3 億多用戶,這 3 億多用戶,我們想做用戶級別的歸類。我看了用戶簡歷,想知道這個人是不是銷售,這個人是不是 HR,就是你很難通過簡單的方法來定論,那么我們就需要去做大數(shù)據(jù)模型。
之后我們就會有一些發(fā)現(xiàn),我們之前的假設(shè)和我們最后的發(fā)現(xiàn)會非常有意思,你可以找到非常多的你意想不到的洞察(insights)。比如說我們在判別一個用戶的簡歷,最后發(fā)現(xiàn)只要有這個關(guān)鍵字,他就一定是銷售,這也是我們意外收獲,這個關(guān)鍵字是一家加拿大銷售公司培訓(xùn)的名稱,只要有這個關(guān)鍵字,這個人是銷售的概率就非常高,所以假設(shè)檢驗在大數(shù)據(jù)技術(shù)力的推動下,能夠發(fā)現(xiàn)你以前未知的那些數(shù)據(jù)。
三、轉(zhuǎn)化
再講講銷售,首先我覺得這五個步驟不僅僅適用于對企業(yè)的銷售,像包括建立網(wǎng)站和社區(qū),我們都需要把用戶不斷的轉(zhuǎn)化。
首先,最重要的一點,就是我們有那么多潛在的客戶,哪個客戶使最重要的,這點可以通過它在網(wǎng)站,APP 上蛛絲馬跡的行為進行判斷。還有一個,以前在公司里需要派哪個客戶去跟雅或者亞馬遜接觸。下面還需要通過數(shù)據(jù)理解這個公司誰是決策人。再接著需要通過內(nèi)部網(wǎng)絡(luò)社交關(guān)系,哪個人認識決策者,能讓他買我們的產(chǎn)品。
最后是如何用數(shù)據(jù)講一個真實的故事讓客戶有更高的信息來采購我們的產(chǎn)品。
這五個步驟全部可以用數(shù)據(jù)驅(qū)動,而且驅(qū)動的速度是以前別人認為可能需要兩個星期,三個星期的決策周期,今天我們可以用在一分鐘之內(nèi)就可以實現(xiàn),這就是數(shù)據(jù)科學(xué),技術(shù)力給我們帶來的價值。
四、留存
如何促進用戶留存?實際上客戶的留存通過他的很多微妙的行為,跟我們講的很多的很好的故事。
我們以前做了很多這樣的模型,后來發(fā)現(xiàn)真正流失的用戶在非常早期就已經(jīng)釋放這種信號。因為用戶有幾個生命周期,整個流程有生命周期的,往往用戶在早期很微妙的行為的加權(quán),就能知道這個客戶會在未來哪個時間點會流失。
這是我們"數(shù)據(jù)分析師"兩三年來做用戶的模型,慢慢的把留存的模型的時間線不斷的往前提前,最早預(yù)算用戶流失的時候,立刻發(fā)信息。后來發(fā)現(xiàn)用戶使用好的時候問他怎么用,這樣留存率提高了 10%。還有在教育的時候是不是要對客戶進行培訓(xùn),各種引導(dǎo)、輔助,后來發(fā)現(xiàn)客戶的留存度增加了非常非常多。LinkedIn 財報中寫到,大概從 50% 流失率降到 20% 的流失率。這些都是數(shù)據(jù)和運營相結(jié)合的一個很好的過程。
大家想想我們以前工作很長時間,只能體現(xiàn)產(chǎn)品 10% 的價值,90% 的時間都浪費在數(shù)據(jù)采集,數(shù)據(jù)整合,數(shù)據(jù)清洗上面了。
今天公司很多人能做到數(shù)據(jù)決策,能做到這點就需要我們用先進的工具技術(shù),分析理念,結(jié)合先進的業(yè)務(wù)的方法論,把下面的時間盡量的做到全自動化。大家想想我們節(jié)省了 90% 的時間,如果能把這部精力用在金字塔尖上的話,我們將產(chǎn)出更多的效益。
實際上在我以前的工作經(jīng)驗里看到,當我們用新興的技術(shù)把底部做小,或者用新型的工具、產(chǎn)品把底部的工作做到多快好省,這會給企業(yè)提供高價值。孫子兵法有一句話,叫廟算勝者,得算多也,廟算不勝者,得算少也,多算勝,少算不勝。就是不去做數(shù)據(jù)分析,不去做決策,是很難在這種高密度競爭環(huán)境下生存。
所以我們"數(shù)據(jù)分析師"一定要想辦法把數(shù)據(jù)分析做到全自動化。這就是我們今天的發(fā)展方向。
在美國數(shù)據(jù)決策可能起步早一點,很早就開始注重數(shù)據(jù)分析。那么在中國很多企業(yè),特別像 BAT,這種大型的互聯(lián)網(wǎng)公司,他們在數(shù)據(jù)分析上已經(jīng)起步很早了。
整個數(shù)據(jù)分析,其實是金字塔框架。最下層是我們的用戶,然后我們有市場,有產(chǎn)品,有銷售,我們需要通過一定的方法把這些數(shù)據(jù)收集上來,然后對數(shù)據(jù)做數(shù)據(jù)平臺,可能是技術(shù)團隊做了大數(shù)據(jù)的。在這之上,我們?nèi)プ鲆恍n}的分析,比如說銷售的分析,市場的分析,產(chǎn)品的分析,運維的分析等等,商業(yè)智能是做一些報表跟蹤,再之上是深度分析、商業(yè)洞察、決策和行動。
整個這一套數(shù)據(jù)分析團隊和架構(gòu),大部分企業(yè)花了很多的人力物力去解決下面金字塔的底部,因為數(shù)據(jù)的埋點、整合、清理需要大量的人力。
如何能把大數(shù)據(jù)分析自動化,能把大數(shù)據(jù)變成小數(shù)據(jù),能把非常慢的數(shù)據(jù)的處理,變成非??斓臄?shù)據(jù)處理,能夠把非常麻煩的這些非結(jié)構(gòu)化的數(shù)據(jù),看不懂的數(shù)據(jù)結(jié)構(gòu)化,自動的做好這 90% 的工作。
讓我們企業(yè)內(nèi)部懂業(yè)務(wù)的那些人:產(chǎn)品經(jīng)理,業(yè)務(wù)端的人,他們在第一線接觸客戶,接觸產(chǎn)品,他們最想知道企業(yè)業(yè)務(wù)的健康程度或者企業(yè)的主要問題在哪里,我們可以能夠解放他們,讓他們直接看到數(shù)據(jù)并分析這些數(shù)據(jù),這就是 GrowingIO 所做的工作。數(shù)據(jù)分析師培訓(xùn)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10