
數(shù)據(jù)分析是指用適當(dāng)?shù)?a href='/map/tongjifenxi/' style='color:#000;font-size:inherit;'>統(tǒng)計(jì)分析對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。在實(shí)用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當(dāng)行動(dòng)。
數(shù)據(jù)分析的目的是把隱沒(méi)在一大批看來(lái)雜亂無(wú)章的數(shù)據(jù)中的信息集中、萃取和提煉出來(lái),以找出所研究對(duì)象的內(nèi)在規(guī)律。
在實(shí)用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當(dāng)行動(dòng)。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過(guò)程。在產(chǎn)品的整個(gè)壽命周期,包括從市場(chǎng)調(diào)研到售后服務(wù)和最終處置的各個(gè)過(guò)程都需要適當(dāng)運(yùn)用數(shù)據(jù)分析過(guò)程,以提升有效性。
在企業(yè)里面,數(shù)據(jù)分析可以幫助我們掌握企業(yè)的運(yùn)營(yíng)狀況,商品的出售情況,用戶的特征、產(chǎn)品的粘性、等等。
數(shù)據(jù)分析一定的帶著某種業(yè)務(wù)目的的。它可能是要追蹤一個(gè)新產(chǎn)品上線之后的用戶使用情況;也可能是觀察用戶在某段時(shí)間的留存情況,還有可能是運(yùn)營(yíng)某種優(yōu)惠券是否有效。
帶著一定的目的,確定要從哪幾個(gè)角度進(jìn)行分析。然后找到能夠說(shuō)明目的的指標(biāo)。
比如想要驗(yàn)證運(yùn)營(yíng)最近的一批優(yōu)惠券是否有效。我們可以從優(yōu)惠券的領(lǐng)取情況和優(yōu)惠券的使用情況兩個(gè)方面分析,而優(yōu)惠券的領(lǐng)取情況的指標(biāo)可以細(xì)化為領(lǐng)取率;使用情況可細(xì)化為:使用率、客單價(jià)等。
在確定了此次數(shù)據(jù)分析的核心指標(biāo)后,就要針對(duì)數(shù)據(jù)指標(biāo)做數(shù)據(jù)收集。
有些企業(yè)的數(shù)據(jù)準(zhǔn)備非常充分,數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市等早早就建設(shè)好。有一些企業(yè)在數(shù)據(jù)分析上比較落后,那就需要我們自己做前期大量的數(shù)據(jù)收集工作。
比如使用一些自己公司的或者第三方的數(shù)據(jù)分析工具進(jìn)行埋點(diǎn),拿到日志。或者使用數(shù)據(jù)庫(kù)中的現(xiàn)有數(shù)據(jù),比如訂單數(shù)據(jù)、基礎(chǔ)的用戶信息等等。
數(shù)據(jù)提取出來(lái)之后,要剔除臟數(shù)據(jù)(清洗),然后數(shù)據(jù)轉(zhuǎn)化。在進(jìn)行最基本的數(shù)據(jù)匯總、聚合之后,我們就可以拿到比較簡(jiǎn)單的字段相對(duì)豐富的數(shù)據(jù)寬表。
數(shù)據(jù)分析是用適當(dāng)?shù)姆治龇椒肮ぞ撸瑢?duì)處理過(guò)的數(shù)據(jù)進(jìn)行分析,提取有價(jià)值的信息,形成有效結(jié)論的過(guò)程。
一般公司所需要觀察的數(shù)據(jù)大致分為如下幾類(lèi):
商業(yè)數(shù)據(jù):付費(fèi)金額,付費(fèi)用戶數(shù),付費(fèi)率客單價(jià)
運(yùn)營(yíng)數(shù)據(jù):新增用戶數(shù),日活、周活、月活(AARRR模型)
產(chǎn)品數(shù)據(jù):關(guān)鍵頁(yè)面的pv、uv(漏斗模型)
用戶數(shù)據(jù):用戶生命周期、用戶留存、用戶客單價(jià)、用戶類(lèi)型(RFM模型…)
商品數(shù)據(jù):商品售賣(mài)情況,毛利分析….
隨著數(shù)據(jù)的重要性的凸顯,越來(lái)越多的公司已經(jīng)認(rèn)識(shí)到數(shù)據(jù)對(duì)于公司的經(jīng)營(yíng)是十分重要的。
所以絕大部分企業(yè)都有專(zhuān)門(mén)的BI部門(mén)進(jìn)行初步的數(shù)據(jù)加工、分析,以周報(bào)表的形式匯總給管理層做為日常數(shù)據(jù)所需以及企業(yè)決策使用。
在這里主要介紹兩個(gè)簡(jiǎn)單的數(shù)據(jù)分析模型:
Acquisition(獲取)、Activation(活躍)、Retention(留存)、Revenue(收益)、Refer(傳播)
如何獲取用戶?線上通過(guò)網(wǎng)站通過(guò)SEO,SEM,app通過(guò)市場(chǎng)首發(fā)、ASO等方式獲取。還有運(yùn)營(yíng)活動(dòng)的H5頁(yè)面,自媒體等方式。線下通過(guò)地推和傳單進(jìn)行獲取用戶。
來(lái)了用戶后,通過(guò)運(yùn)營(yíng)價(jià)格優(yōu)惠、編輯內(nèi)容等方式進(jìn)行提高活躍度。把內(nèi)容做多,商品做多,價(jià)格做到優(yōu)惠,但需要控制在成本至上的有生長(zhǎng)空間。這樣的用戶是最有價(jià)值進(jìn)行活躍。
產(chǎn)品策略上,除了提供運(yùn)營(yíng)模塊和內(nèi)容深化。進(jìn)行產(chǎn)品會(huì)員激勵(lì)機(jī)制成長(zhǎng)體制進(jìn)行活躍用戶。不僅商品優(yōu)惠的,VIP等標(biāo)示的ICON,對(duì)于長(zhǎng)業(yè)務(wù)流程,進(jìn)行流程激勵(lì)體制,產(chǎn)品策略更具多元化。
提高活躍度的,有了忠實(shí)的用戶,就開(kāi)始慢慢沉淀下來(lái)了。運(yùn)營(yíng)上,采用內(nèi)容,相互留言等社區(qū)用戶共建UCG,擺脫初期的PCG模式。電商通過(guò)商品質(zhì)量,O2O通過(guò)優(yōu)質(zhì)服務(wù)提高留存。這些都是業(yè)務(wù)層面的提高留存。
產(chǎn)品模式上,通過(guò)會(huì)員機(jī)制的簽到和獎(jiǎng)勵(lì)的機(jī)制去提高留存。包括app推送和短信激活方式都是激活用戶,提高留存的產(chǎn)品方式。
通過(guò)日留存率、周留存率、月留存率等指標(biāo)監(jiān)控應(yīng)用的用戶流失情況,并采取相應(yīng)的手段在用戶流失之前,激勵(lì)這些用戶繼續(xù)使用應(yīng)用。
獲取收入其實(shí)是應(yīng)用運(yùn)營(yíng)最核心的一塊。即使是免費(fèi)應(yīng)用,也應(yīng)該有其盈利的模式。
收入來(lái)源主要有三種:付費(fèi)應(yīng)用、應(yīng)用內(nèi)付費(fèi)、以及廣告。付費(fèi)應(yīng)用在國(guó)內(nèi)的接受程度很低,包括Google Play Store在中國(guó)也只推免費(fèi)應(yīng)用。在國(guó)內(nèi),廣告是大部分開(kāi)發(fā)者的收入來(lái)源,而應(yīng)用內(nèi)付費(fèi)目前在游戲行業(yè)應(yīng)用比較多。
前面所提的提高活躍度、提高留存率,對(duì)獲取收入來(lái)說(shuō),是必需的基礎(chǔ)。用戶基數(shù)大了,收入才有可能上量。
以前的運(yùn)營(yíng)模型到第四個(gè)層次就結(jié)束了,但是社交網(wǎng)絡(luò)的興起,使得運(yùn)營(yíng)增加了一個(gè)方面,就是基于社交網(wǎng)絡(luò)的病毒式傳播,這已經(jīng)成為獲取用戶的一個(gè)新途徑。這個(gè)方式的成本很低,而且效果有可能非常好;唯一的前提是產(chǎn)品自身要足夠好,有很好的口碑。
從自傳播到再次獲取新用戶,應(yīng)用運(yùn)營(yíng)形成了一個(gè)螺旋式上升的軌道。而那些優(yōu)秀的應(yīng)用就很好地利用了這個(gè)軌道,不斷擴(kuò)大自己的用戶群體。
漏斗模型廣泛應(yīng)用于流量監(jiān)控、產(chǎn)品目標(biāo)轉(zhuǎn)化等日常數(shù)據(jù)運(yùn)營(yíng)工作中。之所以稱(chēng)為漏斗,就是因?yàn)橛脩?或者流量)集中從某個(gè)功能點(diǎn)進(jìn)入(這是可以根據(jù)業(yè)務(wù)需求來(lái)自行設(shè)定的),可能會(huì)通過(guò)產(chǎn)品本身設(shè)定的流程完成操作。
按照流程操作的用戶進(jìn)行各個(gè)轉(zhuǎn)化層級(jí)上的監(jiān)控,尋找每個(gè)層級(jí)的可優(yōu)化點(diǎn);對(duì)沒(méi)有按照流程操作的用戶繪制他們的轉(zhuǎn)化路徑,找到可提升用戶體驗(yàn),縮短路徑的空間。
運(yùn)用漏斗模型比較典型的案例就是電商網(wǎng)站的轉(zhuǎn)化,用戶在選購(gòu)商品的時(shí)候必然會(huì)按照預(yù)先設(shè)計(jì)好的購(gòu)買(mǎi)流程進(jìn)行下單,最終完成支付。
需要注意的是:?jiǎn)我坏?a href='/map/loudoumoxing/' style='color:#000;font-size:inherit;'>漏斗模型對(duì)于分析來(lái)說(shuō)沒(méi)有任何意義,我們不能單從一個(gè)漏斗模型中評(píng)價(jià)網(wǎng)站某個(gè)關(guān)鍵流程中各步驟的轉(zhuǎn)化率的好壞,所以必須通過(guò)趨勢(shì)、比較和細(xì)分的方法對(duì)流程中各步驟的轉(zhuǎn)化率進(jìn)行分析:
趨勢(shì)(Trend):從時(shí)間軸的變化情況進(jìn)行分析,適用于對(duì)某一流程或其中某個(gè)步驟進(jìn)行改進(jìn)或優(yōu)化的效果監(jiān)控;
比較(Compare):通過(guò)比較類(lèi)似產(chǎn)品或服務(wù)間購(gòu)買(mǎi)或使用流程的轉(zhuǎn)化率,發(fā)現(xiàn)某些產(chǎn)品或應(yīng)用中存在的問(wèn)題;
細(xì)分(Segment):細(xì)分來(lái)源或不同的客戶類(lèi)型在轉(zhuǎn)化率上的表現(xiàn),發(fā)現(xiàn)一些高質(zhì)量的來(lái)源或客戶,通常用于分析網(wǎng)站的廣告或推廣的效果及ROI。
數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)視覺(jué)表現(xiàn)形式的科學(xué)技術(shù)研究。其中,這種數(shù)據(jù)的視覺(jué)表現(xiàn)形式被定義為,一種以某種概要形式抽提出來(lái)的信息,包括相應(yīng)信息單位的各種屬性和變量。
圖表是”數(shù)據(jù)可視化”的常用手段,其中又以基本圖表——柱狀圖、折線圖、餅圖等等——最為常用。
有人覺(jué)得,基本圖表太簡(jiǎn)單、太原始,不高端,不大氣,因此追求更復(fù)雜的圖表。但是,越簡(jiǎn)單的圖表,越容易理解,而快速易懂地理解數(shù)據(jù),不正是”數(shù)據(jù)可視化”的最重要目的和最高追求嗎?
所以,請(qǐng)不要小看這些基本圖表。因?yàn)橛脩糇钍煜に鼈?,所以只要是適用的場(chǎng)合,就應(yīng)該考慮優(yōu)先使用。
柱狀圖是最常見(jiàn)的圖表,也最容易解讀。
它的適用場(chǎng)合是二維數(shù)據(jù)集(每個(gè)數(shù)據(jù)點(diǎn)包括兩個(gè)值x和y),但只有一個(gè)維度需要比較。年銷(xiāo)售額就是二維數(shù)據(jù),”年份”和”銷(xiāo)售額”就是它的兩個(gè)維度,但只需要比較”銷(xiāo)售額”這一個(gè)維度。
柱狀圖利用柱子的高度,反映數(shù)據(jù)的差異。肉眼對(duì)高度差異很敏感,辨識(shí)效果非常好。柱狀圖的局限在于只適用中小規(guī)模的數(shù)據(jù)集。
通常來(lái)說(shuō),柱狀圖的X軸是時(shí)間維,用戶習(xí)慣性認(rèn)為存在時(shí)間趨勢(shì)。如果遇到X軸不是時(shí)間維的情況,建議用顏色區(qū)分每根柱子,改變用戶對(duì)時(shí)間趨勢(shì)的關(guān)注。
上圖是英國(guó)足球聯(lián)賽某個(gè)年度各隊(duì)的贏球場(chǎng)數(shù),X軸代表不同球隊(duì),Y軸代表贏球數(shù)。
折線圖適合二維的大數(shù)據(jù)集,尤其是那些趨勢(shì)比單個(gè)數(shù)據(jù)點(diǎn)更重要的場(chǎng)合。
它還適合多個(gè)二維數(shù)據(jù)集的比較。
上圖是兩個(gè)二維數(shù)據(jù)集(大氣中二氧化碳濃度,地表平均氣溫)的折線圖。
5.3 餅圖(Pie Chart)
餅圖是一種應(yīng)該避免使用的圖表,因?yàn)槿庋蹖?duì)面積大小不敏感。
上圖中,左側(cè)餅圖的五個(gè)色塊的面積排序,不容易看出來(lái)。換成柱狀圖,就容易多了。
一般情況下,總是應(yīng)該用柱狀圖替代餅圖。但是有一個(gè)例外,就是反映某個(gè)部分占整體的比重,比如貧窮人口占總?cè)丝诘陌俜直取?
餅圖
散點(diǎn)圖適用于三維數(shù)據(jù)集,但其中只有兩維需要比較。
上圖是各國(guó)的醫(yī)療支出與預(yù)期壽命,三個(gè)維度分別為國(guó)家、醫(yī)療支出、預(yù)期壽命,只有后兩個(gè)維度需要比較。
為了識(shí)別第三維,可以為每個(gè)點(diǎn)加上文字標(biāo)示,或者不同顏色。
氣泡圖是散點(diǎn)圖的一種變體,通過(guò)每個(gè)點(diǎn)的面積大小,反映第三維。
上圖是卡特里娜颶風(fēng)的路徑,三個(gè)維度分別為經(jīng)度、緯度、強(qiáng)度。點(diǎn)的面積越大,就代表強(qiáng)度越大。因?yàn)橛脩舨簧朴谂袛嗝娣e大小,所以氣泡圖只適用不要求精確辨識(shí)第三維的場(chǎng)合。
如果為氣泡加上不同顏色(或文字標(biāo)簽),氣泡圖就可用來(lái)表達(dá)四維數(shù)據(jù)。比如下圖就是通過(guò)顏色,表示每個(gè)點(diǎn)的風(fēng)力等級(jí)。
雷達(dá)圖適用于多維數(shù)據(jù)(四維以上),且每個(gè)維度必須可以排序(國(guó)籍就不可以排序)。但是,它有一個(gè)局限,就是數(shù)據(jù)點(diǎn)最多6個(gè),否則無(wú)法辨別,因此適用場(chǎng)合有限。
下面是邁阿密熱火隊(duì)首發(fā)的五名籃球選手的數(shù)據(jù)。除了姓名,每個(gè)數(shù)據(jù)點(diǎn)有五個(gè)維度,分別是得分、籃板、助攻、搶斷、封蓋。
雷達(dá)圖
畫(huà)成雷達(dá)圖,就是下面這樣。
雷達(dá)圖
面積越大的數(shù)據(jù)點(diǎn),就表示越重要。很顯然,勒布朗·詹姆斯(紅色區(qū)域)是熱火隊(duì)最重要的選手。
需要注意的時(shí)候,用戶不熟悉雷達(dá)圖,解讀有困難。使用時(shí)盡量加上說(shuō)明,減輕解讀負(fù)擔(dān)。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場(chǎng)景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問(wèn)題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09