
數(shù)據(jù)分析是指用適當?shù)?a href='/map/tongjifenxi/' style='color:#000;font-size:inherit;'>統(tǒng)計分析對收集來的大量數(shù)據(jù)進行分析,提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。在實用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當行動。
數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。
在實用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當行動。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。在產(chǎn)品的整個壽命周期,包括從市場調(diào)研到售后服務(wù)和最終處置的各個過程都需要適當運用數(shù)據(jù)分析過程,以提升有效性。
在企業(yè)里面,數(shù)據(jù)分析可以幫助我們掌握企業(yè)的運營狀況,商品的出售情況,用戶的特征、產(chǎn)品的粘性、等等。
數(shù)據(jù)分析一定的帶著某種業(yè)務(wù)目的的。它可能是要追蹤一個新產(chǎn)品上線之后的用戶使用情況;也可能是觀察用戶在某段時間的留存情況,還有可能是運營某種優(yōu)惠券是否有效。
帶著一定的目的,確定要從哪幾個角度進行分析。然后找到能夠說明目的的指標。
比如想要驗證運營最近的一批優(yōu)惠券是否有效。我們可以從優(yōu)惠券的領(lǐng)取情況和優(yōu)惠券的使用情況兩個方面分析,而優(yōu)惠券的領(lǐng)取情況的指標可以細化為領(lǐng)取率;使用情況可細化為:使用率、客單價等。
在確定了此次數(shù)據(jù)分析的核心指標后,就要針對數(shù)據(jù)指標做數(shù)據(jù)收集。
有些企業(yè)的數(shù)據(jù)準備非常充分,數(shù)據(jù)倉庫、數(shù)據(jù)集市等早早就建設(shè)好。有一些企業(yè)在數(shù)據(jù)分析上比較落后,那就需要我們自己做前期大量的數(shù)據(jù)收集工作。
比如使用一些自己公司的或者第三方的數(shù)據(jù)分析工具進行埋點,拿到日志?;蛘呤褂脭?shù)據(jù)庫中的現(xiàn)有數(shù)據(jù),比如訂單數(shù)據(jù)、基礎(chǔ)的用戶信息等等。
數(shù)據(jù)提取出來之后,要剔除臟數(shù)據(jù)(清洗),然后數(shù)據(jù)轉(zhuǎn)化。在進行最基本的數(shù)據(jù)匯總、聚合之后,我們就可以拿到比較簡單的字段相對豐富的數(shù)據(jù)寬表。
數(shù)據(jù)分析是用適當?shù)姆治龇椒肮ぞ?,對處理過的數(shù)據(jù)進行分析,提取有價值的信息,形成有效結(jié)論的過程。
一般公司所需要觀察的數(shù)據(jù)大致分為如下幾類:
商業(yè)數(shù)據(jù):付費金額,付費用戶數(shù),付費率客單價
運營數(shù)據(jù):新增用戶數(shù),日活、周活、月活(AARRR模型)
產(chǎn)品數(shù)據(jù):關(guān)鍵頁面的pv、uv(漏斗模型)
用戶數(shù)據(jù):用戶生命周期、用戶留存、用戶客單價、用戶類型(RFM模型…)
商品數(shù)據(jù):商品售賣情況,毛利分析….
隨著數(shù)據(jù)的重要性的凸顯,越來越多的公司已經(jīng)認識到數(shù)據(jù)對于公司的經(jīng)營是十分重要的。
所以絕大部分企業(yè)都有專門的BI部門進行初步的數(shù)據(jù)加工、分析,以周報表的形式匯總給管理層做為日常數(shù)據(jù)所需以及企業(yè)決策使用。
在這里主要介紹兩個簡單的數(shù)據(jù)分析模型:
Acquisition(獲取)、Activation(活躍)、Retention(留存)、Revenue(收益)、Refer(傳播)
如何獲取用戶?線上通過網(wǎng)站通過SEO,SEM,app通過市場首發(fā)、ASO等方式獲取。還有運營活動的H5頁面,自媒體等方式。線下通過地推和傳單進行獲取用戶。
來了用戶后,通過運營價格優(yōu)惠、編輯內(nèi)容等方式進行提高活躍度。把內(nèi)容做多,商品做多,價格做到優(yōu)惠,但需要控制在成本至上的有生長空間。這樣的用戶是最有價值進行活躍。
產(chǎn)品策略上,除了提供運營模塊和內(nèi)容深化。進行產(chǎn)品會員激勵機制成長體制進行活躍用戶。不僅商品優(yōu)惠的,VIP等標示的ICON,對于長業(yè)務(wù)流程,進行流程激勵體制,產(chǎn)品策略更具多元化。
提高活躍度的,有了忠實的用戶,就開始慢慢沉淀下來了。運營上,采用內(nèi)容,相互留言等社區(qū)用戶共建UCG,擺脫初期的PCG模式。電商通過商品質(zhì)量,O2O通過優(yōu)質(zhì)服務(wù)提高留存。這些都是業(yè)務(wù)層面的提高留存。
產(chǎn)品模式上,通過會員機制的簽到和獎勵的機制去提高留存。包括app推送和短信激活方式都是激活用戶,提高留存的產(chǎn)品方式。
通過日留存率、周留存率、月留存率等指標監(jiān)控應(yīng)用的用戶流失情況,并采取相應(yīng)的手段在用戶流失之前,激勵這些用戶繼續(xù)使用應(yīng)用。
獲取收入其實是應(yīng)用運營最核心的一塊。即使是免費應(yīng)用,也應(yīng)該有其盈利的模式。
收入來源主要有三種:付費應(yīng)用、應(yīng)用內(nèi)付費、以及廣告。付費應(yīng)用在國內(nèi)的接受程度很低,包括Google Play Store在中國也只推免費應(yīng)用。在國內(nèi),廣告是大部分開發(fā)者的收入來源,而應(yīng)用內(nèi)付費目前在游戲行業(yè)應(yīng)用比較多。
前面所提的提高活躍度、提高留存率,對獲取收入來說,是必需的基礎(chǔ)。用戶基數(shù)大了,收入才有可能上量。
以前的運營模型到第四個層次就結(jié)束了,但是社交網(wǎng)絡(luò)的興起,使得運營增加了一個方面,就是基于社交網(wǎng)絡(luò)的病毒式傳播,這已經(jīng)成為獲取用戶的一個新途徑。這個方式的成本很低,而且效果有可能非常好;唯一的前提是產(chǎn)品自身要足夠好,有很好的口碑。
從自傳播到再次獲取新用戶,應(yīng)用運營形成了一個螺旋式上升的軌道。而那些優(yōu)秀的應(yīng)用就很好地利用了這個軌道,不斷擴大自己的用戶群體。
漏斗模型廣泛應(yīng)用于流量監(jiān)控、產(chǎn)品目標轉(zhuǎn)化等日常數(shù)據(jù)運營工作中。之所以稱為漏斗,就是因為用戶(或者流量)集中從某個功能點進入(這是可以根據(jù)業(yè)務(wù)需求來自行設(shè)定的),可能會通過產(chǎn)品本身設(shè)定的流程完成操作。
按照流程操作的用戶進行各個轉(zhuǎn)化層級上的監(jiān)控,尋找每個層級的可優(yōu)化點;對沒有按照流程操作的用戶繪制他們的轉(zhuǎn)化路徑,找到可提升用戶體驗,縮短路徑的空間。
運用漏斗模型比較典型的案例就是電商網(wǎng)站的轉(zhuǎn)化,用戶在選購商品的時候必然會按照預(yù)先設(shè)計好的購買流程進行下單,最終完成支付。
需要注意的是:單一的漏斗模型對于分析來說沒有任何意義,我們不能單從一個漏斗模型中評價網(wǎng)站某個關(guān)鍵流程中各步驟的轉(zhuǎn)化率的好壞,所以必須通過趨勢、比較和細分的方法對流程中各步驟的轉(zhuǎn)化率進行分析:
趨勢(Trend):從時間軸的變化情況進行分析,適用于對某一流程或其中某個步驟進行改進或優(yōu)化的效果監(jiān)控;
比較(Compare):通過比較類似產(chǎn)品或服務(wù)間購買或使用流程的轉(zhuǎn)化率,發(fā)現(xiàn)某些產(chǎn)品或應(yīng)用中存在的問題;
細分(Segment):細分來源或不同的客戶類型在轉(zhuǎn)化率上的表現(xiàn),發(fā)現(xiàn)一些高質(zhì)量的來源或客戶,通常用于分析網(wǎng)站的廣告或推廣的效果及ROI。
數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學技術(shù)研究。其中,這種數(shù)據(jù)的視覺表現(xiàn)形式被定義為,一種以某種概要形式抽提出來的信息,包括相應(yīng)信息單位的各種屬性和變量。
圖表是”數(shù)據(jù)可視化”的常用手段,其中又以基本圖表——柱狀圖、折線圖、餅圖等等——最為常用。
有人覺得,基本圖表太簡單、太原始,不高端,不大氣,因此追求更復(fù)雜的圖表。但是,越簡單的圖表,越容易理解,而快速易懂地理解數(shù)據(jù),不正是”數(shù)據(jù)可視化”的最重要目的和最高追求嗎?
所以,請不要小看這些基本圖表。因為用戶最熟悉它們,所以只要是適用的場合,就應(yīng)該考慮優(yōu)先使用。
柱狀圖是最常見的圖表,也最容易解讀。
它的適用場合是二維數(shù)據(jù)集(每個數(shù)據(jù)點包括兩個值x和y),但只有一個維度需要比較。年銷售額就是二維數(shù)據(jù),”年份”和”銷售額”就是它的兩個維度,但只需要比較”銷售額”這一個維度。
柱狀圖利用柱子的高度,反映數(shù)據(jù)的差異。肉眼對高度差異很敏感,辨識效果非常好。柱狀圖的局限在于只適用中小規(guī)模的數(shù)據(jù)集。
通常來說,柱狀圖的X軸是時間維,用戶習慣性認為存在時間趨勢。如果遇到X軸不是時間維的情況,建議用顏色區(qū)分每根柱子,改變用戶對時間趨勢的關(guān)注。
上圖是英國足球聯(lián)賽某個年度各隊的贏球場數(shù),X軸代表不同球隊,Y軸代表贏球數(shù)。
折線圖適合二維的大數(shù)據(jù)集,尤其是那些趨勢比單個數(shù)據(jù)點更重要的場合。
它還適合多個二維數(shù)據(jù)集的比較。
上圖是兩個二維數(shù)據(jù)集(大氣中二氧化碳濃度,地表平均氣溫)的折線圖。
5.3 餅圖(Pie Chart)
餅圖是一種應(yīng)該避免使用的圖表,因為肉眼對面積大小不敏感。
上圖中,左側(cè)餅圖的五個色塊的面積排序,不容易看出來。換成柱狀圖,就容易多了。
一般情況下,總是應(yīng)該用柱狀圖替代餅圖。但是有一個例外,就是反映某個部分占整體的比重,比如貧窮人口占總?cè)丝诘陌俜直取?
餅圖
散點圖適用于三維數(shù)據(jù)集,但其中只有兩維需要比較。
上圖是各國的醫(yī)療支出與預(yù)期壽命,三個維度分別為國家、醫(yī)療支出、預(yù)期壽命,只有后兩個維度需要比較。
為了識別第三維,可以為每個點加上文字標示,或者不同顏色。
氣泡圖是散點圖的一種變體,通過每個點的面積大小,反映第三維。
上圖是卡特里娜颶風的路徑,三個維度分別為經(jīng)度、緯度、強度。點的面積越大,就代表強度越大。因為用戶不善于判斷面積大小,所以氣泡圖只適用不要求精確辨識第三維的場合。
如果為氣泡加上不同顏色(或文字標簽),氣泡圖就可用來表達四維數(shù)據(jù)。比如下圖就是通過顏色,表示每個點的風力等級。
雷達圖適用于多維數(shù)據(jù)(四維以上),且每個維度必須可以排序(國籍就不可以排序)。但是,它有一個局限,就是數(shù)據(jù)點最多6個,否則無法辨別,因此適用場合有限。
下面是邁阿密熱火隊首發(fā)的五名籃球選手的數(shù)據(jù)。除了姓名,每個數(shù)據(jù)點有五個維度,分別是得分、籃板、助攻、搶斷、封蓋。
雷達圖
畫成雷達圖,就是下面這樣。
雷達圖
面積越大的數(shù)據(jù)點,就表示越重要。很顯然,勒布朗·詹姆斯(紅色區(qū)域)是熱火隊最重要的選手。
需要注意的時候,用戶不熟悉雷達圖,解讀有困難。使用時盡量加上說明,減輕解讀負擔。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03