
一張圖讀懂?dāng)?shù)據(jù)分析
前兩天看到一張圖,很好的詮釋了從數(shù)據(jù)到數(shù)據(jù)分析的過(guò)程,今天分享給大家。
這四個(gè)步驟直譯過(guò)來(lái)就是:數(shù)據(jù)-信息-展示-知識(shí)。不過(guò)圖中的信息量遠(yuǎn)不止這八個(gè)字這么簡(jiǎn)單。可以說(shuō)這張圖體現(xiàn)了數(shù)據(jù)分析精髓,讀透了就懂?dāng)?shù)據(jù)分析了。
——————-| 壹 |——————-
現(xiàn)實(shí)比圖1更殘酷,往往雞蛋里面是混著蛋殼滴!數(shù)據(jù)源質(zhì)量參差不齊,各種垃圾數(shù)據(jù),各種無(wú)效數(shù)據(jù)。很多初級(jí)分析人員就用這樣的數(shù)據(jù)開(kāi)始勞作了。難道你們不知道還有一種工作叫數(shù)據(jù)清洗或數(shù)據(jù)整理么?建立在垃圾數(shù)據(jù)基礎(chǔ)上的分析能是分析么?
有次見(jiàn)一個(gè)小表妹在分析VIP顧客的平均年齡(備注:時(shí)尚女裝品牌),她用所有VIP會(huì)員年齡總和除以會(huì)員總數(shù)就得到了平均年齡。so easy,在excel表格里面幾秒鐘就能搞定。我想這樣的平均年齡她一定會(huì)寫(xiě)到會(huì)員月度報(bào)告中去吧,領(lǐng)導(dǎo)們也會(huì)相信這是真的。正好想和這個(gè)妹妹聊會(huì)兒天,于是對(duì)她說(shuō)你能用透視表篩選一下看看年齡段在60歲以上15歲以下的會(huì)員有多少嗎?表妹不會(huì)透視表的年齡分段功能,于是我又手把手的教會(huì)了她。
該品牌的目標(biāo)顧客年齡是25-35歲,不看不知道一看嚇一跳,居然有6.9%的會(huì)員年齡是60+或15-(想想一個(gè)80歲的老太太會(huì)拉高不少平均年齡值滴)。這些就是會(huì)員年齡的垃圾數(shù)據(jù),出現(xiàn)這種情況多半是店鋪數(shù)據(jù)錄入的時(shí)候沒(méi)把好關(guān),當(dāng)然這個(gè)企業(yè)本身也不重視這些基礎(chǔ)數(shù)據(jù)的收集。
——————-| 貳 |——————-
有些人的數(shù)據(jù)分析終止于圖中的第二步,分析結(jié)果只是信息的堆積。無(wú)數(shù)次看見(jiàn)下屬給領(lǐng)導(dǎo)的數(shù)據(jù)分析報(bào)告,各種數(shù)據(jù),各種表格,密密麻麻的好幾張sheet。領(lǐng)導(dǎo)要的結(jié)論呢?
“領(lǐng)導(dǎo)你自己看”(下屬在心理面這樣說(shuō))。
這種只有數(shù)據(jù)沒(méi)有結(jié)論的數(shù)據(jù)分析報(bào)告充斥著我們的日常工作,受害者都是企業(yè)的管理者。
分析的時(shí)候?qū)⒂袃r(jià)值的數(shù)據(jù)整合成信息只是數(shù)據(jù)分析的一個(gè)步驟,只羅列數(shù)據(jù)不叫分析,那個(gè)只是數(shù)據(jù)的搬運(yùn)工。你們想做一輩子的搬運(yùn)工嗎?
將有價(jià)值的數(shù)據(jù)整合成有價(jià)值的信息是這個(gè)步驟的核心內(nèi)容。
——————-| 叁 |——————-
有些人的數(shù)據(jù)分析終止于圖中的第三步(展示),數(shù)據(jù)展現(xiàn)形式大于內(nèi)容,空有漂亮的圖表而無(wú)實(shí)質(zhì)內(nèi)容。這里面分成兩類(lèi),一類(lèi)是追求漂亮型,每張圖表都有漂亮的配色,高大上的自定義數(shù)據(jù)圖,把數(shù)據(jù)打扮成一個(gè)個(gè)花枝招展的春姑娘。
第二類(lèi)是樸素型,有些人做了一輩子的圖表只用過(guò)三種圖:曲線圖,餅圖,柱狀圖(我把它們叫三俗圖)。其實(shí)excel中的圖表有很多,條形圖、雷達(dá)圖,股價(jià)圖,堆積圖等,還有變異的漏斗圖,雙軸圖等等??晒┻x擇的太多了,這種人就是懶!
數(shù)據(jù)展示要講邏輯,圖表必須要用最簡(jiǎn)單的邏輯把結(jié)論告訴受眾,而不是簡(jiǎn)單的做成圖就完了。時(shí)間序列,優(yōu)先順序,重要程度等都是圖表可以利用的邏輯。
考大家一下,下面這張圖你能發(fā)現(xiàn)幾個(gè)錯(cuò)誤或不符合邏輯的地方?
如果能找到3個(gè)以上問(wèn)題的同學(xué)可以畢業(yè)了!大家可以在文章最后以評(píng)論的方式說(shuō)出你找到圖表的邏輯問(wèn)題有哪些?
俗話說(shuō):千言萬(wàn)語(yǔ)不如一張圖,但是好的圖表才會(huì)自己說(shuō)話!
——————-| 肆 |——————-
亮點(diǎn)總是在最后面,正如第四張圖描述的一樣,好的數(shù)據(jù)分析成果大部分會(huì)被受眾吸收,轉(zhuǎn)化成他們的知識(shí)(盤(pán)子里面只會(huì)剩下一點(diǎn)點(diǎn)面包屑)。沒(méi)有前三個(gè)步驟的鋪墊,轉(zhuǎn)化的可能就不是知識(shí)而是糟粕了。
數(shù)據(jù)分析的目的是什么?你真的認(rèn)真思索過(guò)這個(gè)問(wèn)題嗎?沒(méi)有的請(qǐng)馬上面壁三分鐘然后再往下看。
1、認(rèn)清事實(shí)
2、找出規(guī)律
3、預(yù)測(cè)未來(lái)
4、洞悉關(guān)系
這是我總結(jié)的數(shù)據(jù)分析的四大主要目的,無(wú)論是哪一個(gè)目的,最終你都是需要將分析成果讓受眾吸收。受眾可以是別人,也可以是自己。數(shù)據(jù)分析人員的日常工作大部分是在認(rèn)清事實(shí)和找出規(guī)律,而預(yù)測(cè)未來(lái)和洞悉關(guān)系占的比重很少。
我們?cè)谧?a target="_blank">數(shù)據(jù)分析報(bào)告的時(shí)候,一定要有價(jià)值的結(jié)論,并且準(zhǔn)確無(wú)誤的將結(jié)論傳遞給受眾,否則大家都是在浪費(fèi)時(shí)間。記住上面做漢堡的這張圖,你不僅僅是為了漢堡好看,而是讓對(duì)方吃進(jìn)肚子里去才是目的。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10