
作者 | Destiny
來源 | 木東居士
0x00 前言
之前已經(jīng)分享過「趨勢型(時間序列)」、「比例型」、「對比型」、「分布型」數(shù)據(jù)的可視化圖表方式。
今天這篇,是數(shù)據(jù)圖表選擇的最后一篇,準備分享下可視化中幾類比較特殊、但是常用的數(shù)據(jù)的可視化方式。
主要包含如下如下幾類數(shù)據(jù):
0x01 區(qū)間型數(shù)據(jù)可視化
區(qū)間型數(shù)據(jù),一般可分為兩種情況:
1.條形進度圖
進度圖,適合比例型區(qū)間數(shù)據(jù)的可視化,通常用來表示某項任務的進度情況。比如,顯示某個APP的當前下載進度,當前設備的電量剩余情況,電商網(wǎng)站交易額的完成率等。
重疊條形圖的繪制,有幾個要點,以電商網(wǎng)站的交易額為例說明:
(1)根據(jù)統(tǒng)計期間,交易額的目標值T,交易額的實際完成值A(chǔ),計算出交易額的完成率R,R=A/T*100%。
(2)對交易額的完成率進行區(qū)間劃分,然后和定性指標進行關(guān)聯(lián)。通常,定性指標可以是文字表示(差、一般、好、極好…),但是更常見的做法是拿區(qū)間和顏色來進行映射。
示例如下:
指標區(qū)間的劃分和顏色的選取,可以根據(jù)具體業(yè)務的實際情況自行決定。但是要注意一個要點,在不同的文化中,不同顏色具有不同的寓意,實操過程中,要因地制宜的進行顏色映射。
2.儀表盤
儀表盤,由表盤刻度、指針、指針所在角度三者構(gòu)成,可以直觀的展示某項指標的進度(比例型)或?qū)嶋H情況(數(shù)值型)。
儀表盤三要素:
通常,為了視覺展示的美觀和降低映射的次數(shù),建議指針的數(shù)量不超過 3 根。
3.環(huán)形進度圖
環(huán)形進度圖,它除了可以表示比例型的數(shù)據(jù)以外,還可以表示數(shù)值型的數(shù)據(jù),并將其和定性指標相關(guān)聯(lián),可以看成是儀表盤和條形進度圖的結(jié)合體。
和儀表盤相比,環(huán)形進度圖沒有指針;和條形進度圖相比,環(huán)形進度圖的內(nèi)部可以展示和定性指標關(guān)聯(lián)的結(jié)果。
環(huán)形進度圖展示的數(shù)據(jù)指標,其區(qū)間劃分既可以和顏色映射,也可以和定性文字表達映射,具體方法參照條形進度圖部分的表格示例。
0x02 關(guān)系型數(shù)據(jù)可視化
數(shù)據(jù)之間的關(guān)系,主要包含如下幾種關(guān)系類型:
1.韋恩圖
作為表示集合之間關(guān)系的可視化圖形,韋恩圖是展示數(shù)據(jù)集之間包含關(guān)系的絕佳方式,它通過面積的大小來映射集合元素的個數(shù),重疊部分的面積,則代表多個數(shù)據(jù)集重合元素的個數(shù)。
在工作中,我們要研究多個數(shù)據(jù)集之間的包含關(guān)系,就可以使用韋恩圖來展示數(shù)據(jù)。比如,購買啤酒的用戶和購買尿布的用戶有多少是重合的,收過某快遞公司包裹的用戶和選擇某快遞公司寄件的用戶,有多少是重合的。
當然,韋恩圖的使用并不僅僅局限于人群的包含關(guān)系展示,只要你需要研究多個數(shù)據(jù)集的包含關(guān)系,都可以使用韋恩圖,但是前提是:多個數(shù)據(jù)集描述的對象維度需要相同,比如都是用戶ID或商品名稱等。
2.漏斗圖
漏斗圖,適合作為具有層級關(guān)系的數(shù)據(jù)的可視化方式,特別是流程類或具有先后關(guān)系步驟的數(shù)據(jù),且一般是用來描述單變量在不同環(huán)節(jié)的變化情況。
在網(wǎng)站或APP分析中,通常使用漏斗圖來比較完整流程中,各關(guān)鍵步驟的轉(zhuǎn)化率,以此來發(fā)現(xiàn)各個環(huán)節(jié)的問題并進行改進。在電商類購物網(wǎng)站中,常用漏斗圖來分析用戶從瀏覽商品至最終交易成功的各個關(guān)鍵環(huán)節(jié)的轉(zhuǎn)化率,具體如下圖所示:
通過縱向?qū)Ρ雀鱾€環(huán)節(jié)的用戶轉(zhuǎn)化率和流失情況,可以發(fā)現(xiàn)業(yè)務流程中各環(huán)節(jié)存在的問題,從而采取相應的措施來改進。除了縱向?qū)Ρ纫酝猓趯嶋H業(yè)務中,也經(jīng)常會橫向?qū)Ρ炔煌瑫r間周期的轉(zhuǎn)化率情況,從而來評估某項改進措施的效果或發(fā)現(xiàn)現(xiàn)階段的問題。
3.矩形樹圖
在分布型數(shù)據(jù)可視化中講到過,矩形樹圖適合具有「樹狀結(jié)構(gòu)」的層級關(guān)系數(shù)據(jù)的可視化,它通過「面積」來映射數(shù)據(jù)大小或者數(shù)據(jù)占比,通過顏色來區(qū)分類別。
且當矩形樹圖有多級結(jié)構(gòu)時,通常需要一些交互來輔助數(shù)據(jù)細節(jié)的展示,如鼠標懸停顯示實際數(shù)或占比、單擊某個類別區(qū)域進入該類別細分視圖、單擊面包屑返回指定層級等。
4.桑基圖
桑基圖,是一種描述數(shù)據(jù)分流關(guān)系的可視化圖表方案,它的優(yōu)勢是可以直觀的展現(xiàn)數(shù)據(jù)流動。
它主要由邊、流量和支點組成,其中邊代表了流動的數(shù)據(jù),流量代表了流動數(shù)據(jù)的具體數(shù)值,節(jié)點代表了不同分類。邊的寬度與流量成比例地顯示,邊越寬,數(shù)值越大。
?;鶊D有一個重要特點就是保持能量守恒,即:所有主分支的高度總和=所有分出去的分支高度之和,因此?;鶊D也稱為「桑基能量平衡圖」。起初,桑基圖主要用于分析能源的用途流向和行業(yè)損耗、工業(yè)生產(chǎn)材料的成分構(gòu)成、金融領(lǐng)域的資金流向等。后來,?;鶊D使用領(lǐng)域擴大,比如可以用于分析用戶在網(wǎng)站或APP上行為路徑和分流情況,比如分析家庭收入來源和支出流向,世界人口遷移等。
總之,如果需要展示數(shù)據(jù)的分流情況,?;鶊D是一種絕佳的可視化方案。
5.節(jié)點關(guān)系圖
節(jié)點關(guān)系圖,常用來表示兩個或多個對象之間的關(guān)系。節(jié)點關(guān)系圖,主要有如下幾個要素:
比較常用的場景有,劇集中人物關(guān)系的可視化、個人的社交網(wǎng)絡拓撲等。
0x03 地理型數(shù)據(jù)可視化
地理型數(shù)據(jù),是指數(shù)據(jù)的維度屬性中包含地理信息,如國家、省份、城市、區(qū)、街道等。對于地理型數(shù)據(jù)的可視化,我們首先想到的可視化方案是使用地圖。
從可視化的空間維度上劃分,地圖分為二維地圖和三維地圖。二維地圖,包括區(qū)域地圖、道路地圖、室內(nèi)地圖等,在出行類APP如高德地圖、百度地圖、騰訊地圖中都有廣泛應用;三維地圖,即我們通常所說的全景地圖,它具有真實感強、易于沉浸的特點,可以真實的展現(xiàn)現(xiàn)實的空間場景,如室外天氣情況、人群多寡等。
本次分享的地理型數(shù)據(jù)可視化,側(cè)重于地圖與其他圖表組合的可視化方案。
三者的共同點是,數(shù)據(jù)中的地理屬性都會映射到地圖上的具體位置;不同點是,散點地圖是通過散點的顏色來映射數(shù)值的大小,氣泡地圖是通過氣泡面積來映射數(shù)值大小,熱力地圖是通過區(qū)域顏色的深淺來映射數(shù)值大小。
2.地圖+線圖
地圖和線圖結(jié)合的場景,一般是用于數(shù)據(jù)中具有兩個維度的地理信息,用于展示數(shù)據(jù)的流入&流出情況,其數(shù)據(jù)格式一般為:「地理信息1+地理信息2+數(shù)值」。
地理信息1(Departure)地理信息2(Desination)流入人口(Value)黑龍江省廣東省100,000海南省廣東省80,000….….….
其經(jīng)常使用的場景包括:世界范圍或者全國范圍內(nèi)的人口遷移,不同地區(qū)飛機/船舶/高鐵等交通航線的繁忙程度和流向情況,不同地區(qū)包裹的寄出量或收貨量等。
3.地圖+餅圖
當既要顯示不同地理區(qū)域某一指標的數(shù)據(jù)總量,同時又要顯示各地區(qū)某一指標總量的各構(gòu)成部分占比時,可以使用「地圖+餅圖」結(jié)合的方式來進行可視化。
和普通的堆疊柱狀圖相比,「地圖+餅圖」可以顯示更多的數(shù)據(jù)項,同時更加直觀的展示數(shù)據(jù)和地理位置的關(guān)聯(lián)性。但是要注意一個點,地圖上的餅圖的扇區(qū)個數(shù),最好保持在2~4個左右,如果總體分類過多,餅圖在地圖上就會顯得比較雜亂,可以考慮適度重新分組,以保證可視化呈現(xiàn)的最終效果。
0xFF 總結(jié)
在開篇《數(shù)據(jù)可視化之旅(一):數(shù)據(jù)可視化過程》中有講到,數(shù)據(jù)關(guān)系是決定圖表選擇的關(guān)鍵因素。
作為數(shù)據(jù)圖表選擇的最后一篇,我們一起來回顧下【數(shù)據(jù)圖表的選擇】部分的內(nèi)容,以下為常見的數(shù)據(jù)關(guān)系和可供選擇的圖表類型。
*重要的內(nèi)容多看幾遍
后記
下一篇,會結(jié)合實際業(yè)務場景中的數(shù)據(jù)案例,來對比常用圖表的差異,總結(jié)根據(jù)數(shù)據(jù)特點選擇圖表類型的套路。感覺對自己有幫助的朋友請持續(xù)關(guān)注我們吧,小編非常樂意給大家分享分享個人的學習心得和經(jīng)驗總結(jié)!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10