
數(shù)據(jù)可視化方法、工具、核心理念及需要警惕的深坑
大數(shù)據(jù)是當下最火爆的話題之一。隨之而來的,是數(shù)據(jù)可視化技術(shù)的持續(xù)發(fā)展,它用來展現(xiàn)和闡釋大規(guī)模的數(shù)據(jù)。但是數(shù)據(jù)可視化技術(shù)并非千篇一律。
數(shù)據(jù)可視化是展現(xiàn)數(shù)據(jù)的最強大機制之一,技術(shù)上的優(yōu)勢也為其創(chuàng)造了獨特的實現(xiàn)方法。隨著交互式的、獨特的數(shù)據(jù)可視化方法逐漸走向最前沿,并且觀眾也越來越明白他們自己的喜好和厭惡,那些繪制簡單餅狀圖的日子將一去不復(fù)返。
接下去我們將向你介紹數(shù)據(jù)可視化的重要性,不同的數(shù)據(jù)展現(xiàn)方式以及業(yè)界常用的工具。你也將會了解贏得數(shù)據(jù)可視化技巧背后的核心理念和你需要避免的錯誤。
從本文中你將會學(xué)到:1、數(shù)據(jù)可視化是什么;2、數(shù)據(jù)可視化為什么重要;3、存在哪些數(shù)據(jù)可視化方法;4、贏得數(shù)據(jù)可視化背后的關(guān)鍵理念;5、完成數(shù)據(jù)可視化時需要避免的深坑。
數(shù)據(jù)可視化是什么?
數(shù)據(jù)可視化是研究如何將數(shù)據(jù)以圖片或圖形的方式展現(xiàn)的科學(xué)。它主要專注于展現(xiàn),以連貫和簡短的形式把大量的信息展現(xiàn)出來。盡管數(shù)據(jù)可視化也能處理書面信息,它的重點還是用圖片和圖像的形式向觀眾傳遞信息。
此外,數(shù)據(jù)可視化技術(shù)在數(shù)據(jù)的用法上并不狹窄。它可以可視化各種信息——你可以向其它人傳遞你的理念和假設(shè)。如今甚至可以對數(shù)據(jù)可視化添加技術(shù)和選擇交互式的可視化方法。
信息的視覺表達是一種古老的思維和經(jīng)驗的分享方式。例如,圖表和地圖就是一些早期數(shù)據(jù)可視化技術(shù)的重要例證。
數(shù)據(jù)可視化為什么重要?
如上所述,人類使用數(shù)據(jù)可視化技術(shù)已經(jīng)很久了。圖像和圖表已被證明是一種用于交流和學(xué)習(xí)新信息的有效方法。 研究表明,80%的人能記住他們看到的,但只有20%的人記得怎么讀!它甚至可以將思想和事件向后代延續(xù)。技術(shù)的發(fā)展進一步加強了數(shù)據(jù)可視化帶給人們的機會。
也許,數(shù)據(jù)可視化最重要的好處是它能夠幫助人們更快地掌握數(shù)據(jù)。你可以把一大堆數(shù)據(jù)濃縮到一張圖表里,人們也能更快地抓住關(guān)鍵點。如果用書面形式,可能需要幾小時來分析所有的數(shù)據(jù)和建立數(shù)據(jù)的聯(lián)系。
此外,這種能展現(xiàn)大量數(shù)據(jù)的能力是數(shù)據(jù)可視化的另一個巨大優(yōu)勢。一張圖表可能會突出顯示多個方面,人們就能對數(shù)據(jù)形成不同的觀點。這自然能為企業(yè)開辟新的商業(yè)之路。人們或許能從數(shù)據(jù)中發(fā)現(xiàn)一些意想不到的東西。
數(shù)據(jù)的可視化提高了解釋信息的能力。要從大量的數(shù)據(jù)和信息中尋找關(guān)聯(lián)不容易,但是圖和圖表可以在幾秒鐘內(nèi)提供信息。一眼就能辨識出所需的信息。
以上所有都能加強人們在工作和學(xué)習(xí)的溝通和有效性。數(shù)據(jù)可視化普遍被認為是一種簡單而有效的概括數(shù)據(jù)的方法,因此它可以提高人們分享信息和學(xué)習(xí)的方式。
數(shù)據(jù)可視化的各種方法
技術(shù)的發(fā)展已導(dǎo)致 數(shù)據(jù)的爆炸。這反過來又增加了數(shù)據(jù)被展現(xiàn)的方式。通常來說,數(shù)據(jù)可視化主要分為兩種不同的類型:探索(exploration)和解釋(explanation)。探索類型可以幫助人們發(fā)現(xiàn)數(shù)據(jù)背后的故事,而解釋類型把數(shù)據(jù)簡單明了地解釋給觀眾。
另外,有 不同的方法可用于創(chuàng)建這2種類型。最常見的數(shù)據(jù)可視化方法包括:
2D area —— 這種方法使用地理空間數(shù)據(jù)可視化技術(shù),往往與事件在某塊特定區(qū)域的位置相關(guān)。2D area 數(shù)據(jù)可視化的一個例子包括點分布圖,該圖可以顯示某個區(qū)域中的犯罪等信息。
Temporal —— 時間可視化是以線性方式展現(xiàn)數(shù)據(jù)。時間數(shù)據(jù)可視化的關(guān)鍵是有一個開始和一個結(jié)束的時間點。時間可視化的例子可以是一個連接的散點圖,它可以展現(xiàn)諸如某一區(qū)域的溫度等信息。
Multidimensional —— 您還可以通過多維方法將數(shù)據(jù)在兩個或多個維度上展現(xiàn)。這是最常用的方法之一。多維可視化的一個例子是餅圖,它可以展示如政府支出之類的信息。
Hierarchical —— 層次法被用于呈現(xiàn)多組數(shù)據(jù)。這些數(shù)據(jù)的可視化通常在大群體內(nèi)嵌套小的群體。層次化數(shù)據(jù)可視化的例子可以是一個樹圖,它可以展示如語言組團等的信息。
Network —— 數(shù)據(jù)也能以相互關(guān)聯(lián)的網(wǎng)絡(luò)形式被展現(xiàn)。這是另一種展現(xiàn)大量數(shù)據(jù)的常見方法。網(wǎng)絡(luò)數(shù)據(jù)可視化方法的一個例子可以是沖積關(guān)系圖,它可以展示如醫(yī)療行業(yè)的變化等信息。
以上給出了大量的選擇,它不僅給我們提供了大量機會,同時也讓我們?yōu)檫x擇正確的方法感到頭疼。
另外還有 很多數(shù)據(jù)可視化的工具。它們可以很容易地收集數(shù)據(jù),也可以流線化數(shù)據(jù)的使用方式。
一些最常用的工具包括:
Google charts —— 谷歌的產(chǎn)品在數(shù)據(jù)行業(yè)是眾所周知的,谷歌圖表也是一個容易上手的工具,特別是對于初次使用的用戶。
datawrapper—— 這是一個在線工具,它可以幫助你創(chuàng)建交互式數(shù)據(jù)可視化。
RAW —— RAW的好處包括它擁有大量現(xiàn)成的類型,讓你可以清晰、便捷地展現(xiàn)信息。該平臺是開源的,所以你可以提供自定義布局,或者使用其它的設(shè)計。
Infogram—— Infogram是另一款適合新手的工具。它允許用戶創(chuàng)建不同的圖表和Iinfographs,系統(tǒng)的使用也方便。
可用的工具遠不止這些,你還能找到大量免費和付費的軟件。最好多了解一些信息,以確保你所使用的軟件與被可視化的數(shù)據(jù)最搭配。
贏取數(shù)據(jù)可視化背后的關(guān)鍵概念
見過數(shù)據(jù)可視化的人都知道設(shè)計有好壞之分。如果信息不是以正確的、恰當?shù)姆绞匠尸F(xiàn),則數(shù)據(jù)可視化的好處就很容易被抵消 —— 具體的項目需要定制的方法。
不管你的信息是什么,在利用數(shù)據(jù)可視化時有一些概念你需要牢記。以下是贏取數(shù)據(jù)可視化技術(shù)背后的關(guān)鍵概念集合。
了解聽眾
在展現(xiàn)數(shù)據(jù)之前,你需要做的第一件事就是了解誰將會看這些數(shù)據(jù)。了解你的聽眾是至關(guān)重要的,以便用正確的方法來展現(xiàn)數(shù)據(jù)。
雖然數(shù)據(jù)可視化通常是一種簡化數(shù)據(jù)的方法,但觀眾對主題的知識層次千差萬別,需要好好做準備。如果你是針對一群專業(yè)的聽眾,那么可以使用更多的專業(yè)方法和專業(yè)術(shù)語來解釋數(shù)據(jù)。然而,對于相同的數(shù)據(jù),普通聽眾可能需要更為通俗的方法來解釋。
同樣,知道聽眾對你的數(shù)據(jù)有何期望也非常重要。你需要知道他們想要從數(shù)據(jù)中獲得什么關(guān)鍵點,以及你展示數(shù)據(jù)的主要目的是什么。此外,還需要記住你展現(xiàn)數(shù)據(jù)的目的是什么。
足夠理解數(shù)據(jù)
除了掌握目標受眾外,你還需要對數(shù)據(jù)了如指掌。若是不正確地理解數(shù)據(jù),則很有可能不能把信息有效地傳達給聽眾。
然而你也無法顧及數(shù)據(jù)所包含的所有信息,所以要能夠提取關(guān)鍵的信息,并條理清晰地展現(xiàn)它們。你還需要確保從數(shù)據(jù)中得到的關(guān)聯(lián)信息是正確而不是虛構(gòu)的 —— 決不能用錯誤的數(shù)據(jù)做可視化!
如果你正確地理解了數(shù)據(jù)及其關(guān)聯(lián),則可以從信息中得到獨特而有趣的數(shù)據(jù)關(guān)聯(lián)。
講述一個故事
數(shù)據(jù)可視化還應(yīng)該描繪出一個故事。你一定不希望這些數(shù)據(jù)只是以一組信息的方式來展現(xiàn),而是能傳遞出數(shù)據(jù)使用背后的信息。這可以是不同的描述性介紹,或是為觀眾呈現(xiàn)一幅特定的圖像。
編造一個故事往往意味著觀眾從數(shù)據(jù)中獲得更多的洞察力。它可以幫助觀眾了解新的關(guān)聯(lián)和更深入的信息。
事實上,數(shù)據(jù)可視化技術(shù)是一個出色的講故事工具?!耙粓D勝千言”這句話一點都不錯,你應(yīng)該發(fā)揮它的這項優(yōu)勢。通過數(shù)據(jù)來講故事并不困難,因為你可以把顏色、字體和演示文稿都作為講故事手法的一部分。
為了使數(shù)據(jù)可視化成功地融入故事,上述提到的理解數(shù)據(jù)則是至關(guān)重要的一點。
保持簡潔
近年來,數(shù)據(jù)可視化的發(fā)展很快,正如上面所示,涌現(xiàn)出很多工具和系統(tǒng)供人們使用。能接觸不同的獨特方法并不意味著都要用到它們。而且,大量的數(shù)據(jù)也不意味著所有的信息都是必不可少的。
總之,保持你的數(shù)據(jù)可視化方法簡單明了。不必刻意地使用過多的數(shù)據(jù)或使用過多的技巧。
如果從講故事的角度來看,必須明白你所展現(xiàn)的每一個元素都是故事必不可少的一部分。如果數(shù)據(jù)或元素,如某些事物的圖片,對故事的情節(jié)無關(guān)緊要,那么就不應(yīng)該把它加入進來。
數(shù)據(jù)展示中包含太多的元素實際上會破壞最終的成品,與數(shù)據(jù)脫節(jié)。要記住數(shù)據(jù)可視化的核心之處就是能在一瞬間呈現(xiàn)大量的數(shù)據(jù)。如果可視化顯得很費勁,那么你就要回頭看看是否使用了錯誤的數(shù)據(jù)演示或包含了太多的信息。
合理區(qū)分展現(xiàn)平臺
最后,贏取數(shù)據(jù)可視化技術(shù)也要了解技術(shù)方面。人們現(xiàn)在通過各種不同的平臺查看和訪問信息,這一點必須牢記。就像需要知道目標受眾一樣,你也需要考慮人們查看數(shù)據(jù)可視化的方式。
你的可視化結(jié)果要能輕松適應(yīng)多種平臺,如移動設(shè)備,平板電腦或計算機。如果你的用戶只通過手機瀏覽數(shù)據(jù),那么適用于移動端的展現(xiàn)方法自然會對你更有幫助,而不是針對筆記本的方法。
除了考慮平臺的界面選項外,還需要考慮可訪問性(accessibility)問題。如果數(shù)據(jù)可視化允許視覺欠佳的人進行適當?shù)姆糯蠛涂s小,可以大大提高用戶體驗。你也可以考慮為色盲人群提供不同顏色選項。 可訪問性旨在提高用戶體驗,確保數(shù)據(jù)可視化可對所有人適用。
數(shù)據(jù)可視化需要避免的大錯誤
盡管以上關(guān)鍵方法能幫你生成贏取數(shù)據(jù)可視化的策略,還有一些常見誤區(qū)要時刻警惕。
錯誤的信息
如上所述,數(shù)據(jù)的錯誤是觀眾最厭惡的東西。你必須確保那些正在看你的數(shù)據(jù)的人獲取到的是正確的數(shù)據(jù)。確保人們可以直接使用你圖表里的數(shù)據(jù),而不必再次確認數(shù)據(jù)正確性,這是你的職責(zé)。
不完整的信息
除了保證信息正確之外,還要呈現(xiàn)完整的數(shù)據(jù)。人們必須能在其中找到相關(guān)信息,不能使用數(shù)據(jù)可視化來欺騙或展現(xiàn)不完整的信息。
數(shù)據(jù)可視化能夠而且應(yīng)該講述一個故事,但故事需要包含完整和正確的信息,而不是只展示你認為合適的數(shù)據(jù)。
過于簡化數(shù)據(jù)
盡管要確保數(shù)據(jù)是以簡單的方式展現(xiàn),這并不意味著你應(yīng)該簡化它。首先,你需要記住觀眾是誰 —— 對專業(yè)人士不要使用通俗和過于簡化的語言。而如果是普通的觀眾,就不要用專業(yè)術(shù)語來填充文字。
但除此之外,若是你未能清晰地展現(xiàn)數(shù)據(jù),也就不能期望聽眾能清楚地了解它們之間的關(guān)系。不能因為對你來說鏈接似乎很明顯了,就省略部分信息 —— 記住觀眾只能看到你所展示的這部分數(shù)據(jù),而不是你所使用的完整數(shù)據(jù)集!
不恰當?shù)目梢暬?/span>
在展現(xiàn)數(shù)據(jù)時,你需要仔細思考數(shù)據(jù)展現(xiàn)的方式。如字體,顏色和圖像之類的屬性很總要。例如,如果展示由特定疾病而導(dǎo)致死亡的信息時,使用鮮艷的色彩和令人愉快的圖像似乎不協(xié)調(diào)。
不適當?shù)目梢暬舶ㄊ褂玫募夹g(shù)使得數(shù)據(jù)難以查看和理解。例如,你可能用泡泡來代表部門內(nèi)不同的消費水平,但如果泡泡的尺寸差異不合適,會導(dǎo)致誤判和不準確的。
遺漏標注
過度簡化也可能導(dǎo)致缺乏標注。當你提供數(shù)據(jù)時,很容易假設(shè)觀眾已經(jīng)知道圖像的每一個方面代表什么。但添加簡單的注釋可以提高用戶體驗,并確保觀眾明白數(shù)據(jù)中的所有數(shù)據(jù)點。
舉一個例子,你可能用一個圖表來展示企業(yè)在過去十年自行車的銷量。如果數(shù)據(jù)圖表中有一個大的起伏,用注釋解釋一下這個突變背后的原因,能確保觀眾掌握這一額外的信息。
后記
希望上文已經(jīng)向你解釋了數(shù)據(jù)可視化重要性的基本內(nèi)容。許多不同的方法和程序可以幫助你以一種獨特而引人注目的方式展現(xiàn)數(shù)據(jù)。
需要明白的是,在所有這些酷和古怪方法之下,數(shù)據(jù)可視化的根本還是立足于數(shù)據(jù) —— 你需要找到一種能正確、清楚、簡潔地勾勒信息的方法。當你找到了正確的公式,數(shù)據(jù)可視化不僅信息豐富,而且變得賞心悅目了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10