
數(shù)據(jù)可視化方法、工具、核心理念及需要警惕的深坑
大數(shù)據(jù)是當(dāng)下最火爆的話題之一。隨之而來的,是數(shù)據(jù)可視化技術(shù)的持續(xù)發(fā)展,它用來展現(xiàn)和闡釋大規(guī)模的數(shù)據(jù)。但是數(shù)據(jù)可視化技術(shù)并非千篇一律。
數(shù)據(jù)可視化是展現(xiàn)數(shù)據(jù)的最強大機制之一,技術(shù)上的優(yōu)勢也為其創(chuàng)造了獨特的實現(xiàn)方法。隨著交互式的、獨特的數(shù)據(jù)可視化方法逐漸走向最前沿,并且觀眾也越來越明白他們自己的喜好和厭惡,那些繪制簡單餅狀圖的日子將一去不復(fù)返。
接下去我們將向你介紹數(shù)據(jù)可視化的重要性,不同的數(shù)據(jù)展現(xiàn)方式以及業(yè)界常用的工具。你也將會了解贏得數(shù)據(jù)可視化技巧背后的核心理念和你需要避免的錯誤。
從本文中你將會學(xué)到:1、數(shù)據(jù)可視化是什么;2、數(shù)據(jù)可視化為什么重要;3、存在哪些數(shù)據(jù)可視化方法;4、贏得數(shù)據(jù)可視化背后的關(guān)鍵理念;5、完成數(shù)據(jù)可視化時需要避免的深坑。
數(shù)據(jù)可視化是什么?
數(shù)據(jù)可視化是研究如何將數(shù)據(jù)以圖片或圖形的方式展現(xiàn)的科學(xué)。它主要專注于展現(xiàn),以連貫和簡短的形式把大量的信息展現(xiàn)出來。盡管數(shù)據(jù)可視化也能處理書面信息,它的重點還是用圖片和圖像的形式向觀眾傳遞信息。
此外,數(shù)據(jù)可視化技術(shù)在數(shù)據(jù)的用法上并不狹窄。它可以可視化各種信息——你可以向其它人傳遞你的理念和假設(shè)。如今甚至可以對數(shù)據(jù)可視化添加技術(shù)和選擇交互式的可視化方法。
信息的視覺表達是一種古老的思維和經(jīng)驗的分享方式。例如,圖表和地圖就是一些早期數(shù)據(jù)可視化技術(shù)的重要例證。
數(shù)據(jù)可視化為什么重要?
如上所述,人類使用數(shù)據(jù)可視化技術(shù)已經(jīng)很久了。圖像和圖表已被證明是一種用于交流和學(xué)習(xí)新信息的有效方法。 研究表明,80%的人能記住他們看到的,但只有20%的人記得怎么讀!它甚至可以將思想和事件向后代延續(xù)。技術(shù)的發(fā)展進一步加強了數(shù)據(jù)可視化帶給人們的機會。
也許,數(shù)據(jù)可視化最重要的好處是它能夠幫助人們更快地掌握數(shù)據(jù)。你可以把一大堆數(shù)據(jù)濃縮到一張圖表里,人們也能更快地抓住關(guān)鍵點。如果用書面形式,可能需要幾小時來分析所有的數(shù)據(jù)和建立數(shù)據(jù)的聯(lián)系。
此外,這種能展現(xiàn)大量數(shù)據(jù)的能力是數(shù)據(jù)可視化的另一個巨大優(yōu)勢。一張圖表可能會突出顯示多個方面,人們就能對數(shù)據(jù)形成不同的觀點。這自然能為企業(yè)開辟新的商業(yè)之路。人們或許能從數(shù)據(jù)中發(fā)現(xiàn)一些意想不到的東西。
數(shù)據(jù)的可視化提高了解釋信息的能力。要從大量的數(shù)據(jù)和信息中尋找關(guān)聯(lián)不容易,但是圖和圖表可以在幾秒鐘內(nèi)提供信息。一眼就能辨識出所需的信息。
以上所有都能加強人們在工作和學(xué)習(xí)的溝通和有效性。數(shù)據(jù)可視化普遍被認為是一種簡單而有效的概括數(shù)據(jù)的方法,因此它可以提高人們分享信息和學(xué)習(xí)的方式。
數(shù)據(jù)可視化的各種方法
技術(shù)的發(fā)展已導(dǎo)致 數(shù)據(jù)的爆炸。這反過來又增加了數(shù)據(jù)被展現(xiàn)的方式。通常來說,數(shù)據(jù)可視化主要分為兩種不同的類型:探索(exploration)和解釋(explanation)。探索類型可以幫助人們發(fā)現(xiàn)數(shù)據(jù)背后的故事,而解釋類型把數(shù)據(jù)簡單明了地解釋給觀眾。
另外,有 不同的方法可用于創(chuàng)建這2種類型。最常見的數(shù)據(jù)可視化方法包括:
2D area —— 這種方法使用地理空間數(shù)據(jù)可視化技術(shù),往往與事件在某塊特定區(qū)域的位置相關(guān)。2D area 數(shù)據(jù)可視化的一個例子包括點分布圖,該圖可以顯示某個區(qū)域中的犯罪等信息。
Temporal —— 時間可視化是以線性方式展現(xiàn)數(shù)據(jù)。時間數(shù)據(jù)可視化的關(guān)鍵是有一個開始和一個結(jié)束的時間點。時間可視化的例子可以是一個連接的散點圖,它可以展現(xiàn)諸如某一區(qū)域的溫度等信息。
Multidimensional —— 您還可以通過多維方法將數(shù)據(jù)在兩個或多個維度上展現(xiàn)。這是最常用的方法之一。多維可視化的一個例子是餅圖,它可以展示如政府支出之類的信息。
Hierarchical —— 層次法被用于呈現(xiàn)多組數(shù)據(jù)。這些數(shù)據(jù)的可視化通常在大群體內(nèi)嵌套小的群體。層次化數(shù)據(jù)可視化的例子可以是一個樹圖,它可以展示如語言組團等的信息。
Network —— 數(shù)據(jù)也能以相互關(guān)聯(lián)的網(wǎng)絡(luò)形式被展現(xiàn)。這是另一種展現(xiàn)大量數(shù)據(jù)的常見方法。網(wǎng)絡(luò)數(shù)據(jù)可視化方法的一個例子可以是沖積關(guān)系圖,它可以展示如醫(yī)療行業(yè)的變化等信息。
以上給出了大量的選擇,它不僅給我們提供了大量機會,同時也讓我們?yōu)檫x擇正確的方法感到頭疼。
另外還有 很多數(shù)據(jù)可視化的工具。它們可以很容易地收集數(shù)據(jù),也可以流線化數(shù)據(jù)的使用方式。
一些最常用的工具包括:
Google charts —— 谷歌的產(chǎn)品在數(shù)據(jù)行業(yè)是眾所周知的,谷歌圖表也是一個容易上手的工具,特別是對于初次使用的用戶。
datawrapper—— 這是一個在線工具,它可以幫助你創(chuàng)建交互式數(shù)據(jù)可視化。
RAW —— RAW的好處包括它擁有大量現(xiàn)成的類型,讓你可以清晰、便捷地展現(xiàn)信息。該平臺是開源的,所以你可以提供自定義布局,或者使用其它的設(shè)計。
Infogram—— Infogram是另一款適合新手的工具。它允許用戶創(chuàng)建不同的圖表和Iinfographs,系統(tǒng)的使用也方便。
可用的工具遠不止這些,你還能找到大量免費和付費的軟件。最好多了解一些信息,以確保你所使用的軟件與被可視化的數(shù)據(jù)最搭配。
贏取數(shù)據(jù)可視化背后的關(guān)鍵概念
見過數(shù)據(jù)可視化的人都知道設(shè)計有好壞之分。如果信息不是以正確的、恰當(dāng)?shù)姆绞匠尸F(xiàn),則數(shù)據(jù)可視化的好處就很容易被抵消 —— 具體的項目需要定制的方法。
不管你的信息是什么,在利用數(shù)據(jù)可視化時有一些概念你需要牢記。以下是贏取數(shù)據(jù)可視化技術(shù)背后的關(guān)鍵概念集合。
了解聽眾
在展現(xiàn)數(shù)據(jù)之前,你需要做的第一件事就是了解誰將會看這些數(shù)據(jù)。了解你的聽眾是至關(guān)重要的,以便用正確的方法來展現(xiàn)數(shù)據(jù)。
雖然數(shù)據(jù)可視化通常是一種簡化數(shù)據(jù)的方法,但觀眾對主題的知識層次千差萬別,需要好好做準備。如果你是針對一群專業(yè)的聽眾,那么可以使用更多的專業(yè)方法和專業(yè)術(shù)語來解釋數(shù)據(jù)。然而,對于相同的數(shù)據(jù),普通聽眾可能需要更為通俗的方法來解釋。
同樣,知道聽眾對你的數(shù)據(jù)有何期望也非常重要。你需要知道他們想要從數(shù)據(jù)中獲得什么關(guān)鍵點,以及你展示數(shù)據(jù)的主要目的是什么。此外,還需要記住你展現(xiàn)數(shù)據(jù)的目的是什么。
足夠理解數(shù)據(jù)
除了掌握目標(biāo)受眾外,你還需要對數(shù)據(jù)了如指掌。若是不正確地理解數(shù)據(jù),則很有可能不能把信息有效地傳達給聽眾。
然而你也無法顧及數(shù)據(jù)所包含的所有信息,所以要能夠提取關(guān)鍵的信息,并條理清晰地展現(xiàn)它們。你還需要確保從數(shù)據(jù)中得到的關(guān)聯(lián)信息是正確而不是虛構(gòu)的 —— 決不能用錯誤的數(shù)據(jù)做可視化!
如果你正確地理解了數(shù)據(jù)及其關(guān)聯(lián),則可以從信息中得到獨特而有趣的數(shù)據(jù)關(guān)聯(lián)。
講述一個故事
數(shù)據(jù)可視化還應(yīng)該描繪出一個故事。你一定不希望這些數(shù)據(jù)只是以一組信息的方式來展現(xiàn),而是能傳遞出數(shù)據(jù)使用背后的信息。這可以是不同的描述性介紹,或是為觀眾呈現(xiàn)一幅特定的圖像。
編造一個故事往往意味著觀眾從數(shù)據(jù)中獲得更多的洞察力。它可以幫助觀眾了解新的關(guān)聯(lián)和更深入的信息。
事實上,數(shù)據(jù)可視化技術(shù)是一個出色的講故事工具?!耙粓D勝千言”這句話一點都不錯,你應(yīng)該發(fā)揮它的這項優(yōu)勢。通過數(shù)據(jù)來講故事并不困難,因為你可以把顏色、字體和演示文稿都作為講故事手法的一部分。
為了使數(shù)據(jù)可視化成功地融入故事,上述提到的理解數(shù)據(jù)則是至關(guān)重要的一點。
保持簡潔
近年來,數(shù)據(jù)可視化的發(fā)展很快,正如上面所示,涌現(xiàn)出很多工具和系統(tǒng)供人們使用。能接觸不同的獨特方法并不意味著都要用到它們。而且,大量的數(shù)據(jù)也不意味著所有的信息都是必不可少的。
總之,保持你的數(shù)據(jù)可視化方法簡單明了。不必刻意地使用過多的數(shù)據(jù)或使用過多的技巧。
如果從講故事的角度來看,必須明白你所展現(xiàn)的每一個元素都是故事必不可少的一部分。如果數(shù)據(jù)或元素,如某些事物的圖片,對故事的情節(jié)無關(guān)緊要,那么就不應(yīng)該把它加入進來。
數(shù)據(jù)展示中包含太多的元素實際上會破壞最終的成品,與數(shù)據(jù)脫節(jié)。要記住數(shù)據(jù)可視化的核心之處就是能在一瞬間呈現(xiàn)大量的數(shù)據(jù)。如果可視化顯得很費勁,那么你就要回頭看看是否使用了錯誤的數(shù)據(jù)演示或包含了太多的信息。
合理區(qū)分展現(xiàn)平臺
最后,贏取數(shù)據(jù)可視化技術(shù)也要了解技術(shù)方面。人們現(xiàn)在通過各種不同的平臺查看和訪問信息,這一點必須牢記。就像需要知道目標(biāo)受眾一樣,你也需要考慮人們查看數(shù)據(jù)可視化的方式。
你的可視化結(jié)果要能輕松適應(yīng)多種平臺,如移動設(shè)備,平板電腦或計算機。如果你的用戶只通過手機瀏覽數(shù)據(jù),那么適用于移動端的展現(xiàn)方法自然會對你更有幫助,而不是針對筆記本的方法。
除了考慮平臺的界面選項外,還需要考慮可訪問性(accessibility)問題。如果數(shù)據(jù)可視化允許視覺欠佳的人進行適當(dāng)?shù)姆糯蠛涂s小,可以大大提高用戶體驗。你也可以考慮為色盲人群提供不同顏色選項。 可訪問性旨在提高用戶體驗,確保數(shù)據(jù)可視化可對所有人適用。
數(shù)據(jù)可視化需要避免的大錯誤
盡管以上關(guān)鍵方法能幫你生成贏取數(shù)據(jù)可視化的策略,還有一些常見誤區(qū)要時刻警惕。
錯誤的信息
如上所述,數(shù)據(jù)的錯誤是觀眾最厭惡的東西。你必須確保那些正在看你的數(shù)據(jù)的人獲取到的是正確的數(shù)據(jù)。確保人們可以直接使用你圖表里的數(shù)據(jù),而不必再次確認數(shù)據(jù)正確性,這是你的職責(zé)。
不完整的信息
除了保證信息正確之外,還要呈現(xiàn)完整的數(shù)據(jù)。人們必須能在其中找到相關(guān)信息,不能使用數(shù)據(jù)可視化來欺騙或展現(xiàn)不完整的信息。
數(shù)據(jù)可視化能夠而且應(yīng)該講述一個故事,但故事需要包含完整和正確的信息,而不是只展示你認為合適的數(shù)據(jù)。
過于簡化數(shù)據(jù)
盡管要確保數(shù)據(jù)是以簡單的方式展現(xiàn),這并不意味著你應(yīng)該簡化它。首先,你需要記住觀眾是誰 —— 對專業(yè)人士不要使用通俗和過于簡化的語言。而如果是普通的觀眾,就不要用專業(yè)術(shù)語來填充文字。
但除此之外,若是你未能清晰地展現(xiàn)數(shù)據(jù),也就不能期望聽眾能清楚地了解它們之間的關(guān)系。不能因為對你來說鏈接似乎很明顯了,就省略部分信息 —— 記住觀眾只能看到你所展示的這部分數(shù)據(jù),而不是你所使用的完整數(shù)據(jù)集!
不恰當(dāng)?shù)目梢暬?/span>
在展現(xiàn)數(shù)據(jù)時,你需要仔細思考數(shù)據(jù)展現(xiàn)的方式。如字體,顏色和圖像之類的屬性很總要。例如,如果展示由特定疾病而導(dǎo)致死亡的信息時,使用鮮艷的色彩和令人愉快的圖像似乎不協(xié)調(diào)。
不適當(dāng)?shù)目梢暬舶ㄊ褂玫募夹g(shù)使得數(shù)據(jù)難以查看和理解。例如,你可能用泡泡來代表部門內(nèi)不同的消費水平,但如果泡泡的尺寸差異不合適,會導(dǎo)致誤判和不準確的。
遺漏標(biāo)注
過度簡化也可能導(dǎo)致缺乏標(biāo)注。當(dāng)你提供數(shù)據(jù)時,很容易假設(shè)觀眾已經(jīng)知道圖像的每一個方面代表什么。但添加簡單的注釋可以提高用戶體驗,并確保觀眾明白數(shù)據(jù)中的所有數(shù)據(jù)點。
舉一個例子,你可能用一個圖表來展示企業(yè)在過去十年自行車的銷量。如果數(shù)據(jù)圖表中有一個大的起伏,用注釋解釋一下這個突變背后的原因,能確保觀眾掌握這一額外的信息。
后記
希望上文已經(jīng)向你解釋了數(shù)據(jù)可視化重要性的基本內(nèi)容。許多不同的方法和程序可以幫助你以一種獨特而引人注目的方式展現(xiàn)數(shù)據(jù)。
需要明白的是,在所有這些酷和古怪方法之下,數(shù)據(jù)可視化的根本還是立足于數(shù)據(jù) —— 你需要找到一種能正確、清楚、簡潔地勾勒信息的方法。當(dāng)你找到了正確的公式,數(shù)據(jù)可視化不僅信息豐富,而且變得賞心悅目了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03