
CDA數(shù)據(jù)分析師 出品
編譯:Mika
我們不斷在創(chuàng)造著大量的數(shù)據(jù)。據(jù)估計,僅在2020年我們就產(chǎn)生了驚人的59澤字節(jié)的數(shù)據(jù)。
隨著如此多的信息四處傳播,數(shù)據(jù)分析已經(jīng)成為一個不可或缺的專業(yè)領(lǐng)域,這并不令人驚訝。
而這其中的一個關(guān)鍵部分就是數(shù)據(jù)可視化。
用圖表表示數(shù)據(jù),能夠使我們發(fā)現(xiàn)新的見解,進行高層次的分析,并以清晰、簡潔的方式傳達(dá)我們的發(fā)現(xiàn),同時這還是一種藝術(shù)形式。
在本文中,我們將列舉出2021年度那些令人驚艷的可視化作品與你分享。
如前所述,人類在2020年創(chuàng)造了大約59澤字節(jié)的數(shù)據(jù)。要知道,人類在2010年代中期創(chuàng)造的數(shù)據(jù)才達(dá)到1澤字節(jié),這是一個令人難以置信的數(shù)量。隨著世界范圍內(nèi)數(shù)字化連接趨勢越來于強,我們的數(shù)據(jù)生產(chǎn)速度只會更快。
1澤字節(jié)相當(dāng)于六億個字節(jié),到底是個什么概念呢?不妨看看下圖。
(來源:The Guardian / Cisco)
上述可視化無疑使我們更容易理解1澤字節(jié)到底有多么龐大,這就是數(shù)據(jù)可視化的力量。
隨著我們產(chǎn)生的數(shù)據(jù)量不斷增長,需要更復(fù)雜的可視化技術(shù)來理解它。一種越來越流行的數(shù)據(jù)形式是網(wǎng)絡(luò)圖,這讓我們繪制許多不同點或節(jié)點之間的關(guān)系。對于描繪可視化中出現(xiàn)的連接或群體,網(wǎng)絡(luò)圖是非常不錯的選擇。
(來源: Kirill Benzi )
這個醒目的網(wǎng)絡(luò)圖不僅僅是一張漂亮的圖片。它追蹤了《星球大戰(zhàn)》宇宙中的2萬多個角色之間的聯(lián)系。每個角色都由一個節(jié)點代表。
其中紅色代表力量的黑暗面;藍(lán)色代表光明面;黃色表示罪犯和賞金獵人??偣灿谐^66,000個連接,這恰恰顯示了網(wǎng)絡(luò)圖可以有多么強大。
隨著智能手機能追蹤人們的行動,標(biāo)記位置的數(shù)據(jù)正迅速成為一種普遍現(xiàn)象。這在新冠疫情期間被證明特別重要,因為各國爭先恐后地跟蹤和追查潛在的感染鏈。在這個例子中,數(shù)據(jù)可視化軟件供應(yīng)商Tectonix向我們展示了特定位置數(shù)據(jù)地圖的潛力。
(來源:YouTube / Tectonix GEO )
這個可視化圖顯示了2020年春假期間在佛羅里達(dá)州收集的手機定位數(shù)據(jù)。每個手機信號都由一個紅色節(jié)點代表。紅色節(jié)點表示有很多人在享受春假。藍(lán)色強調(diào)的區(qū)域是勞德代爾堡的一個海灘。
(來源:New York Times / Tectonix GEO )
通過追蹤該海灘上的每個節(jié)點,Tectonix顯示了春假結(jié)束時個人旅行的確切地點。因此,我們可以很容易地看到來自該海灘的個人可能已經(jīng)傳播新冠疫情的距離和范圍。
雖然有些可視化使用3D元素來增加一點亮點,但最好的可視化是充分地利用三維空間。位于英國的數(shù)據(jù)分析公司Automatic Knowledge Ltd.的創(chuàng)始人Alasdair Rae在這一可視化過程中完美地說明了這一點。
(來源:Alisdair Rae / statsmapsnpix.com )
利用歐盟免費提供的GHS_POP數(shù)據(jù),這些圖片顯示了整個歐洲的人口密度。該地圖被分解成1公里×1公里的方塊,條形高度代表了生活在每個地區(qū)的人口數(shù)量。除了提供引人注目的效果圖外,我們還可以一目了然地看到哪里是人口最密集的地區(qū)。例如,巴黎、倫敦、馬德里和羅馬都脫穎而出。
如果沒有與數(shù)據(jù)分析相關(guān)的主題,那么這篇文章是不完整的。
考慮到這一點,下面這個圖表就通過氣泡圖和循環(huán)網(wǎng)絡(luò)圖顯示了在CRAN上300個包中使用的流行編程語言。
(來源: Dr Torsten Sprenger / GitHub )
通過從TIOBE指數(shù)(衡量編程語言的流行程度)中獲得的數(shù)據(jù),這個可視化顯示了哪些CRAN軟件包是用哪些語言創(chuàng)建的。其中R排在首位,其次是C和C++。不太流行的語言用小圓圈表示。每個圓圈的大小與制作軟件包所用的代碼行數(shù)成正比。
好的數(shù)據(jù)可視化不需要太過華麗。
如果數(shù)據(jù)可能被用來幫助政府政策或決策,那么表述清晰是至關(guān)重要的。而折線圖就是能清晰、簡單地繪制時間序列數(shù)據(jù)的一個優(yōu)秀工具。
(來源:UNEP GRID )
這張線圖追蹤了從1880年到2010年代末的全球表面溫度。重要的是,它包括來自四個不同來源的數(shù)據(jù)。NASA、NOAA、日本氣象局和MetOffice。通過疊加這四個來源的數(shù)據(jù),不難注意到當(dāng)中的密切相關(guān)性,它們均顯示了在過去200年里全球表面溫度在不斷上升。
可視化不應(yīng)該為了互動而互動。然而,互動性也可以改變我們看待數(shù)據(jù)的方式。Gov | DNA是一個獲獎的在線互動網(wǎng)絡(luò)工具,探討了世界各國政府?dāng)?shù)據(jù)。
(來源:Werner Helmich )
該工具將每個國家表現(xiàn)為一個氣泡,讓你通過點擊按鈕來比較不同的國家。例如,你可以根據(jù)就業(yè)、預(yù)期壽命、新聞自由和腐敗等變量追蹤每個國家的世界幸福指數(shù)。
流圖是一種面積圖,通常用于比較時間序列數(shù)據(jù)。雖然并不總是適合進行深入分析,但它們非常適合提供廣泛的概述。
(來源:Talia Bronshtein / insightfulinteraction.com )
由數(shù)據(jù)記者Talia Bronshtein創(chuàng)作的這幅美麗的流程圖描繪了200多年(1820年至2015年)來美國不同移民的國籍。
從中,我們可以看到,在二戰(zhàn)期間(1939-1945年),美國的移民幾乎停止了。還可以看到,二戰(zhàn)前的大多數(shù)移民來自奧匈帝國、意大利和俄羅斯等國;到21世紀(jì)末,大部分移民來自亞洲和南美國家。
數(shù)據(jù)可視化不僅僅是用于數(shù)據(jù)分析,可以是一種藝術(shù)形式。
2010年,藝術(shù)家Janet Echelman被委托創(chuàng)作一個圖,代表西半球35個國家的相互聯(lián)系。那一年,智利發(fā)生了大地震。這一事件的震級如此之大,以至于引發(fā)了一場巨大的海嘯,使地球的一天縮短了1.26微秒。
(來源:NOAA / PMEL / Center for Tsunami Research )
這張圖片顯示了由美國國家海洋和大氣管理局(NOAA)模擬的地震引起的海嘯的熱圖。Janet Echelman以此為靈感創(chuàng)作了她的雕塑,她用不同顏色的繩子懸掛在一個輕巧的框架上。
(來源:Janet Echelman )
隨后的雕塑名為1.26,這也證明了據(jù)分析可以和任何藝術(shù)領(lǐng)域一樣具有創(chuàng)造性。
2021,知名大數(shù)據(jù)網(wǎng)站FiveThirtyEight用精美的數(shù)據(jù)可視化講述了關(guān)于新冠疫情、政治局勢和體育界的故事。
這里我們列舉了當(dāng)中一些非常驚艷的可視化作品分享給大家。
新冠
美國不愿意接種疫苗人群數(shù)據(jù)
大多數(shù)未接種疫苗的美國人認(rèn)為疫苗的風(fēng)險比感染新冠更大
白人孩子最不害怕新冠
政治
加州的罷免程序比大多數(shù)州都容易
通貨膨脹率上升給美國總統(tǒng)的支持率帶來影響
重新劃分選區(qū)的最新情況
科學(xué)
美國大型城市引領(lǐng)可再生能源的發(fā)展
美國各地的高溫,西部地區(qū)的火災(zāi)和干旱情況
15年調(diào)整平均值和記錄的大西洋盆地颶風(fēng)數(shù)據(jù),1851-2019
東京奧運會
沒有人能接近博爾特最佳時期的成績
奧林匹克運動會競賽項目年表1896-2020年
輪椅運動員在長跑中更能展現(xiàn)出優(yōu)勢
體育
世界象棋桂冠爭奪賽
更快并不一定意味著更好
金州勇士隊保持明星陣容
Matt Araiza的賽場罰球數(shù)據(jù)
LeBron James三分球數(shù)據(jù)
Patrick Mahomes 輕松投出長球
參考鏈接:
https://careerfoundry.com/en/blog/data-analytics/data-visualization-examples/
https://fivethirtyeight.com/features/our-51-best-and-weirdest-charts-of-2021/
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03