
遇見大數(shù)據(jù)可視化: 未來已來,變革中的數(shù)據(jù)可視化
今天,大數(shù)據(jù)已無所不在,并且正被越來越廣泛的被應(yīng)用到歷史、政治、科學(xué)、經(jīng)濟、商業(yè)甚至滲透到我們生活的方方面面中,獲取的渠道也越來越便利。通過本系列的前面幾篇文章,我們已經(jīng)了解了數(shù)據(jù)可視化的必要性,而目前市面上也已經(jīng)具備了非常多成熟的BI繪制工具,如Tableau,QlikView和魔鏡等等。雖然這些工具正在變得越來越自動化,然而,隨著大數(shù)據(jù)時代的來臨,信息每天都在以爆炸式的速度增長,其復(fù)雜性也越來越高;其次,隨著越來越多科學(xué)可視化的需求產(chǎn)生,地圖、3D物理結(jié)構(gòu)等技術(shù)將會被更加廣泛的使用。所以,當(dāng)人類的認知能力越發(fā)受到傳統(tǒng)可視化形式的限制時,隱藏在大數(shù)據(jù)背后的價值就難以發(fā)揮出來,如果因為展示形式的限制導(dǎo)致數(shù)據(jù)的可讀性和及時性降低,從而影響用戶的理解和決策的快速實施,那么,數(shù)據(jù)可視化將失去其價值。
然而,所幸的是,技術(shù)的快速發(fā)展和不斷變化的認知框架正在為人類打開新的視野,促使藝術(shù)與技術(shù)相結(jié)合而產(chǎn)生新型的數(shù)據(jù)可視化形式。
數(shù)據(jù)可視化的演變歷史
一.為什么數(shù)據(jù)可視化形式亟待改進
我們每天都在說大數(shù)據(jù),那數(shù)據(jù)到底能“大”到怎樣的程度?也許你已經(jīng)聽說過以下結(jié)論:世界上90%的數(shù)據(jù)是在過去幾年內(nèi)產(chǎn)生的。事實上,過去三十年中,全世界的數(shù)據(jù)量大約每兩年增加10倍,有專家估計,到2020年的時候,數(shù)據(jù)的年度產(chǎn)出量會達到4300%甚至更多,這已遠遠超出了著名的摩爾定律理論;所以,面臨著這樣的巨大挑戰(zhàn),大數(shù)據(jù)的時代的數(shù)據(jù)可視化給我們提出了以下要求:
1.以更細化的形式表達數(shù)據(jù)
首先,讓我們來看一個相對簡單的靜態(tài)可視化圖表:
圖1.不安全流產(chǎn)率百分比估計(SciDev.Net 2016)
再來是一個更復(fù)雜的可視化圖表:
圖2.1986到2013年間172個國家的移動電話、固話和互聯(lián)網(wǎng)的訂購數(shù)量與容量(SciDev.Net 2015)
圖1是一個數(shù)據(jù)量較少的靜態(tài)可視化圖表,我們可以通過4根柱狀圖的對比快速得到信息,而顯而易見的,圖2的數(shù)據(jù)量大大超出了圖1,不僅有一百多個國家的數(shù)據(jù)變化,還包含不同的年份對比。更龐雜的數(shù)據(jù)量要求設(shè)計者通過更加細化的方式來呈現(xiàn)數(shù)據(jù),所以我們可以看到圖2以折線圖為基礎(chǔ),結(jié)合了氣泡的動態(tài)變化、語音說明,還包括讓讀者通過交互操作來選擇展示哪些數(shù)據(jù),才得以恰當(dāng)和全面地展示這份數(shù)據(jù),從而更完整的講述一個故事。
2.以更全面的維度理解數(shù)據(jù)
“隨著大數(shù)據(jù)技術(shù)成為我們生活的一部分,我們應(yīng)該開始從一個比以前更大更去全面的角度來理解事物?!?
這句話來自《大數(shù)據(jù)時代》,作者的原意是在大數(shù)據(jù)時代我們應(yīng)該舍棄對數(shù)據(jù)精確性的要求,而去接受更全面但是也更混雜的數(shù)據(jù),筆者認為它同樣可以用來形容未來在數(shù)據(jù)可視化方面可以進步的方向。
眾所周知,人類的視覺認知能力是有限的,類似下圖這樣的高密度可視化圖形,雖然看似豐富和具有“藝術(shù)感”,可中間重疊連接的數(shù)據(jù)往往導(dǎo)致圖形變得復(fù)雜和難以理解。
每個節(jié)點代表一個Wiki頁面,每一根線代表頁面之間的連接(維基百科鏈接結(jié)構(gòu)可視化)
但是如果像下面這兩個宇宙科普項目這樣:你可以通過放大或縮小星系、調(diào)整視角、甚至像飛進了這些星球之間一樣去觀察它們,點擊它們查看詳細介紹等等……這樣一個更”立體”的數(shù)據(jù)展示是否能更好的幫助你去理解這些信息呢?
通過交互式3D可視化展示探索宇宙中超過十萬顆星球(100000 Stars)
通過手勢識別設(shè)備來探索開普勒計劃目前已確認的近2300個候選系外行星(視頻地址)
如今,人們逐漸已不再滿足于平面和靜態(tài)的數(shù)據(jù)可視化視覺體驗,而是越發(fā)想要“更深入”去理解一份數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)可視化圖表已不再是唯一的表現(xiàn)形式,現(xiàn)代媒介和技術(shù)的多樣性,使人們感知數(shù)據(jù)的方式也更加多元。
3.以更美的方式呈現(xiàn)數(shù)據(jù)
藝術(shù)和數(shù)據(jù)可視化之間一直有著很深的聯(lián)系,隨著數(shù)據(jù)的指數(shù)級增長和技術(shù)的日趨成熟,一方面,用戶們對可視化的美學(xué)標準提出越來越高的要求;另一方面,藝術(shù)家和設(shè)計師們也可以采用越來越創(chuàng)造性的方式來表現(xiàn)數(shù)據(jù),使可視化更加具有沖擊力。 縱觀歷史,隨著人們接受并習(xí)慣了一種新的發(fā)明后,接下來就是對其進行一步步的優(yōu)化和美化,以配合時代的要求, 數(shù)據(jù)可視化也是如此,因為它正在變得司空見慣,良好的閱讀體驗和視覺表現(xiàn)將成為其與競品所區(qū)分的特征之一。
CNN ECOSPHERE項目將 “里約+20”地球峰會期間的Twitter話題匯集成星球上的一顆顆大樹(視頻地址)
二.大數(shù)據(jù)時代的數(shù)據(jù)可視化具有哪些特征
在這里,筆者大概將其整理歸納為以下三點,當(dāng)然它們并非都是必備特征:
三.典型應(yīng)用場景
那么,這些運用新技術(shù)的數(shù)據(jù)可視化目前主要是在哪些場景和形式下使用呢?
1.大屏
首先,不得不提到的一定的是大屏了。什么是大屏?顧名思義,就是指通過整個超大尺寸的LED屏幕來展示關(guān)鍵數(shù)據(jù)內(nèi)容。隨著許多企業(yè)的數(shù)據(jù)積累和數(shù)據(jù)可視化的普及,大屏數(shù)據(jù)可視化需求正在逐步擴大,例如一些監(jiān)控中心、指揮調(diào)度中心這樣需要依據(jù)實時數(shù)據(jù)快速做出決策的場所,以及如企業(yè)展廳、展覽中心之類以數(shù)據(jù)展示為主的展示場所,還有如電商平臺在大促活動時對外公布實時銷售數(shù)據(jù)來作為廣告公關(guān)手段等等,而具體的展示形式又可能分為帶觸摸等交互式操作或只是作單向的信息展示等等。
雙十一購物狂歡節(jié)采用實時數(shù)據(jù)大屏,帶給觀眾更加準確、震撼和清晰的體驗
2.觸摸屏
作為實現(xiàn)交互式數(shù)據(jù)可視化的方式之一,觸屏設(shè)備常常用作控制大屏展示內(nèi)容的操作設(shè)備(其中也包括手機和平板),也可以兼顧顯示和操作一體來單獨展示數(shù)據(jù),大大增加了用戶與數(shù)據(jù)之間的互動程度。
將觸摸屏與3D可視化相結(jié)合的微軟黑科技(視頻地址)
3.網(wǎng)頁
目前應(yīng)用于數(shù)據(jù)可視化方面的網(wǎng)頁技術(shù)可以說是琳瑯滿目,如D3.js、Processing.js、Three.js、ECharts(來自百度EFE數(shù)據(jù)可視化團隊)等等,這些工具都能很好的實現(xiàn)各類圖表樣式,而Three.js作為WebGL的一個第三方庫則相對更側(cè)重于3D方向的展示。
1992-2010年內(nèi)世界小型武器和彈藥的進出口貿(mào)易數(shù)據(jù)展示(armsglobe.chromeexperiments.com)
4.視頻
有數(shù)據(jù)顯示,人們的平均注意力集中時間已從2008年的12秒下降到2015年的8秒,這并不奇怪,當(dāng)我們在面對越來越多的信息來源時,會自然傾向于選擇更快捷的方法來獲取信息,而人類作為視覺動物天生就容易被移動的物體吸引,所以視頻也是數(shù)據(jù)可視化的有效展示手段之一,并且視頻受到展示平臺的限制更少,可以應(yīng)用的場景也更廣。不過因為其不可交互的特性,視頻展示更適合將數(shù)據(jù)與更真實、更藝術(shù)的視覺效果相結(jié)合,預(yù)先編排成一個個引人入勝的故事向用戶娓娓道來。
地球交通路線發(fā)展史(視頻地址)
四.數(shù)據(jù)可視化的未來
可惜,僅有以上這些展示方式是不夠的,人眼僅僅透過平面的屏幕來接收信息仍然存在著限制,VR、AR、MR、全息投影…這些當(dāng)下最火熱的技術(shù)已經(jīng)被應(yīng)用到游戲、房地產(chǎn)、教育等各行各業(yè),可以預(yù)見的是數(shù)據(jù)可視化也能與這些技術(shù)擦出有趣的火花,比如帶來更真實的感官體驗和更接近現(xiàn)實的交互方式,使用戶可以完全“沉浸”到數(shù)據(jù)之中??梢韵胂笠幌?,當(dāng)我們可以以360?全方位的角度去觀看、控制、觸摸這些數(shù)據(jù)時,這種沖擊力自然比面對一個個僅僅配著冷冰冰的數(shù)字的柱狀圖要強得多。而在不遠的未來,觸覺、嗅覺甚至味覺,都可能成為我們接受數(shù)據(jù)和信息的感知方式。
DeathTools將新聞事件中抽象的死亡人數(shù)數(shù)據(jù)變成一具具尸體擺放在VR空間中,給用戶更直觀的沖擊(視頻地址)
結(jié)語
感謝技術(shù)的飛速發(fā)展帶給了我們更多元的選擇,使我們可以運用前所未有的創(chuàng)造性方式來展示數(shù)據(jù), 但這并不意味著傳統(tǒng)的數(shù)據(jù)可視化形式會逐漸消亡,畢竟這些新的展示技術(shù)和形式目前仍然面臨著較高的制作成本,而傳統(tǒng)的展示形式仍然是解決需要快速輸出的可視化需求時的理想選擇。數(shù)據(jù)可視化是一門同時結(jié)合了科學(xué)、設(shè)計和藝術(shù)的復(fù)雜學(xué)科,其核心意義始終在于清晰的敘述和藝術(shù)化的呈現(xiàn),這些需要依靠數(shù)據(jù)分析師和設(shè)計師的精心策劃而不是僅有炫酷的效果 ,最終達到幫助用戶理解數(shù)據(jù)和做出決策的目標,才能發(fā)揮它巨大的價值和無限的潛力。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10