
大數(shù)據(jù)與可視化的重要性
什么是大數(shù)據(jù)?數(shù)據(jù)可視化如何幫助企業(yè)更好地利用數(shù)據(jù)資源?一些人知道大數(shù)據(jù)的真正含義,然而其他人聲稱自己懂大數(shù)據(jù),只是為了讓他們看起來并不低人一等。盡管大數(shù)據(jù)是一個(gè)熱門話題,但是對許多企業(yè)和數(shù)據(jù)專業(yè)人員來說,它仍然很難理解。Kimberly-Clark的全球總監(jiān)Robert Abate,在“數(shù)據(jù)可視化的智慧”中討論人們對大數(shù)據(jù)的無知。他認(rèn)為,大數(shù)據(jù)話題和大數(shù)據(jù)的神秘就像青少年的人際關(guān)系問題。他說:“每個(gè)人都在討論大數(shù)據(jù),但是沒有人真正地知道如何去處理。這是許多傳言的來源。每個(gè)人都認(rèn)為其他所有人都在研究大數(shù)據(jù),所以都說自己也在研究?!?/span>
然而按定義來說,什么是大數(shù)據(jù)呢?很明顯,大數(shù)據(jù)是指大量的能夠收集、存儲(chǔ)的原始數(shù)據(jù),經(jīng)過各種分析可以揭示企業(yè)的行為模式和發(fā)展趨勢,尤其是消費(fèi)者的。它可以用于最大限度地發(fā)揮業(yè)務(wù)潛力。這就是Robert Abate在演講開始時(shí)明確指出的一點(diǎn)。他說的重點(diǎn)是,通過數(shù)據(jù)可視化能夠有效地利用大數(shù)據(jù)。
為什么大數(shù)據(jù)如此重要?
他說,大數(shù)據(jù)對企業(yè)那么有用是因?yàn)樗梢越o企業(yè)的許多問題提供答案,而這些問題他們先前甚至都不知道。換句話說就是它提供了參考點(diǎn)。有了這樣大的信息量,公司可以用各種它們認(rèn)為合適的方法重新處理數(shù)據(jù)或進(jìn)行測試。這樣,就能用一種更容易理解的方式查明問題。收集大量數(shù)據(jù),并在數(shù)據(jù)中發(fā)現(xiàn)趨勢,使企業(yè)能夠更快、更平穩(wěn)、更有效地發(fā)展。這也可以讓它們在利益和名聲受損之前排除一些問題。
沒有數(shù)據(jù)的幫助,企業(yè)采取的無數(shù)行動(dòng)都可能威脅、損害或徹底毀滅企業(yè)。數(shù)據(jù)就像公司呼吸的空氣。正如人們沒有氧氣不能生存一樣,公司沒有維持生存的必要數(shù)據(jù)也不能存活。沒有這種空氣,公司將會(huì)窒息而死。
每家公司都在使用數(shù)據(jù)。一個(gè)公司使用數(shù)據(jù)越有效,它的潛力就越大。這樣的真理眾所周知,但是據(jù)Abate先生說,許多企業(yè)還沒有真正領(lǐng)悟這簡單的思想:
“我們面臨的一部分挑戰(zhàn)是如何向企業(yè)說明數(shù)據(jù)能夠做什么,業(yè)務(wù)如何成為真正的主題。我們不得不解決如何進(jìn)行數(shù)據(jù)溝通和怎樣與它們創(chuàng)建直接聯(lián)系?!?/span>
大數(shù)據(jù),尤其是跟信息圖表和可視元素用在一起時(shí),能夠更快地得到問題的答案。這是一個(gè)理想,因?yàn)楣緩膩碓粗蝎@取信息越快,獲得答案就越快。他說,只是擁有更多信息并不能產(chǎn)生速度。沒有人處理這些數(shù)據(jù)讓它們更有意義,那么它們?nèi)匀皇窃紨?shù)據(jù),沒有任何價(jià)值。更多的人處理數(shù)據(jù)不等于有更多的優(yōu)勢,同樣,員工越多不會(huì)提高生產(chǎn)力,反而會(huì)阻礙生產(chǎn)效率的提高。
那么企業(yè)應(yīng)該做什么呢?用大數(shù)據(jù)和數(shù)據(jù)可視化提高生產(chǎn)力
如果一個(gè)組織能夠?qū)⒏嗟氖聞?wù)有效地進(jìn)行可視化顯示,那么他們可以提高認(rèn)知能力。Abate先生打比方說,許多人都在工作,他們只使用一臺(tái)電腦顯示器,但一臺(tái)電腦顯示器只能做那么多:它有局限性。這使得個(gè)人不能夠提高他的潛力。如果一個(gè)人有兩臺(tái)電腦顯示器甚至三臺(tái),他們解決各種問題以及得出結(jié)論的能力將會(huì)提高。如果他們有更多的資源,他們也會(huì)更好地利用自己的時(shí)間。當(dāng)涉及到大數(shù)據(jù)時(shí),“一張圖片勝過千言萬語”還不足以說明圖片的重要性。人們很容易地以可視的或物理的角度觀察數(shù)據(jù),它比看表格容易的多。
他給了一個(gè)簡單的解釋:“簡單地說,如果西南部的銷售額下降,人們可以使用另一臺(tái)電腦或電話查到西南地區(qū)的天氣。這樣,人們會(huì)意識到西南部有一場暴風(fēng)雪,這就解釋了為什么這個(gè)星期的銷售額驟然下跌了。因?yàn)楹苊黠@,如果人們不能到達(dá)商店,他們就不會(huì)買東西。”
為什么突然依賴大數(shù)據(jù)?
大量的手機(jī)、平板電腦、翻轉(zhuǎn)電腦、云計(jì)算及傳感器和物聯(lián)網(wǎng)的出現(xiàn),產(chǎn)生了人們不可想像的數(shù)據(jù)量。根據(jù)演講資料的揭示,這兩年產(chǎn)生的數(shù)據(jù)量,超過了此前的歷史上的數(shù)據(jù)量。雖然,20世紀(jì)50年代就有計(jì)算機(jī)網(wǎng)絡(luò),但數(shù)據(jù)量激增是近年的事情,人們將更會(huì)注意到大數(shù)據(jù)的力量。
列舉更多的沖擊值。Abate先生的幻燈片顯示:
每60秒,至少98000條推特出現(xiàn)在推特網(wǎng)上;
每60秒,F(xiàn)acebook更新69500條動(dòng)態(tài);
每60秒,1100萬即時(shí)信息被發(fā)送;
每60秒,有698445條谷歌搜索;
每60秒,至少1億6800萬封電子郵件被發(fā)送;
每60秒,1820TB的數(shù)據(jù)被創(chuàng)建。
這也難怪,為什么過去的兩年時(shí)間里產(chǎn)生的數(shù)據(jù)量,就超過了歷史上其它時(shí)間的總和。
但是,如果沒有方法使信息形成數(shù)據(jù)湖或其它的形式,所有這些信息都是無用的。
充分利用數(shù)據(jù)
了解數(shù)據(jù)具有的特點(diǎn)是成功使用大數(shù)據(jù)的關(guān)鍵。人們都知道“了解你的客戶”,會(huì)使公司營銷有更高的成功率。
他給出了一個(gè)案例,他的團(tuán)隊(duì)幫助他們的客戶整理數(shù)據(jù)。他們從數(shù)據(jù)集中刪除了任何不相關(guān)的或離群的數(shù)據(jù),從而縮小到一個(gè)關(guān)鍵問題或用戶信息統(tǒng)計(jì)。這樣,他們就能分辨出哪一類產(chǎn)品出售的多,哪一類產(chǎn)品沒有出售,因此可能要被淘汰。他們關(guān)注4個(gè)主要的數(shù)據(jù):收入、頻率、價(jià)值、年期。Abate先生強(qiáng)調(diào),同一時(shí)間,在任何給予的可視化范圍內(nèi),超過4個(gè)數(shù)據(jù)就會(huì)讓人更難跟蹤。通過淘汰沒有出售的產(chǎn)品,他們正在減少浪費(fèi)來增加未來的收入。但是沒有數(shù)據(jù)可視化,他們不可能完成這項(xiàng)工作。
數(shù)據(jù)可視化是關(guān)鍵。通過增加數(shù)據(jù)可視化使用,企業(yè)能夠發(fā)現(xiàn)他們追求的價(jià)值。創(chuàng)建更多的信息圖表,使用更多的資源,讓他們更快地獲得更多的信息。這使他們意識到他們已經(jīng)知道很多信息,而這些信息先前就應(yīng)該是很明顯的。這就增加了部門的作用,因?yàn)樗麄兡軌蛱岢龈玫膯栴}。它創(chuàng)建了似乎沒有任何聯(lián)系的數(shù)據(jù)點(diǎn)之間的連接。人們能夠分辨出有用的和沒用的數(shù)據(jù),這樣,就能最大限度的提高他們的生產(chǎn)力,讓信息的價(jià)值最大化。
利用大數(shù)據(jù)資產(chǎn)對任何公司來說都是很重要的,不論公司大小。當(dāng)大數(shù)據(jù)的潛力通過可視化達(dá)到最大時(shí),之前未看到的趨勢就很容易被發(fā)現(xiàn)。正如Abate先生談到的,這些趨勢可以提供“信息”并能轉(zhuǎn)化成有價(jià)值的“見解”,如:誰是他們的客戶,他們有多少客戶,誰是高端客戶,誰是低端客戶等等。
最后,他討論一些關(guān)鍵注意事項(xiàng)。他說,大數(shù)據(jù)可視化是未來的發(fā)展趨勢,使用更多的工具來獲得更多的見解也是必須的。他列舉了一些最佳實(shí)踐方法:建立迭代、每個(gè)圖形最多含4個(gè)主要因素、可視化動(dòng)態(tài)情形、以及預(yù)防極端情況的網(wǎng)絡(luò)規(guī)模升級計(jì)劃。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10