
別讓大數(shù)據(jù)之花自開自落
對于企業(yè)來說,那些不被感知的大數(shù)據(jù),是不是也如山中花,可以當它不存在呢?
明代大儒王陽明主張“心外更無物”,他與友人有過一段精彩的對話:
先生游南鎮(zhèn),一友指巖中花樹問曰:“天下無心外之物,如此花樹,在深山中自開自落,于我心亦何相關(guān)?”先生曰:“你未看此花時,此花與汝心同歸于寂;你來看此花時,此花顏色一時明白起來,便知此花不在你的心外。”
——《傳習錄·黃省曾錄》
后人將這一“山中花”的譬喻與英國大主教喬治 ?貝克萊(George Berkeley) “存在就是被感知”這一哲學命題相對照,發(fā)現(xiàn)其內(nèi)在有相通性。
這一命題在哲學界爭議很大,但是今天不是要討論哲學,而是想探討一個類似的大數(shù)據(jù)問題:當前,很多企業(yè)在生產(chǎn)經(jīng)營過程中產(chǎn)生和積累了大量的數(shù)據(jù)。從發(fā)展趨勢看,不管企業(yè)數(shù)據(jù)處理能力提升到多么強,總是跟不上數(shù)據(jù)總量增加速度。必然導致的結(jié)果就是:很多數(shù)據(jù)將變成為無人到達的山中靜靜開放的花朵,美麗,卻無人欣賞。因此,對于企業(yè)來說,那些不被感知的大數(shù)據(jù),是不是也如山中花,可以當它不存在呢?
很可惜的是,與自開自榭的山花不同,對于企業(yè)來說,大數(shù)據(jù)即便不被感知,它也確實地存在著。
原因只有一個:不被感知的數(shù)據(jù),與可感知的數(shù)據(jù)一樣在消耗企業(yè)大量資源,存在無法忽視的成本。這一成本主要來自三個方面:資金成本、閑置成本,以及注意力成本。
資金成本很好理解,企業(yè)必須圍繞大數(shù)據(jù)投入資金自建或租借相應(yīng)的基礎(chǔ)設(shè)施,配備技術(shù)人員。數(shù)據(jù)大量收集之后,在不知道哪些有用,哪些沒用的情況下,就像企業(yè)漫天打廣告,至少要浪費一半的錢??紤]到多數(shù)企業(yè)實際利用的數(shù)據(jù)只占其少部分,這種浪費可能超過了一半。
閑置成本是指很多數(shù)據(jù)本是有價值的,但是由于配置不當,不得其位,不能及時到達需要它的地方所導致的成本。它是一種機會成本,就像人們?nèi)绻熏F(xiàn)金都放在家里,所損失的是至少是銀行利息一樣。
另一個常常被忽視的成本是企業(yè)注意力的無謂消耗。當大數(shù)據(jù)洶涌而來,企業(yè)人員的注意力并沒有作好準備,大數(shù)據(jù)會大量消耗企業(yè)稀缺的注意力資源。與外部世界的劇烈變化相比,人的進化無疑是停滯不前的。如《淺薄》一書作者尼古拉斯?卡爾認為,隨著各類數(shù)字化技術(shù),尤其是谷歌的廣泛應(yīng)用,人類的認知力有退化的趨勢,人會變得越來越淺薄。
人的注意力存在的閾值包括:一般可以同時聚焦 3-5個關(guān)鍵詞;短期記憶7± 2個數(shù)字;一個領(lǐng)導最好接受 6個左右下屬的匯報;個人交友的“鄧巴數(shù)字”為 150個以內(nèi)等等。大量無用的數(shù)據(jù)分散了人的注意力,直接降低了知識員工的工作效率,成為知識組織的大敵。
今天很多人都同意,數(shù)據(jù)是企業(yè)的一種戰(zhàn)略性資產(chǎn)。這句話表面上是說數(shù)據(jù)可以支撐戰(zhàn)略,對于企業(yè)戰(zhàn)略是重要的。但未能明白表達的意思是:戰(zhàn)略性資產(chǎn)很多未必是用于當下,而是為了應(yīng)對未來的不確定性。更為重要的,戰(zhàn)略性資產(chǎn)的配備是有成本的。如果資產(chǎn)的戰(zhàn)略性價值長期不能覆蓋其成本,那就可能轉(zhuǎn)化為戰(zhàn)略性負債。
因此,企業(yè)不能只看到事情的一面,還應(yīng)該關(guān)注如何盡量降低以上三大類數(shù)據(jù)成本——它同樣具有戰(zhàn)略重要性。以下對此逐個討論。
隨著數(shù)據(jù)量的增加,對企業(yè)數(shù)據(jù)處理能力的提升要求變得越來越高。企業(yè)需要不斷提升基礎(chǔ)設(shè)施的配置水平,配備更強大的技術(shù)力量。而當所有企業(yè)都認為大數(shù)據(jù)具有戰(zhàn)略重要性,這種技術(shù)和人員配備就成為一種競爭必需品。盡管硬件單位成本趨于下降,但是總成本很難節(jié)約下來。計算機產(chǎn)業(yè)有一個有名的“安迪 -比爾定律”,意思是比爾·蓋茨(微軟前總裁)要拿走安迪·格魯夫(英特爾前總裁 )所給的。換句話說,應(yīng)用程序?qū)τ布壍男枨髸窒布杀鞠陆到o用戶帶來的好處。云計算的出現(xiàn)看來也未能改變這一法則,它今天仍然在起作用,只是換了Google和高通等不同主導企業(yè)而已。企業(yè)在數(shù)據(jù)基礎(chǔ)設(shè)施方面的投入只會逐漸升級,此塊成本降低顯然并非易事。
再來看看數(shù)據(jù)資源閑置成本,這一成本來源于內(nèi)部流程和數(shù)據(jù)共享的不暢,需要企業(yè)建立端到端的業(yè)務(wù)流程,同時將數(shù)據(jù)盡可能加以共享。數(shù)據(jù)共享與流程優(yōu)化之間存在互動的關(guān)系,二者相輔相成。
一方面,數(shù)據(jù)共享可以改造和優(yōu)化流程。孤立的數(shù)據(jù)資源基本上是沒有價值的,只有將其連成一片,才可能形成對企業(yè)有用的信息和知識,這些知識可以促進流程優(yōu)化。另一方面,如果能從業(yè)務(wù)流程的優(yōu)化和暢通著手,對不同環(huán)節(jié)的數(shù)據(jù)需求進行分析,也可以對組織進一步共享數(shù)據(jù)形成強大的推動力。
如果說前兩方面成本的節(jié)約仍然是著眼于運營層面,注意力成本的節(jié)約需要企業(yè)上升到戰(zhàn)略層面。如前所述,相對于數(shù)據(jù)量的增長,企業(yè)的注意力資源總是相對稀缺的。這構(gòu)成了企業(yè)大數(shù)據(jù)管理中一對核心的矛盾。要解開這一矛盾,必須從兩個方面著力:
一是盡量提升企業(yè)的數(shù)據(jù)處理能力。這正是前述技術(shù)和流程兩方面的工作重點。二是努力降低數(shù)據(jù)處理需求,這需要通過戰(zhàn)略的引領(lǐng)和注意力聚焦,讓大量數(shù)據(jù)處理變得不必要。在大數(shù)據(jù)戰(zhàn)略指引下,企業(yè)將注意力聚焦于有限的數(shù)據(jù)范圍,通過收集特定種類的數(shù)據(jù),降低大數(shù)據(jù)所導致的注意力成本。同時也能讓數(shù)據(jù)各就其位,減少數(shù)據(jù)收集和閑置成本。
從戰(zhàn)略層面著手的方法無疑更加巧妙,但是并不輕松。它需要企業(yè)在當前劇變環(huán)境中,探索出一條相對明確的發(fā)展路徑。在此基礎(chǔ)上,將其轉(zhuǎn)化為企業(yè)的數(shù)據(jù)戰(zhàn)略。從而企業(yè)可以從被動接受外部數(shù)據(jù)“灌輸”上升到主動地“養(yǎng)數(shù)據(jù)”(車品覺語)。將企業(yè)從數(shù)據(jù)的汪洋大海中解救出來,實現(xiàn)數(shù)據(jù)的“精兵簡政”,連線成面,使之個個能戰(zhàn)斗。只有這樣,大數(shù)據(jù)才真正成為了企業(yè)的戰(zhàn)略性資產(chǎn)。
正因為不被感知的大數(shù)據(jù)具有以上三類不可忽視的成本,所以它不完全是王陽明所說心外的“山中花”。為了降低成本,企業(yè)首先要建構(gòu)一個相對精簡而聚焦的數(shù)據(jù)戰(zhàn)略,任它漫山遍野,只顧聚焦于特定山坡的幾種花,如百合,杜鵑等,定向栽培。更輔之以知識和智慧之光的燭照,讓大數(shù)據(jù)之花的顏色變得“明白起來”。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10