
大數據的價值之路&數據價值之路的幾個里程碑
大數據的4V并不在一個層面
講起大數據,首先的印象就是《大數據時代》這本書中的提出的4V, 海量的數據規(guī)模(volume)、快速的數據流轉和動態(tài)的數據體系(velocity)、多樣的數據類型(variety)和巨大的數據價值(value)。
前三個V直接描述了數據本身的特征, 大數據業(yè)界無數的公司推出了各種存儲和數據處理的解決方案以應對大數據帶來的技術挑戰(zhàn), 初期的淘金者賺的盆滿缽溢,留下了大量存滿數據的機房??墒钦f好的價值呢?
最后一個V實現的并不理想。
以業(yè)界最為聞名遐邇的Palantir公司為例,他的founder是大名鼎鼎的硅谷投資創(chuàng)業(yè)教父,paypal創(chuàng)始人彼得.蒂爾。它第一個客戶和最大的客戶是美國中央情報局CIA,協(xié)助反恐。據說正是依靠他們的協(xié)助,CIA找到了本拉登的蹤跡。Palantir 為此聲名大噪。其最新一輪融資4.5億美元,公司估值在200億美元,是僅次于uber, airbnb和小米的創(chuàng)業(yè)公司。
可是最近的一些爆料Palantir的一系列問題。去年有至少3個重要客戶終止了合同,包括可口可樂,america express, 和納斯達克。這些客戶一方面抱怨公司收費太高,會高達100萬美元每個月,感覺遠遠不值得。而且客戶和公司的年輕工程師合作起來非常頭疼。
Palantir公司上次宣布去年全年的“預約價值”是17億美元,但是實際上最后的收入只有4.5億美元。預約價值是客戶可能要支付的費用,包括很多試用期,免費用戶的合同價值。這兩個數據的巨大差距說明很少一部分客戶最后變成了付費用戶。
Palantir公司情況恰恰彰顯了大數據巨大數據價值獲取并不容易。
大數據中的確隱藏著大量價值,但價值的實現不在于數據分析本身,而在于數據與業(yè)務場景的碰撞。
Palantir的數據實踐中面臨的幾個問題:
1.數據的價值和行業(yè)場景緊密相關, Palantir擅長抓壞人, 通過大量的數據關聯(lián),發(fā)現業(yè)務中的異常,進而通過異常的控制實現數據的價值, 這樣的場景在安全,金融等領域比較適合, 但當推廣到其它場景的時候,效果往往差強人意。深度行業(yè)場景的介入往往需要對行業(yè)的深度介入, 成本高, 周期長。
2.數據及分析人員本身也是成本, 大數據獲取成本, 數據科學家的高額成本,分析工作失敗的機會成本,還有數據價值的體現程度。這些都對大數據項目產生直接影響, 這些成本與價值比能否控制在一定范圍,長期看來,成本是否有線性下降的預期也是企業(yè)決策關鍵因素。
3.工程師的技能與思維能力,數據科學家培養(yǎng)及留住不易, 年輕工程師的培養(yǎng),學習曲線和成本都是需要考慮的點。
數據價值之路的幾個里程碑
Gartner有一個非常簡單和清晰的數據分析和難度的劃分模式從數據分析的難度到數據價值的實現給出了4個層面的定義。這四個層面的定義也非常適合被看作是我們數據價值探索上的4個里程碑。
?描述(Descriptive),解決什么發(fā)生的分析,是相對簡單的分析。 描述性的分析通常需要把大數據沉淀成為更小的,更高價值的信息,通過匯總來對一個已經發(fā)生了事件的提供洞察和報告。
?診斷(Diagnostic),在事件數據描述的基礎上, 提供對原因的深度分析, 通常需要更多維度的數據, 更長時間的數據跨度, 通過關聯(lián)分析發(fā)現事件與數據之間的關聯(lián)關系。
?預測(Predictive),預測性分析通過一系列的統(tǒng)計,建模,數據挖掘和機器學習等技術來學習近期和歷史數據, 幫助分析師對未來做一定的預測。
?規(guī)范分析(Prescriptive),規(guī)范性分析突破了分析并擴展到執(zhí)行階段, 結合了預測,部署, 規(guī)則,多重預測,評分,執(zhí)行和優(yōu)化規(guī)則, 最終形成一個閉環(huán)的決策管理能力。
過去的實踐表明,75%以上的數據分析場景是描述性的分析,大部分企業(yè)已經建立的數據倉庫和BI系統(tǒng)都可以歸于這一場景,日常運營報告,運營儀表盤, 駕駛指揮艙等都屬于這一類的應用的實現。 診斷和預測類分析應用則更多使用在推薦, 運營異常分析等特定場景中, 使用的范圍較小, 效果參差不齊。而規(guī)范分析的場景直接打通了分析與執(zhí)行,目前主要是體現在自動駕駛, 機器人等更為特定業(yè)務場景中。在商業(yè)環(huán)境中, 數據的價值需要的不僅僅是分析, 真正的價值是通過數據分析后的業(yè)務決策和業(yè)務執(zhí)行獲得的。
筆者用下面的這張圖來描繪數據的價值之路, 越是向右,數據體現的業(yè)務價值指數越高, 體現的業(yè)務價值越高。
圖中淺綠和深綠的部分是大量的人工參與過程, 幫助對前面數據分析的過程和結果進行進一步的人工處理和加工。在過去IT主導的時代這兩個部分往往由IT部門承擔,被業(yè)務需求驅動,實施的效果不好,還往往成為業(yè)務部門詬病的對象。大數據時代,業(yè)務部門深度參與,逐漸成為數據的主要使用者和創(chuàng)新者,通過數據分析,業(yè)務人員解讀,豐富,判斷,決策,并最終完成執(zhí)行的閉環(huán),實現數據的價值化。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03