
“大數(shù)據(jù)”誤區(qū):不是所有公司都需要大數(shù)據(jù)
“大數(shù)據(jù)”無處不在。從社交媒體初創(chuàng)公司到紐約的中央公園,每個公司似乎都在部署大數(shù)據(jù)分析。
著名數(shù)據(jù)分析公司Gartner的數(shù)據(jù)似乎也在證明這一點:最近的一份報告顯示,大數(shù)據(jù)將帶動2012年全球280億美元的IT支出,到2016年這個數(shù)字將超過2300億美元。2300億美元幾乎是葡萄牙全年的國內生產(chǎn)總值。
但是,你需要花大價錢來部署大數(shù)據(jù)技術解決方案。大多數(shù)公司都沒有這么多IT預算,也請不起數(shù)據(jù)科學家或者數(shù)據(jù)分析團隊。
如果那些提供大數(shù)據(jù)服務的公司想為各種規(guī)模的企業(yè)提供服務,那么有幾個問題必須認識到并加以解決。
大數(shù)據(jù)太貴了!
您可能聽說過那些使用大數(shù)據(jù)的輝煌案例:Facebook每天要存儲大約100TB的用戶數(shù)據(jù);NASA每天要處理約24TB的數(shù)據(jù)。這些數(shù)字確實令人印象深刻。
那么處理這些數(shù)據(jù)所需的成本是多少呢?按照亞馬遜Redshift的定價,NASA需要為45天數(shù)據(jù)存儲服務支付超過100萬美元。
根據(jù)最近的一項調查,大多數(shù)企業(yè)的CIO稱他們的預算支付不起大數(shù)據(jù)部署的成本。數(shù)據(jù)存儲和處理的成本實在太高,我們需要尋求其他的解決方案,讓規(guī)模較小的公司不被“大數(shù)據(jù)”拒之門外。
大數(shù)據(jù)的關鍵不是“大”
目前全球最大的科技公司都需要和PB級規(guī)模的數(shù)據(jù)打交道。然而,SAP的研究表明,95%的企業(yè)通常只需要使用0.5TB到40TB的數(shù)據(jù)。
Facebook和NASA的例子是個例外,而不是常態(tài)。事實是,處理數(shù)據(jù)并不是大公司的專利。如果你研究一下美國公司的規(guī)模,你會發(fā)現(xiàn)有超過50000家公司只有20至500名員工,其中大部分都有解決數(shù)據(jù)問題的需求。所以大數(shù)據(jù)市場最大的需求并不是來自那些《財富》50強的大企業(yè),而是來自《財富》500000強。為什么我們只關注那些少數(shù)的例外,而忽視了那些大多數(shù)有數(shù)據(jù)處理需求,但既不是《財富》50強也沒有PB級規(guī)模數(shù)據(jù)的公司?
有時候我在想,如果我們改變了大數(shù)據(jù)的定義會發(fā)生什么?通常人們用3V(velocity,volume,variety)來描述大數(shù)據(jù),我們不妨換一個說法:“大數(shù)據(jù)是一種主觀狀態(tài),它描述的是一個公司的基礎架構無法滿足其數(shù)據(jù)處理需求時的情形?!?/span>
這個定義可能沒有那么光鮮,但它肯定會更接近今天的現(xiàn)實。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03