
物聯網驅動下的大數據管理
物聯網的價值在于其數據,而物聯網帶來的史無前例的數據規(guī)模將驅動現在的數據服務企業(yè)發(fā)生根本性改變,這要求企業(yè)調整其大數據戰(zhàn)略。
具有“大數據時代預言家”之稱的維克托·邁爾曾經在自己的著名論著《大數據時代》中預言——物聯網(IOT)技術的發(fā)展將極大地改變傳統(tǒng)數據存儲分析領域。這就難怪有那么多的公司正試圖投身物聯網大潮。據麥肯錫全球研究院的最新報告顯示:到2025年,物聯網行業(yè)的總營收將達6.2萬億美元。
但正如維克托擔心的一樣——這些弄潮兒們真的為物聯網將造就的大數據時代做好準備了嗎?
當然,除了技術層面的考慮,安全問題也不容忽視。但是,筆者更關心的是:全球大多數的數據中心(包括那些專門非盈利性的數據存儲和分析機構)對由物聯網即將帶來的海量數據似乎毫無準備。
當然有一些科技公司仍然堅持認為自己完全有能力管理好自己的數據中心,但是當數據量以PB或者EB為單位增加時,不知道這些公司是否還認為筆者庸人自擾?如果依舊固執(zhí)己見,那么他們就不得不對相應的基礎設施進行大筆的投資。而相對聰明的公司會選擇業(yè)界領先的云存儲公司作為自己的戰(zhàn)略同盟。所以,由物聯網引起的大數據潮流將會助推云存儲和云計算的發(fā)展。
物聯網產生的大數據處理過程可以歸結為三個基本步驟:數據采集、數據存儲和數據分析。數據采集和存儲是基本的功能,而大數據時代真正的價值蘊含在數據分析中。對于大數據時代的到來,有專家曾經估計有半數以上的大數據公司可能夭折,而原因是他們未能掌握數據采集相關技術。當然也并不是說過了數據采集這個難關就可以萬事大吉,接下來在數據存儲方面仍有一連串的挑戰(zhàn)。比如,公司必須掌握如分布式計算、并行計算等先進的存儲計算方法。
2009年,甲型H1N1流感病毒肆虐全球。與流感病毒傳播速度相比,美國政府對流感病例的申告制度顯得效率低下。這時候人們才重新注意流感病毒爆發(fā)前幾周,谷歌公司幾位工程師在《Nature》上發(fā)表的一篇文章。在文章中,谷歌公司通過對全美境內5000萬條最頻繁檢索的詞條和美國疾控心公布的季節(jié)性流感傳播數據進行比較發(fā)現:在未來一段時間很可能爆發(fā)一次大規(guī)模的流感疫情,而且清楚預測出了具體的地區(qū)和州。最后疫情爆發(fā)的時候,疾控中心驚訝地發(fā)現谷歌公司的預測竟然與疫情爆發(fā)地精準吻合。所以,對于大數據時代而言真正的意義在于數據分析。
數據分析的挑戰(zhàn)還在于將新的物聯網數據和已有的數據庫整合。iDoNews認為,有兩個方面最令人頭疼。首先,軟件方面——原來的數據庫與物聯網數據庫之間使用的存儲方法不同,這時候就要求公司不得不靠大量的人工重新定義原來的海量數據。第二,硬件方面——兩種數據庫之間所使用硬件介質(服務器、磁盤等存儲介質和網絡等基礎設施)不同,這將導致公司需要進行更大規(guī)模的基礎設施建設。
這時候如果還有公司想靠自己一方的努力管理本公司數據,那無疑是作死。
為此,真正有眼光的企業(yè)可以采用如下三種方案:
第一種,也是最流行的方式——利用成熟的第三方數據庫服務(DBaaS),如亞馬遜的Redshift.這種模式的優(yōu)勢在于,客戶公司不需要具備安裝、管理和運行任何大型數據庫的經驗和技術。
第二種,利用大數據托管服務。托管服務供應商(MSP)將負責數據收集、數據庫管理并提供進行分析和提取數據集的服務。這種模式不僅使企業(yè)專注于其商業(yè)價值所在的數據分析而將一些較難處理的事情外包,而且還使企業(yè)用戶無需大量先期投入就可以快速進入大數據應用的市場化階段,同時也解決了很多企業(yè)在該領域的技術短缺。
第三種,基于云計算的數據庫矩陣解決方案。這種模式主要針對那些具有多種不同類型、甚至非聯系型數據庫的公司。這些公司通常要求數據存放于多個數據中心,并且既存于公共端也可能存在私有的云端。公司不僅要求不同類型數據庫的解決方案,而且對自身的大數據也有不同的應用需求。美國主機服務商ServePath下的GoGrid云計算平臺正致力于這種數據庫管理服務。
物聯網的價值在于其數據,而物聯網帶來的史無前例的數據規(guī)模將驅動現在的數據服務企業(yè)發(fā)生根本性改變,這要求企業(yè)調整其大數據戰(zhàn)略。
等著瞧吧,物聯網必然催生出大數據管理領域的大贏家。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03