
大數據:商業(yè)或技術的挑戰(zhàn)
大數據已經被證明是一個重要的趨勢,并且對來年的大數據市場進行了很多的預測。現實情況是,客戶將最終決定大數據的發(fā)展趨勢,也將決定使用哪些技術解決方案來解決他們的獨特業(yè)務問題。
在如今由數據驅動發(fā)展的世界里,企業(yè)為了保持競爭力,大數據已成為它們必須解決問題。就像云計算發(fā)展在過去的幾年中的起起伏伏,它現在已經開始促使企業(yè)改變其基礎設施建設,以應對復雜的挑戰(zhàn)。根據最近的一項研究表明,大數據的數量預計將在2013年增加約60%,這個問題預計不會很快消失。
所以應該能看到,企業(yè)在2013年會面對大數據帶來的商業(yè)或技術方面的挑戰(zhàn)。我們可以肯定一件事——在2013年,無論是大數據方面的技術變革還是公司董事會在產業(yè)上的決策,都將產生變化。
預測1:企業(yè)大數據主動從Sandbox遷出,并定義一套明確的業(yè)務和技術需求
在2012年,企業(yè)在大數據上面的主動升級,超過了大多數人的預測。根據對世界上300個大企業(yè)的研究顯示,數據量預計將在2013年增加約60%。13%的受訪者表示他們對大數據的準備已經到位。另外有38%的公司有了實施計劃。
企業(yè)正在形成專門的大數據團隊,對很多人來說這在預算上已經成為一系列的項目,因為企業(yè)需要繼續(xù)尋找更好的方法來管理、存儲和分析他們持續(xù)增長的、必須保持在線的、可用于分析的數據據資產。我們將會看到更多明確定義的需求開始出現——無論是在業(yè)務方面還是在IT方面,如低成本的可擴展性、快速響應的查詢和分析,以及充分利用現有的基于標準的工具(包括SQL和BI)的能力等。這是除了內置的安全性和數據可用性功能外,企業(yè)期待出現的功能。
預測2:公司在管理大數據時將尋求除了Hadoop以外新的技術組合
過去一年,Hadoop的勢頭越來越猛。Hadoop通過Web 2.0組織的推廣,現在受到了銀行、金融機構、電信運行商、大型零售商和其他企業(yè)的重視。然而,大數據的舉措不僅集中在Hadoop平臺。
業(yè)務和IT的挑戰(zhàn)在于在不同的部門甚至于不同的公司之間組合使用各種不同的技術協(xié)調工作。企業(yè)部署私有云來管理數據財產與傳統(tǒng)的數據庫和數據倉庫環(huán)境這兩者的結合,以及在各種硬件上運行的Hadoop基礎環(huán)境。所有企業(yè)大數據項目的一個共同的主題是渴望可以快速啟動和運行而不會造成干擾到現有的IT環(huán)境。
預測3:預算限制是解決大數據挑戰(zhàn)的最大障礙之一
大數據的支出正在上升,在未來一年,成本問題仍將是啟動大數據項目時最大的一個障礙之一。根據最近的一項分析報告顯示,大數據支出在2013年預計達到340億美元。這些支出一方面是因為某些特殊行業(yè)組織由于行業(yè)的特殊性,必須保持數據在線和可用性;另一方面是由于企業(yè)想要利用來自多個源的數據的更多的信息,以進行更好的分析。這需要進行一個適當的平衡——在滿足業(yè)務需求的同時,尋找最高效的技術基礎設施——是一個挑戰(zhàn)。
大數據的增長速度不會減慢。現有需求和未來需求的建設能力是至關重要的。太多太快不是要走的路,大數據并不一定意味著大筆的預算。
預測4:大數據工具必須同時滿足業(yè)務和技術用戶
在2013年,我們將看到大數據工具和應用程序的需求增長,它們將變得更容易使用,并且將同時滿足業(yè)務和技術用戶。如果你深入了解下Hadoop的基礎技術能力,就會看到其在許多方面仍不成熟,需要獨特的專業(yè)技能。我們已經看到了許多解決這方面的需求的新產品,包括Cloudera Impala和微軟Polybase。事實上,今天已經存在的一些功能,使其更容易在正確的時間用最好的工具集訪問正確的數據。
預測5:重量級廠商,如甲骨文和IBM,將會大數據市場進行收購
在過去一年,隨著大數據市場的成熟,大型組織已經接受了大數據。我們預計,一些缺乏獨特的技術能力或專業(yè)知識的廠商將會在2013年被收購。兩個明顯的重量級廠商是甲骨文和IBM——它們已經在數據管理領域構建了多樣化的產品。但更應該看到,產品上市時間是企業(yè)獲得更強大的立足點的關鍵。
聚光燈下的大數據
隨著越來越需要利用大數據擴大自身競爭優(yōu)勢,以及創(chuàng)新產品的興起,會改變企業(yè)存儲、管理和分析他們的最重要的資產——數據。使企業(yè)找到一個更有效和更符合成本效益的管理PB級別的數據環(huán)境的方式。在接下來的12個月里,數據管理將會是關注的焦點,因為它是每個公司都要面對的問題。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數據生態(tài)中兩類核心工具的差異與協(xié)同 在數字化轉型加速的今天,企業(yè)對數據的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數據分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數據分析的 “基礎語言”—— 從描述數據分布的 “均 ...
2025-09-19CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-19SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11