
大數(shù)據(jù)市場面面觀
大數(shù)據(jù)的價值已經(jīng)逐漸被用戶認(rèn)可。作為新概念,大數(shù)據(jù)在給一些初創(chuàng)公司帶來機(jī)遇的同時,也為大型的傳統(tǒng)IT廠商提出了新課題,在遠(yuǎn)未飽和的市場中如何將自身的利益最大化?因此我們看到包括甲骨文、IBM以及微軟在內(nèi)的主流數(shù)據(jù)庫廠商都紛紛發(fā)布了明確的大數(shù)據(jù)戰(zhàn)略,甚至連英特爾這樣和數(shù)據(jù)不太沾邊的公司也都參與進(jìn)來。大數(shù)據(jù)中蘊(yùn)含的大商機(jī)是每個廠商都要抓住的機(jī)遇。
在這里我們就來回顧一下過去一年中,幾大重點(diǎn)廠商所發(fā)布的大數(shù)據(jù)戰(zhàn)略,看看他們之間到底有何區(qū)別,誰又能引領(lǐng)新的大數(shù)據(jù)時代?
甲骨文大數(shù)據(jù)平臺浮出水面
甲骨文在2011年的OpenWorld上宣布將推出Oracle大數(shù)據(jù)機(jī)(BigDataAppliance)和Exalytics商務(wù)智能服務(wù)器,筆者曾認(rèn)為這是甲骨文強(qiáng)勢進(jìn)入“大數(shù)據(jù)”市場的標(biāo)志。隨著BDA和Exalytics在今年年初的正式供貨,甲骨文的大數(shù)據(jù)平臺解決方案也逐漸浮出了水面。
甲骨文的大數(shù)據(jù)平臺解決方案可以簡單地理解為Exadata+大數(shù)據(jù)機(jī)+Exalytics的組合,利用這“三駕馬車”來分別應(yīng)對數(shù)據(jù)捕獲、組織、分析和決策四個部分:利用大數(shù)據(jù)機(jī)來捕獲所有可用數(shù)據(jù),通過Hadoop來將不同類型的數(shù)據(jù)組織為易分析的數(shù)據(jù);然后再利用Exadata進(jìn)行分析,其中Exalytics將起到加速BI分析過程的作用。因此通過這三個“大家伙”的組合,甲骨文將為用戶提供一個高集成度的大數(shù)據(jù)平臺。
EMC布局大數(shù)據(jù)中國市場
從市場宣傳和推廣的角度來看,EMC應(yīng)該算是最早一批將大數(shù)據(jù)提上議事日程的廠商,去年5月在美國召開的EMCWorld大會就是以“BigData”作為主題。當(dāng)然只有口號是遠(yuǎn)遠(yuǎn)不夠的,EMC在這一年中針對大數(shù)據(jù)采取了一系列的舉措,包括發(fā)布了業(yè)內(nèi)第一款大數(shù)據(jù)社交協(xié)作平臺GreenplumChorus,EMC在用行動表達(dá)著對大數(shù)據(jù)市場的信心。[page]
EMC在中國的業(yè)務(wù)發(fā)力點(diǎn)將包括以下幾個方面:1、依賴目前核心的市場銷售和咨詢顧問團(tuán)隊,加強(qiáng)行業(yè)的覆蓋;2、重點(diǎn)培養(yǎng)如神州數(shù)碼、怡德、易通等在內(nèi)的渠道合作伙伴,以推動大數(shù)據(jù)市場戰(zhàn)略;3、建立一個立足于中國本土的研發(fā)團(tuán)隊。
作為EMC大數(shù)據(jù)戰(zhàn)略的重要一環(huán),收購而來的Greenplum將承擔(dān)非結(jié)構(gòu)化數(shù)據(jù)處理的重任。目前Greenplum的數(shù)據(jù)庫產(chǎn)品包括傳統(tǒng)的GreenplumDatabase和GreenplumHD(Hadoop),前者用來應(yīng)對企業(yè)結(jié)構(gòu)化數(shù)據(jù),后者可以將非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入Greenplum中進(jìn)行存儲和分析。在今年年初,EMC又將GreenplumHD同EMCIsilon進(jìn)行了整合,使Isilon可以原生支持Hadoop,成為業(yè)界第一個原生支持Hadoop的橫向擴(kuò)展NAS平臺。
IBM積極推動大數(shù)據(jù)落地
大數(shù)據(jù)剛剛進(jìn)入人們視野的時候,IBM就率先推出了業(yè)界首個大數(shù)據(jù)分析產(chǎn)品BigInsights和Steams,通過Hadoop和內(nèi)存分析等技術(shù)實(shí)現(xiàn)了對大數(shù)據(jù)的存儲和分析。經(jīng)歷了一年多的發(fā)展,除不斷完善產(chǎn)品功能之外,IBM又提出了一套全面的戰(zhàn)略理論3A5步,實(shí)現(xiàn)信息生命周期的管理。
今年IBM在大數(shù)據(jù)方面的主要方向是推動應(yīng)用的落地,大數(shù)據(jù)在中國的應(yīng)用集中在以技術(shù)為主導(dǎo)的互聯(lián)網(wǎng)公司當(dāng)中,而針對傳統(tǒng)行業(yè),這樣的經(jīng)驗(yàn)無法推而廣之。包括金融、電信以及制造等傳統(tǒng)行業(yè)在大數(shù)據(jù)方面的需求已經(jīng)逐漸凸顯出來,而IBM的優(yōu)勢就在于豐富的實(shí)踐經(jīng)驗(yàn)?zāi)軌驇椭鷩鴥?nèi)用戶讓大數(shù)據(jù)“落地生根”.
針對幾個行業(yè),IBM給出了具體的大數(shù)據(jù)應(yīng)用場景和解決方案,包括制造業(yè)、金融和電信等大型傳統(tǒng)行業(yè)。IBM的大數(shù)據(jù)戰(zhàn)略非常清晰,一步一個腳印走的很堅實(shí),其前景將被看好。
英特爾憑Hadoop向大數(shù)據(jù)靠攏
雖然Hadoop并不是大數(shù)據(jù)代名詞,但當(dāng)提到大數(shù)據(jù)生態(tài)系統(tǒng)的時候,人們還是會首先想到ApacheHadoop.同大數(shù)據(jù)類似,Hadoop是一整套技術(shù)與產(chǎn)品的組合,來源于Apache軟件基金會的開源項(xiàng)目,可以為企業(yè)提供一個可靠的、可擴(kuò)展的分布式計算環(huán)境。它包括了MapReduce計算框架、HDFS存儲系統(tǒng)、HBase數(shù)據(jù)庫以及Hive等工具,能夠?qū)Ψ墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效的操作與處理。這也是Hadoop在大數(shù)據(jù)時代獨(dú)領(lǐng)風(fēng)騷的重要原因,因此許多廠商都希望通過Hadoop來抓住大數(shù)據(jù)所帶來的機(jī)遇。
在今年的七月份,英特爾公司對外發(fā)布了自己的Hadoop商業(yè)發(fā)行版(ApacheHadoopDistribution),也是這幾家大型廠商中唯一擁有自身發(fā)行版Hadoop的一家。靠硬件芯片起家的英特爾為何要走這條路?[page]
英特爾實(shí)際上已經(jīng)看到企業(yè)用戶對于大數(shù)據(jù)的需求在不斷增長,特別是在中國。目前國內(nèi)的Hadoop應(yīng)用大多數(shù)集中在互聯(lián)網(wǎng)行業(yè),傳統(tǒng)行業(yè)沒有專門的技術(shù)團(tuán)隊可以擔(dān)負(fù)起維護(hù)開源Hadoop集群的重任。除Oracle、IBM這樣的廠商會提供一些異常昂貴的Hadoop服務(wù)之外,像Cloudera、Hortonworks這樣的頂級Hadoop提供商在國內(nèi)的投入力度卻非常小。這雖然讓人有些意外,但國內(nèi)用戶的確是需要一個“靠譜的”Hadoop解決方案,來切實(shí)解決大數(shù)據(jù)問題。英特爾的Hadoop發(fā)行版恰好能解決這一問題。
英特爾Hadoop發(fā)行版包含了所有的分析、集成以及開發(fā)組件,并對不同組合之間進(jìn)行了更加深入的優(yōu)化。此外,還添加了英特爾Hadoop管理器(HadoopManager),從安裝、部署到配置與監(jiān)控,可以提供對平臺的全方位管理。目前英特爾已經(jīng)開放了免費(fèi)下載,隨著推廣力度的不斷加大,相信英特爾的Hadoop還是能很輕松地在國內(nèi)大數(shù)據(jù)市場分一杯羹。
微軟大數(shù)據(jù)戰(zhàn)略依然延續(xù)“端到端”
對于微軟企業(yè)級部門來說,今年是非常重要的一年。大面積的產(chǎn)品更新以及在云計算業(yè)務(wù)方面的進(jìn)展,讓微軟在2012年吸引了大量關(guān)注的目光,當(dāng)然大數(shù)據(jù)就是其中之一。微軟在今年上半年正式發(fā)布了SQLServer2012數(shù)據(jù)庫平臺,并添加了Hadoop的相關(guān)服務(wù),逐漸將數(shù)據(jù)業(yè)務(wù)延伸到非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域。而伴隨WindowsAzureMarketplace和SharePoint等工具的推出,微軟已經(jīng)具備了打造端到端的大數(shù)據(jù)平臺的能力。
微軟的大數(shù)據(jù)解決方案涵蓋了管理、擴(kuò)展和洞察三個層面,從各個角度來把握大數(shù)據(jù)生命周期。其中數(shù)據(jù)管理層將對所有類型的數(shù)據(jù)進(jìn)行搜集和管理,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化和流數(shù)據(jù);數(shù)據(jù)擴(kuò)展層主要實(shí)現(xiàn)數(shù)據(jù)發(fā)現(xiàn)的功能,通過多種類型、多種數(shù)據(jù)源的互連實(shí)現(xiàn)對數(shù)據(jù)集的豐富;洞察力層主要面向應(yīng)用,通過數(shù)據(jù)挖掘以及多種數(shù)據(jù)展現(xiàn)工具,實(shí)現(xiàn)任何用戶對任何位置的任何數(shù)據(jù)洞察。
微軟對大數(shù)據(jù)生命周期的三個層面都投入了大量的研發(fā)力度:SQLServer2012數(shù)據(jù)庫和并行數(shù)據(jù)倉庫(ParallelDataWarehouse)將作為結(jié)構(gòu)化數(shù)據(jù)的處理平臺。針對非結(jié)構(gòu)化數(shù)據(jù),微軟也將推出全新的Hadoop服務(wù)HDInsight,該產(chǎn)品包括公有云(WindowsAzure)和私有云(WindowsServer)兩個版本,提供企業(yè)級的Hadoop服務(wù)。
另外,最新發(fā)布的WindowsAzureMarketplace將實(shí)現(xiàn)大數(shù)據(jù)的共享,通過開放數(shù)據(jù)協(xié)議(OData)展現(xiàn)數(shù)百種來自微軟和第三方的應(yīng)用程序和數(shù)據(jù)挖掘算法。用戶還可以使用最熟悉的工具從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲得可執(zhí)行的洞察力,包括SQLServer分析服務(wù)(SSAS)的PowerPivot和PowerView,通過連接器就可以對Hadoop分布式文件系統(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析與展現(xiàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10