
大數(shù)據(jù)市場面面觀
大數(shù)據(jù)的價(jià)值已經(jīng)逐漸被用戶認(rèn)可。作為新概念,大數(shù)據(jù)在給一些初創(chuàng)公司帶來機(jī)遇的同時(shí),也為大型的傳統(tǒng)IT廠商提出了新課題,在遠(yuǎn)未飽和的市場中如何將自身的利益最大化?因此我們看到包括甲骨文、IBM以及微軟在內(nèi)的主流數(shù)據(jù)庫廠商都紛紛發(fā)布了明確的大數(shù)據(jù)戰(zhàn)略,甚至連英特爾這樣和數(shù)據(jù)不太沾邊的公司也都參與進(jìn)來。大數(shù)據(jù)中蘊(yùn)含的大商機(jī)是每個(gè)廠商都要抓住的機(jī)遇。
在這里我們就來回顧一下過去一年中,幾大重點(diǎn)廠商所發(fā)布的大數(shù)據(jù)戰(zhàn)略,看看他們之間到底有何區(qū)別,誰又能引領(lǐng)新的大數(shù)據(jù)時(shí)代?
甲骨文大數(shù)據(jù)平臺浮出水面
甲骨文在2011年的OpenWorld上宣布將推出Oracle大數(shù)據(jù)機(jī)(BigDataAppliance)和Exalytics商務(wù)智能服務(wù)器,筆者曾認(rèn)為這是甲骨文強(qiáng)勢進(jìn)入“大數(shù)據(jù)”市場的標(biāo)志。隨著BDA和Exalytics在今年年初的正式供貨,甲骨文的大數(shù)據(jù)平臺解決方案也逐漸浮出了水面。
甲骨文的大數(shù)據(jù)平臺解決方案可以簡單地理解為Exadata+大數(shù)據(jù)機(jī)+Exalytics的組合,利用這“三駕馬車”來分別應(yīng)對數(shù)據(jù)捕獲、組織、分析和決策四個(gè)部分:利用大數(shù)據(jù)機(jī)來捕獲所有可用數(shù)據(jù),通過Hadoop來將不同類型的數(shù)據(jù)組織為易分析的數(shù)據(jù);然后再利用Exadata進(jìn)行分析,其中Exalytics將起到加速BI分析過程的作用。因此通過這三個(gè)“大家伙”的組合,甲骨文將為用戶提供一個(gè)高集成度的大數(shù)據(jù)平臺。
EMC布局大數(shù)據(jù)中國市場
從市場宣傳和推廣的角度來看,EMC應(yīng)該算是最早一批將大數(shù)據(jù)提上議事日程的廠商,去年5月在美國召開的EMCWorld大會就是以“BigData”作為主題。當(dāng)然只有口號是遠(yuǎn)遠(yuǎn)不夠的,EMC在這一年中針對大數(shù)據(jù)采取了一系列的舉措,包括發(fā)布了業(yè)內(nèi)第一款大數(shù)據(jù)社交協(xié)作平臺GreenplumChorus,EMC在用行動表達(dá)著對大數(shù)據(jù)市場的信心。[page]
EMC在中國的業(yè)務(wù)發(fā)力點(diǎn)將包括以下幾個(gè)方面:1、依賴目前核心的市場銷售和咨詢顧問團(tuán)隊(duì),加強(qiáng)行業(yè)的覆蓋;2、重點(diǎn)培養(yǎng)如神州數(shù)碼、怡德、易通等在內(nèi)的渠道合作伙伴,以推動大數(shù)據(jù)市場戰(zhàn)略;3、建立一個(gè)立足于中國本土的研發(fā)團(tuán)隊(duì)。
作為EMC大數(shù)據(jù)戰(zhàn)略的重要一環(huán),收購而來的Greenplum將承擔(dān)非結(jié)構(gòu)化數(shù)據(jù)處理的重任。目前Greenplum的數(shù)據(jù)庫產(chǎn)品包括傳統(tǒng)的GreenplumDatabase和GreenplumHD(Hadoop),前者用來應(yīng)對企業(yè)結(jié)構(gòu)化數(shù)據(jù),后者可以將非結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入Greenplum中進(jìn)行存儲和分析。在今年年初,EMC又將GreenplumHD同EMCIsilon進(jìn)行了整合,使Isilon可以原生支持Hadoop,成為業(yè)界第一個(gè)原生支持Hadoop的橫向擴(kuò)展NAS平臺。
IBM積極推動大數(shù)據(jù)落地
大數(shù)據(jù)剛剛進(jìn)入人們視野的時(shí)候,IBM就率先推出了業(yè)界首個(gè)大數(shù)據(jù)分析產(chǎn)品BigInsights和Steams,通過Hadoop和內(nèi)存分析等技術(shù)實(shí)現(xiàn)了對大數(shù)據(jù)的存儲和分析。經(jīng)歷了一年多的發(fā)展,除不斷完善產(chǎn)品功能之外,IBM又提出了一套全面的戰(zhàn)略理論3A5步,實(shí)現(xiàn)信息生命周期的管理。
今年IBM在大數(shù)據(jù)方面的主要方向是推動應(yīng)用的落地,大數(shù)據(jù)在中國的應(yīng)用集中在以技術(shù)為主導(dǎo)的互聯(lián)網(wǎng)公司當(dāng)中,而針對傳統(tǒng)行業(yè),這樣的經(jīng)驗(yàn)無法推而廣之。包括金融、電信以及制造等傳統(tǒng)行業(yè)在大數(shù)據(jù)方面的需求已經(jīng)逐漸凸顯出來,而IBM的優(yōu)勢就在于豐富的實(shí)踐經(jīng)驗(yàn)?zāi)軌驇椭鷩鴥?nèi)用戶讓大數(shù)據(jù)“落地生根”.
針對幾個(gè)行業(yè),IBM給出了具體的大數(shù)據(jù)應(yīng)用場景和解決方案,包括制造業(yè)、金融和電信等大型傳統(tǒng)行業(yè)。IBM的大數(shù)據(jù)戰(zhàn)略非常清晰,一步一個(gè)腳印走的很堅(jiān)實(shí),其前景將被看好。
英特爾憑Hadoop向大數(shù)據(jù)靠攏
雖然Hadoop并不是大數(shù)據(jù)代名詞,但當(dāng)提到大數(shù)據(jù)生態(tài)系統(tǒng)的時(shí)候,人們還是會首先想到ApacheHadoop.同大數(shù)據(jù)類似,Hadoop是一整套技術(shù)與產(chǎn)品的組合,來源于Apache軟件基金會的開源項(xiàng)目,可以為企業(yè)提供一個(gè)可靠的、可擴(kuò)展的分布式計(jì)算環(huán)境。它包括了MapReduce計(jì)算框架、HDFS存儲系統(tǒng)、HBase數(shù)據(jù)庫以及Hive等工具,能夠?qū)Ψ墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效的操作與處理。這也是Hadoop在大數(shù)據(jù)時(shí)代獨(dú)領(lǐng)風(fēng)騷的重要原因,因此許多廠商都希望通過Hadoop來抓住大數(shù)據(jù)所帶來的機(jī)遇。
在今年的七月份,英特爾公司對外發(fā)布了自己的Hadoop商業(yè)發(fā)行版(ApacheHadoopDistribution),也是這幾家大型廠商中唯一擁有自身發(fā)行版Hadoop的一家。靠硬件芯片起家的英特爾為何要走這條路?[page]
英特爾實(shí)際上已經(jīng)看到企業(yè)用戶對于大數(shù)據(jù)的需求在不斷增長,特別是在中國。目前國內(nèi)的Hadoop應(yīng)用大多數(shù)集中在互聯(lián)網(wǎng)行業(yè),傳統(tǒng)行業(yè)沒有專門的技術(shù)團(tuán)隊(duì)可以擔(dān)負(fù)起維護(hù)開源Hadoop集群的重任。除Oracle、IBM這樣的廠商會提供一些異常昂貴的Hadoop服務(wù)之外,像Cloudera、Hortonworks這樣的頂級Hadoop提供商在國內(nèi)的投入力度卻非常小。這雖然讓人有些意外,但國內(nèi)用戶的確是需要一個(gè)“靠譜的”Hadoop解決方案,來切實(shí)解決大數(shù)據(jù)問題。英特爾的Hadoop發(fā)行版恰好能解決這一問題。
英特爾Hadoop發(fā)行版包含了所有的分析、集成以及開發(fā)組件,并對不同組合之間進(jìn)行了更加深入的優(yōu)化。此外,還添加了英特爾Hadoop管理器(HadoopManager),從安裝、部署到配置與監(jiān)控,可以提供對平臺的全方位管理。目前英特爾已經(jīng)開放了免費(fèi)下載,隨著推廣力度的不斷加大,相信英特爾的Hadoop還是能很輕松地在國內(nèi)大數(shù)據(jù)市場分一杯羹。
微軟大數(shù)據(jù)戰(zhàn)略依然延續(xù)“端到端”
對于微軟企業(yè)級部門來說,今年是非常重要的一年。大面積的產(chǎn)品更新以及在云計(jì)算業(yè)務(wù)方面的進(jìn)展,讓微軟在2012年吸引了大量關(guān)注的目光,當(dāng)然大數(shù)據(jù)就是其中之一。微軟在今年上半年正式發(fā)布了SQLServer2012數(shù)據(jù)庫平臺,并添加了Hadoop的相關(guān)服務(wù),逐漸將數(shù)據(jù)業(yè)務(wù)延伸到非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域。而伴隨WindowsAzureMarketplace和SharePoint等工具的推出,微軟已經(jīng)具備了打造端到端的大數(shù)據(jù)平臺的能力。
微軟的大數(shù)據(jù)解決方案涵蓋了管理、擴(kuò)展和洞察三個(gè)層面,從各個(gè)角度來把握大數(shù)據(jù)生命周期。其中數(shù)據(jù)管理層將對所有類型的數(shù)據(jù)進(jìn)行搜集和管理,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化和流數(shù)據(jù);數(shù)據(jù)擴(kuò)展層主要實(shí)現(xiàn)數(shù)據(jù)發(fā)現(xiàn)的功能,通過多種類型、多種數(shù)據(jù)源的互連實(shí)現(xiàn)對數(shù)據(jù)集的豐富;洞察力層主要面向應(yīng)用,通過數(shù)據(jù)挖掘以及多種數(shù)據(jù)展現(xiàn)工具,實(shí)現(xiàn)任何用戶對任何位置的任何數(shù)據(jù)洞察。
微軟對大數(shù)據(jù)生命周期的三個(gè)層面都投入了大量的研發(fā)力度:SQLServer2012數(shù)據(jù)庫和并行數(shù)據(jù)倉庫(ParallelDataWarehouse)將作為結(jié)構(gòu)化數(shù)據(jù)的處理平臺。針對非結(jié)構(gòu)化數(shù)據(jù),微軟也將推出全新的Hadoop服務(wù)HDInsight,該產(chǎn)品包括公有云(WindowsAzure)和私有云(WindowsServer)兩個(gè)版本,提供企業(yè)級的Hadoop服務(wù)。
另外,最新發(fā)布的WindowsAzureMarketplace將實(shí)現(xiàn)大數(shù)據(jù)的共享,通過開放數(shù)據(jù)協(xié)議(OData)展現(xiàn)數(shù)百種來自微軟和第三方的應(yīng)用程序和數(shù)據(jù)挖掘算法。用戶還可以使用最熟悉的工具從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲得可執(zhí)行的洞察力,包括SQLServer分析服務(wù)(SSAS)的PowerPivot和PowerView,通過連接器就可以對Hadoop分布式文件系統(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析與展現(xiàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03