
大數(shù)據(jù)泡沫正無限膨脹
在當(dāng)今企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都按指數(shù)增長60%。大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲架構(gòu)、數(shù)據(jù)中心的基礎(chǔ)設(shè)施等,也會引發(fā)數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能、云計算等應(yīng)用的連鎖反應(yīng)。未來企業(yè)會將更多的TB級(1TB=1024GB)數(shù)據(jù)集用于商務(wù)智能和商務(wù)分析。到2020年,全球數(shù)據(jù)使用量預(yù)計將暴增44倍,達(dá)到35.2ZB(1ZB=10億TB)。大數(shù)據(jù)正在徹底改變IT世界。10月幾大科技巨頭的舉動使更多人意識到所謂的高科技泡沫——即“大數(shù)據(jù)”正在無限的膨脹。
微軟與Hortonworks合作開發(fā)Hadoop
早在今年2月,微軟的HPC開發(fā)團(tuán)隊就公布了被稱為“Dryad”的分布式計算平臺。這也標(biāo)志著微軟向Windows HPC Server用戶提供了能夠進(jìn)行海量數(shù)據(jù)處理的工具。微軟推出Dryad的目就是鼓勵開發(fā)者們在Windows或者.Net平臺上編寫大規(guī)模的并行應(yīng)用程序。在當(dāng)時這也被視為微軟在大數(shù)據(jù)領(lǐng)域與Hadoop對抗的有力產(chǎn)品。
但微軟卻于10月12日在西雅圖舉行的SQL PASS 2011峰會上出乎所有人預(yù)料的宣布將與從雅虎分拆出來的Hortonworks合作開發(fā)Hadoop,并將在Apache Hadoop上實現(xiàn)搭建Windows Azure以及Windows Server平臺。同時基于Hadoop的Windows Server還會與微軟現(xiàn)有的BI工具聯(lián)合處理任務(wù)。
微軟與Hortonworks深度合作的目標(biāo)是借助Hortonworks在此領(lǐng)域的專長幫助最大化將Hadoop集成到微軟的產(chǎn)品之中。同時兩家的合作可幫助簡化下載、安裝和配置等幾個Hadoop的相關(guān)技術(shù)。包括HDFS、Hive、Pig。這將有利于企業(yè)通過Hadoop拓寬自身的業(yè)務(wù)。微軟還將編寫新的ODBC驅(qū)動程序并擴(kuò)展自己現(xiàn)有的查詢系統(tǒng)到Hive。這樣一來用戶將能夠直接從Excel、PowerView執(zhí)行Hadoop查詢。
Red Monk分析師Stephen O'Grady也很看好Windows和Hadoop的結(jié)合。他表示這將是非常具有吸引力的,這將吸引大量的Windows用戶。微軟在此領(lǐng)域具有競爭的實力。
大數(shù)據(jù)領(lǐng)域 Oracle硬件、軟件齊發(fā)力
Oracle作為全球最大的關(guān)系型數(shù)據(jù)庫提供商也不甘寂寞,在其產(chǎn)品鏈條中加入了被稱為“NoSQL Database”的NoSQL數(shù)據(jù)庫。NoSQL Database是Oracle在2011 Oracle全球大會上宣布推出的Oracle Big Data Appliance的一個組成部分。Big Data Appliance是一個集成了Hadoop、NoSQL Database、Oracle數(shù)據(jù)庫Hadoop適配器、Oracle數(shù)據(jù)庫Hadoop裝載器及R語言的系統(tǒng)。
而Oracle的在大數(shù)據(jù)領(lǐng)域的投入還遠(yuǎn)不止這些。他們不僅在軟件層面推出了Oracle Big Data Appliance,在硬件層面Oracle還推出Exalytics。Exalytics目標(biāo)非常明確,就是針對大數(shù)據(jù)。Oracle推出的In-Memory計算就是在Big Data時代能夠提供海量信息——包括結(jié)構(gòu)化、半結(jié)構(gòu)化、數(shù)據(jù)集及非結(jié)構(gòu)化數(shù)據(jù)的分析。同時Exalytics還能夠支持混合的數(shù)據(jù)源——包括Oracle數(shù)據(jù)庫、Teradata、微軟SQL Server以及獨(dú)立的Essbase數(shù)據(jù)庫共同使用。
并且Exalytics的硬件和軟件配置也相當(dāng)強(qiáng)悍:1TB內(nèi)存和48核心的處理器;支持OBIEE 11g;200GB/s帶寬的TimesTen并行內(nèi)存數(shù)據(jù)庫;支持內(nèi)存并行處理的Essbase OLAP服務(wù)器;新的面向高帶寬分析的用戶界面以及最快的連通Exadata的Infiniband連接。
以往,Oracle在云計算領(lǐng)域一直顯得有些保守,但隨著Oracle在此次大會在硬件和軟件兩個層面同時推出強(qiáng)有力的產(chǎn)品。這也標(biāo)志著Oracle在云計算領(lǐng)域邁出了劃時代的一步。
IBM將DB2與NoSQL數(shù)據(jù)庫有機(jī)結(jié)合
同樣是在10月,在IBM舉辦的IOD 2011大會上,IBM數(shù)據(jù)庫服務(wù)器部門副總裁Curt Cotner宣布IBM將在明年推出內(nèi)置NoSQL技術(shù)的DB2旗艦級數(shù)據(jù)庫管理系統(tǒng)。
IBM在NoSQL技術(shù)領(lǐng)域已具備了一些經(jīng)驗,其自身的Rational Jazz協(xié)作軟件交付平臺就是使用了“triplestore”技術(shù),而“triplestore”技術(shù)同NoSQL數(shù)據(jù)庫中所涉及到的技術(shù)大致相同。triplestore技術(shù)允許用戶簡潔并快速的檢索元數(shù)據(jù)和其他相關(guān)信息。
不過IBM Rational團(tuán)隊最終發(fā)現(xiàn)triple并不具備其所想要的可用性特征,例如故障轉(zhuǎn)移、橫向擴(kuò)展到多個節(jié)點等等。IBM Rational團(tuán)隊發(fā)現(xiàn)如果其在短時間內(nèi)接收大量的triple,NoSQL存儲的索引將會鎖住數(shù)據(jù)庫。Rational團(tuán)隊實際上是從開源社區(qū)中借用NoSQL triplestore,然后進(jìn)行修改,使其嵌入到DB2數(shù)據(jù)庫中,通過這樣的修改將能夠使用DB2索引、日志、高可用性解決方案以及DB2數(shù)據(jù)庫中所有的功能。
Cotner表示經(jīng)過修改后的NoSQL功能在DB2數(shù)據(jù)庫中運(yùn)行速度將會比之前的開源產(chǎn)品快4倍以上,同時還可以消除可用性以及可擴(kuò)展性帶來的問題?,F(xiàn)今NoSQL功能還在開發(fā)過程中,不過Rational團(tuán)隊將會在未來為DB2集成更多NoSQL的功能。
大數(shù)據(jù)在企業(yè)的未來
管理大數(shù)據(jù)的能力將成為那些越來越多地使用新形式信息——比如文本、社交媒體——的企業(yè)的核心能力。這種能力將幫助企業(yè)尋找最好的模式來支持商業(yè)決策,即所謂的基于模式的戰(zhàn)略。作為一種變化引擎,基于模式的戰(zhàn)略將充分利用模式尋找流程中所有的維度。然后,它為新商業(yè)解決方案的建模提供基礎(chǔ),讓企業(yè)更好地適應(yīng)新的環(huán)境。處理大數(shù)據(jù)的增長并利用大數(shù)據(jù)的能力將成為許多企業(yè)的優(yōu)先任務(wù),否則未來幾年他們將受制于這些數(shù)據(jù)和他們的競爭對手。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03