
幾個(gè)月前,微軟宣布了自己的用于大數(shù)據(jù)管理、分析和挖掘的Hadoop發(fā)布版HDInsight。記者聯(lián)系到了SQL Server的高級(jí)產(chǎn)品營(yíng)銷經(jīng)理Val Fontama,希望進(jìn)一步了解微軟的企業(yè)級(jí)大數(shù)據(jù)到底如何。
關(guān)于企業(yè)中數(shù)據(jù)集規(guī)模的增長(zhǎng)趨勢(shì):
數(shù)據(jù)的海洋一直在增長(zhǎng)。有預(yù)測(cè)表明業(yè)務(wù)信息存儲(chǔ)量每年都會(huì)加倍。例如,Gartner發(fā)現(xiàn)全世界的信息量每年在以最少59%的速率增長(zhǎng),而其中大約85%的數(shù)據(jù)是“非結(jié)構(gòu)化”的——比如視頻剪輯、RFID標(biāo)簽和網(wǎng)站日志。這些非結(jié)構(gòu)化數(shù)據(jù)用傳統(tǒng)的數(shù)據(jù)管理系統(tǒng)來處理并不容易。此外,在很多場(chǎng)景下,客戶在實(shí)時(shí)收集新數(shù)據(jù)時(shí)發(fā)現(xiàn)數(shù)據(jù)增長(zhǎng)速率還在增加。
客戶將需要一個(gè)與業(yè)務(wù)及所收集數(shù)據(jù)的發(fā)展相適應(yīng)的現(xiàn)代數(shù)據(jù)平臺(tái)。對(duì)全球企業(yè)而言,大數(shù)據(jù)為從所收集數(shù)據(jù)(不管是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的)中找到新穎可行的觀點(diǎn)創(chuàng)造了大量商機(jī)。因?yàn)榈阶詈?,大?shù)據(jù)的最大前景就是推動(dòng)來自數(shù)據(jù)的、更智能的決策。而智能決策就要收集來自各類數(shù)據(jù)的觀點(diǎn)。
HDInsight是微軟應(yīng)對(duì)大數(shù)據(jù)的解決方案:
微軟希望通過支持Windows Server和Windows Azure的Hadoop發(fā)布版,提供可移植、性能優(yōu)越、安全且易部署等特性,促進(jìn)Hadoop的應(yīng)用。微軟還將通過在HDInsight中集成Active Directory來增強(qiáng)Hadoop的安全性。此舉將使IT部門能夠?qū)⑼瑯拥囊恢滦园踩呗杂糜诎?a href='/map/hadoop/' style='color:#000;font-size:inherit;'>Hadoop集群在內(nèi)的所有IT資產(chǎn)。
此外,通過與System Center集成,HDInsight簡(jiǎn)化了Hadoop的管理,并支持IT部門在同一面板上管理Hadoop集群、SQL Server數(shù)據(jù)庫和應(yīng)用程序。
基于Hadoop的Windows平臺(tái)應(yīng)用程序集成了如Excel、Power View和PowerPivot等微軟的商業(yè)智能(BI)工具,可以很容易地分析大量的業(yè)務(wù)信息,從而創(chuàng)造獨(dú)特的、差異化的商業(yè)價(jià)值。
為實(shí)現(xiàn)與Apache Hadoop百分之百的兼容性,微軟的Hadoop發(fā)布版HDInsight是基于Hortonworks Data Platform(HDP)構(gòu)建的。因此,客戶能夠?qū)⑵銶apReduce作業(yè)從自己的Windows服務(wù)器移到云中,甚至是移到運(yùn)行在Linux上的Apache Hadoop發(fā)布版中。目前還沒有其他廠商提供該功能。此外,在Windows Server和Azure平臺(tái)上提供這些功能,也使客戶能夠利用熟悉的工具(如Excel、PowerPivot for Excel和Power View)輕松地從數(shù)據(jù)中抽取可行的觀點(diǎn)。
SQL Server如何適應(yīng)這種解決方案:
在幫助企業(yè)處理大數(shù)據(jù)集方面,SQL Server 2012與SQL Server 2008最重要的區(qū)別之一就是與Hadoop的兼容性。Hadoop允許用戶處理大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)并快速從中獲得觀點(diǎn),而且,因?yàn)?a href='/map/hadoop/' style='color:#000;font-size:inherit;'>Hadoop是開源的,成本較低。Hadoop與SQL Server 2012兼容的特性是微軟與Hortonworks合作開發(fā)的,微軟最近也宣布Microsoft HDInsight Server和Windows Azure HDInsight Service已經(jīng)可以預(yù)覽,這都使用戶能夠使用微軟開發(fā)的Hadoop連接器來從數(shù)據(jù)中獲得最好的觀點(diǎn)。通過Hive ODBC Driver把SQL Server連接到Hadoop,客戶現(xiàn)在可以使用如PowerPivot和Power View等微軟的BI工具在SQL Server 2012中分析各種類型的數(shù)據(jù),包括非結(jié)構(gòu)化數(shù)據(jù)。此外,利用SQL Server 2012中新的Data Quality Services,客戶可以通過將原始數(shù)據(jù)轉(zhuǎn)換為適于建模的可靠且一致的數(shù)據(jù)來提高數(shù)據(jù)質(zhì)量。
微軟最近宣布了Office 2013 中的一些新特性,并介紹了開發(fā)者應(yīng)該如何利用這些特性來構(gòu)建構(gòu)建應(yīng)用和處理數(shù)據(jù)的服務(wù)。不足為奇,微軟自己在Excel正是利用這一點(diǎn)來提供大數(shù)據(jù)服務(wù)的:
Excel是微軟平臺(tái)上支持大數(shù)據(jù)分析的主要客戶端工具之一。在Excel 2013中,我們的主要工具是數(shù)據(jù)建模工具PowerPivot和數(shù)據(jù)可視化工具Power View,而且恰好它們都構(gòu)建進(jìn)來了,無需額外下載。這支持各個(gè)層次的用戶使用熟悉的Excel界面進(jìn)行自助式BI分析。
通過Excel的Hive插件,我們的HDInsight服務(wù)很容易集成Office 2013中的BI工具,使用戶能夠用熟悉的工具輕松地分析海量的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。
除了Excel之外,微軟還提供了其他的大數(shù)據(jù)交互工具:BI專業(yè)人員可以使用BI Developer Studio來設(shè)計(jì)OLAP cube或在SQL Server Analysis Services中設(shè)計(jì)可伸縮的PowerPivot模型。開發(fā)者可以繼續(xù)使用Visual Studio來開發(fā)和測(cè)試用.NET編寫的MapReduce程序。最后,IT運(yùn)維人員可以使用他們目前所使用的System Center來管理HDInsight上的Hadoop集群。
總的說來,微軟的策略看起來是要為客戶使用大數(shù)據(jù)提供一種最簡(jiǎn)單的方法——擴(kuò)展現(xiàn)有工具(如SQL Server和Office等),使之能夠無縫處理新數(shù)據(jù)類型,從而允許各公司在處理新業(yè)務(wù)時(shí)能利用原有投資.
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10