
傳統(tǒng)IT列強(qiáng)和互聯(lián)網(wǎng)新貴們?nèi)绾螒?yīng)對(duì)大數(shù)據(jù)浪潮
本文是給對(duì)于大數(shù)據(jù)和IT知識(shí)有一定基礎(chǔ)的朋友看的,不是普及大數(shù)據(jù)基本概念的,對(duì)某些詞匯和說法需要你自己去查看一些相關(guān)資料。當(dāng)然本文也不談什么高深技術(shù),談的是不同的公司做大數(shù)據(jù)這個(gè)生意的理念和戰(zhàn)略思路。
我先說一個(gè)基礎(chǔ),然后再討論本文的具體問題。關(guān)于大數(shù)據(jù)的說法很多,有理解的不同,也有出于不同同目的,而導(dǎo)致的理解和說法不同。大數(shù)據(jù)最早脫胎于原來的經(jīng)營分析BI(Business Intelligence),而BI是為了解決人們對(duì)于企業(yè)經(jīng)營數(shù)據(jù)多維度的分析和洞察,從而支撐企業(yè)領(lǐng)導(dǎo)人做決策。
大數(shù)據(jù)
大數(shù)據(jù)的概念,不管是4V(Volume、Velocity、Variety、Value)還是5V(多了一個(gè)Veracity)等各種定義,還是全體數(shù)據(jù)、快速處理、相關(guān)關(guān)系等三大大數(shù)據(jù)核心特征,這些都是偏理論化的理解,是最基礎(chǔ)的東西,這里就不去細(xì)說了。在實(shí)際的大數(shù)據(jù)應(yīng)用中可以看成兩種類型:
1)加入大數(shù)據(jù)元素的BI革新,可以看作BI Plus。除了分析企業(yè)內(nèi)部經(jīng)營類信息之外,還可以融入大量以前看起來不相關(guān)和不可利用的數(shù)據(jù),圖片、日志、社交及其數(shù)據(jù)等等都在它的范疇之內(nèi)。
2)大數(shù)據(jù)大平臺(tái),是以海量數(shù)據(jù)為核心,進(jìn)行復(fù)雜行業(yè)建模和大量自學(xué)習(xí),數(shù)據(jù)來源于各種渠道。最終形成一個(gè)統(tǒng)一的大數(shù)據(jù)服務(wù)平臺(tái)。
總的來說,很多大的IT公司其實(shí)提供的是BI Plus大數(shù)據(jù)解決方案,而大的互聯(lián)網(wǎng)公司做的其實(shí)是第二種。從宣傳上,它們都被稱為大數(shù)據(jù)。
接下來我以問題和回答的方式來闡述這兩種大數(shù)據(jù)是如何存在于市場格局上的:
大數(shù)據(jù)來了,帶來的數(shù)據(jù)洪水,當(dāng)然對(duì)于傳統(tǒng)IT廠商來看,是支撐大數(shù)據(jù),例如Cisco、IBM、Oracle、HP等,但是無一例外的是,他們走的是高端路線,和互聯(lián)網(wǎng)廠商支撐大數(shù)據(jù)的大相徑庭。行業(yè)對(duì)此的看法也是不一致的,大數(shù)據(jù)應(yīng)該是低成本,還是高成本的?
關(guān)于所謂的高端路線,對(duì)于Oracle、IBM這類大公司,可以這么理解,他們關(guān)注的是大、中型企業(yè)客戶中的大數(shù)據(jù)銷售機(jī)會(huì),并且?guī)в泻芏嗟男袠I(yè)屬性。
基于傳統(tǒng)IT列強(qiáng)在對(duì)行業(yè)理解和行業(yè)解決方案成熟度、渠道合作伙伴、ISV等領(lǐng)域的基礎(chǔ),他們選擇這些能為他們帶來收入的中高端客戶作為目標(biāo)。從銷售上看,主要是銷售大數(shù)據(jù)解決方案,而不是大數(shù)據(jù)服務(wù),行業(yè)知識(shí)、領(lǐng)域?qū)<业荣Y源需要靠IT大公司的原有行業(yè)合作伙伴來提供助力。
這些IT公司提供大數(shù)據(jù)解決方案,本身算不上大數(shù)據(jù)的用戶,但是不妨礙他們開發(fā)出市場上具有競爭力的大數(shù)據(jù)解決方案,當(dāng)然,將來IT列強(qiáng)們也會(huì)把大數(shù)據(jù)大量用在公司內(nèi)部。
互聯(lián)網(wǎng)公司通常對(duì)于行業(yè)(非IT行業(yè))積累的底蘊(yùn)要差很多,互聯(lián)網(wǎng)的大數(shù)據(jù)通常是以通過大數(shù)據(jù)為自己產(chǎn)生價(jià)值為主,他們首先是大數(shù)據(jù)用戶,然后才會(huì)考慮去輸出大數(shù)據(jù)的價(jià)值。
這就決定了兩者對(duì)于大數(shù)據(jù)的出發(fā)點(diǎn)、說法和做法不同。它們之間完全是互相理解的,但是并不妨礙在公開場合的爭論和相互打擊,這畢竟是商業(yè)社會(huì)。
總的來說,大中型企業(yè)有能力自己購買和構(gòu)建大數(shù)據(jù)解決方案,作為內(nèi)部使用,這些企業(yè)在大數(shù)據(jù)IT方面的收入可以支撐IT廠商的收入增長。而大數(shù)據(jù)的真正大平臺(tái),還需要靠互聯(lián)網(wǎng)公司來推動(dòng)。
大數(shù)據(jù)技術(shù)的進(jìn)步,無論互聯(lián)網(wǎng)公司還是IT公司都會(huì)做出自己的貢獻(xiàn),但是目前看起來,傳統(tǒng)IT公司目標(biāo)是大中型客戶,而互聯(lián)網(wǎng)公司目標(biāo)是中小型客戶;互聯(lián)網(wǎng)公司的優(yōu)勢在于他們具有大數(shù)據(jù)運(yùn)營和服務(wù)的能力,這個(gè)在未來將會(huì)產(chǎn)生很大影響。
大數(shù)據(jù)分析最終的結(jié)果一定是結(jié)構(gòu)化的,這樣看來傳統(tǒng)的BI的價(jià)值更大。目前IT公司們都在宣揚(yáng)這個(gè)理念,他們采用什么樣的策略?
我不完全認(rèn)同大數(shù)據(jù)的分析結(jié)果一定是結(jié)構(gòu)化的這一個(gè)說法,雖然目前看起來是這樣。我覺得真正的核心在于大數(shù)據(jù)的分析結(jié)果是可視化的和可理解的。結(jié)構(gòu)化還是非結(jié)構(gòu)化都只是可視化之前的狀態(tài)和步驟。
關(guān)于傳統(tǒng)廠商在BI和大數(shù)據(jù)結(jié)合上的布局,通過Oracle、Teradata等公司的做法,我們可以這么理解:他們選擇了一個(gè)漸進(jìn)的思路,把大數(shù)據(jù)作為原有BI來源的一個(gè)補(bǔ)充,BI進(jìn)行小幅度改造即可兼容大數(shù)據(jù)(BI Plus)。這樣通過原有BI解決方案和新的大數(shù)據(jù)解決方案的結(jié)合,可以在盡可能少改變的情況下,利用新的大數(shù)據(jù)理念帶動(dòng)原有BI解決方案和產(chǎn)品的銷售。
在大、中型企業(yè)中,原有BI的投資已經(jīng)很多年了,IT廠商的思路是在這個(gè)基礎(chǔ)上進(jìn)行修修補(bǔ)補(bǔ),雖然不像互聯(lián)網(wǎng)巨頭那樣可以沒有顧慮地推廣全新的解決方案,具有很強(qiáng)顛覆性,但是,這種方式更易于受到企業(yè)客戶的歡迎、接受和買單。
互聯(lián)網(wǎng)巨頭們,通常沒有歷史遺留問題需要去考慮,所以他們引領(lǐng)的大數(shù)據(jù)浪潮,更多的是從完全新建和顛覆的角度去做的,畢竟它們自己就是這么做大數(shù)據(jù)的。
從市場來看,企業(yè)用戶的大數(shù)據(jù)項(xiàng)目基本都是傳統(tǒng)IT公司把持和提供服務(wù)的?;ヂ?lián)網(wǎng)公司的大數(shù)據(jù)理念、方案和服務(wù)雖然看起來很美,卻還不具有對(duì)外大規(guī)模輸出的能力,或許3-5年后會(huì)比較明朗。
大數(shù)據(jù)對(duì)傳統(tǒng)IT企業(yè)來說有多大威脅?大數(shù)據(jù)來了,對(duì)傳統(tǒng)軟件廠商的沖擊是什么,他們認(rèn)為大數(shù)據(jù)技術(shù)和傳統(tǒng)的軟件的技術(shù)是什么關(guān)系,如何保護(hù)傳統(tǒng)的價(jià)值?
這是一個(gè)經(jīng)常會(huì)被人問到的問題,其實(shí)這個(gè)問題是有些不很明確的。從IT整個(gè)大行業(yè)來看,大數(shù)據(jù)技術(shù)只是軟件技術(shù)應(yīng)用中的一種,如果說沖擊,大數(shù)據(jù)對(duì)于傳統(tǒng)的BI確實(shí)具有替代效果和沖擊。
大數(shù)據(jù)是從一個(gè)點(diǎn)(BI或者說類BI)去發(fā)力和顛覆。云服務(wù)是從一個(gè)面(平臺(tái)層)去發(fā)力和顛覆。
這種沖擊也是一個(gè)漸變的過程,所以IT公司也會(huì)不斷調(diào)整投資和業(yè)務(wù)方向,不能適應(yīng)的就會(huì)被市場拋棄。如果IT廠商目光短淺,僅僅立足于保護(hù)傳統(tǒng)BI的價(jià)值,那么可能前途堪憂,好在大數(shù)據(jù)的發(fā)展速度并不是很快,傳統(tǒng)IT列強(qiáng)們可以有足夠的反應(yīng)時(shí)間。
對(duì)于大數(shù)據(jù)領(lǐng)域,所有大的IT廠商都在邊看邊改變,也正是這種思路,導(dǎo)致大數(shù)據(jù)這個(gè)領(lǐng)域發(fā)展速度不夠快。
最后,從大的方面說一下自己的看法。對(duì)于IT行業(yè)來說,大數(shù)據(jù)只是一個(gè)熱點(diǎn),原本由IT領(lǐng)域引導(dǎo)的一個(gè)熱點(diǎn),現(xiàn)在變成所有的行業(yè)都在熱議的一個(gè)話題。也從另一個(gè)側(cè)面說明了IT領(lǐng)域?qū)狳c(diǎn)把握的能力。
近些年來成功的IT熱點(diǎn)——微機(jī)、互聯(lián)網(wǎng)、Web 2.0、SOA、云計(jì)算、大數(shù)據(jù)、人工智能這些不都是IT領(lǐng)域開發(fā)和宣傳出來的理念嗎?看看這些歷史,會(huì)覺得大數(shù)據(jù)不是那么特殊。
IT行業(yè)也在優(yōu)勝劣汰,適合的留下,不適合的死掉或者被收購,新的IT趨勢會(huì)引領(lǐng)行業(yè)發(fā)展,同時(shí)也在改造IT行業(yè)。人工智能提出好幾十年了,到現(xiàn)在也還不具有大規(guī)模推廣的能力。
對(duì)于大數(shù)據(jù)發(fā)展速度會(huì)有多快,如果更細(xì)化來看待分為兩種情況:
如果把大數(shù)據(jù)看作BI Plus,那么會(huì)發(fā)展得很快;如果看做理想中的“大數(shù)據(jù)大平臺(tái)+人工智能”,那么我想發(fā)展速度不會(huì)很快。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10