
最新大數(shù)據(jù)產(chǎn)業(yè)現(xiàn)狀和主要子行業(yè)介紹
大數(shù)據(jù)從源到流到匯聚應(yīng)用,包含數(shù)據(jù)入口、數(shù)據(jù)融合處理、數(shù)據(jù)應(yīng)用三個主要過程。從前到后看,這三個過程分別對應(yīng)于數(shù)據(jù)資產(chǎn)領(lǐng)域、數(shù)據(jù)融合與處理相關(guān)領(lǐng)域、數(shù)據(jù)應(yīng)用相關(guān)領(lǐng)域。
1) 數(shù)據(jù)資產(chǎn)領(lǐng)域
“數(shù)據(jù)正在成為一種(戰(zhàn)略)資產(chǎn)”已經(jīng)是行業(yè)的共識。大數(shù)據(jù)很大程度上是隨著社會信息化程度提高而在近期產(chǎn)生的,即是以前沒有或無法獲取且正在不斷生成的“新(fresh)”數(shù)據(jù)。不同的公司把握著各個數(shù)據(jù)入口,而把握數(shù)據(jù)資產(chǎn)的企業(yè)也必然成為大數(shù)據(jù)的首批和直接受益者。從公司業(yè)務(wù)模式上,數(shù)據(jù)資產(chǎn)公司可以區(qū)分為純數(shù)據(jù)資產(chǎn)公司和兼數(shù)據(jù)資產(chǎn)公司;從數(shù)據(jù)類型上,數(shù)據(jù)可以區(qū)分為交易數(shù)據(jù)(含詢價等)和交互數(shù)據(jù)。
純數(shù)據(jù)資產(chǎn)公司指其產(chǎn)品和業(yè)務(wù)即為數(shù)據(jù)本身,代表企業(yè)如友盟和個信互動等。友盟(Umeng)將核心代碼植入各種移動應(yīng)用,向移動應(yīng)用創(chuàng)業(yè)者提供應(yīng)用統(tǒng)計分析、用戶反饋等服務(wù),目前,國內(nèi)主流開發(fā)者大多是友盟的用戶,超過18萬的移動應(yīng)用從友盟服務(wù)中獲益。個信互動的個推平臺,面向公眾提供專業(yè)的手機推送解決方案,并向開發(fā)者提供推送的BI數(shù)據(jù),目前的接入用戶已經(jīng)超過6.8億。
不難看出,該類公司有幾個特征,
一是處于數(shù)據(jù)流中某個基礎(chǔ)性的控制節(jié)點;
二是在控制節(jié)點后聚集了一整類的兼數(shù)據(jù)資產(chǎn)型公司;
三是標(biāo)的數(shù)量很少,一個具體領(lǐng)域(如手機的信息推送或者應(yīng)用統(tǒng)計服務(wù))只能容納下1-2家企業(yè);四是該類企業(yè)處于底層,較少為非業(yè)界人士所知。
兼數(shù)據(jù)資產(chǎn)公司相對純數(shù)據(jù)資產(chǎn)公司顯然更多,下表按照交易數(shù)據(jù)與交互數(shù)據(jù)對其進(jìn)行分類整理。
表格中所列示的都是規(guī)模較大、有所成績的明星企業(yè),因為如果數(shù)據(jù)沒有相當(dāng)深度和廣度的累積,價值將非常低。但是,我們看到不斷有新的企業(yè)成長起來,百花齊放百家爭鳴,搶奪已有的入口或者開辟全新的入口。
2) 數(shù)據(jù)融合與處理相關(guān)領(lǐng)域
在數(shù)據(jù)融合與處理相關(guān)的領(lǐng)域,主要解決包含兩個方面的問題:一是數(shù)據(jù)標(biāo)準(zhǔn)化與有效性整理;二是面向過程(具體目的)的數(shù)據(jù)處理與粗提取。
典型的案例如征信數(shù)據(jù)庫,商業(yè)銀行與各信貸主體之間每天都在發(fā)生著海量交易,交易一旦發(fā)生則記錄進(jìn)入各商業(yè)銀行數(shù)據(jù)庫(錄入人員通過人機交互過程完成數(shù)據(jù)的標(biāo)準(zhǔn)化和預(yù)處理),每天晚上各商業(yè)銀行后臺對數(shù)據(jù)進(jìn)行整理和加密,次日將信貸主體與信用數(shù)據(jù)加密通過專用接口將數(shù)據(jù)包提交到征信數(shù)據(jù)中心,然后征信中心將各數(shù)據(jù)包加成導(dǎo)入到征信數(shù)據(jù)總庫進(jìn)行更新,完成數(shù)據(jù)標(biāo)準(zhǔn)化和有效性整理并形成更新后的數(shù)據(jù)狀態(tài)。而面向過程的數(shù)據(jù)處理與粗提取,比如對某信貸主體的征信數(shù)據(jù)進(jìn)行查詢后,可通過插件進(jìn)行破產(chǎn)風(fēng)險(企業(yè))或信用評分(個人)的簡單核算,不同金融機構(gòu)可設(shè)置不同的標(biāo)準(zhǔn),根據(jù)自身風(fēng)險政策完成初步的可否授信、授信額度大小的批量化評估。
較成熟的類似機構(gòu)包括彭博、萬得、同花順等,目前均局限于金融行業(yè),但每個行業(yè)都有不同的數(shù)據(jù)整合入庫的需求,而數(shù)據(jù)標(biāo)準(zhǔn)的制定及數(shù)據(jù)匯聚的執(zhí)行是其難點所在。另外,在大數(shù)據(jù)的融合與處理相關(guān)領(lǐng)域,兩個繞不開的點為基礎(chǔ)軟件(數(shù)據(jù)庫軟件)和云計算。
3) 數(shù)據(jù)應(yīng)用相關(guān)領(lǐng)域
如上文所述,掌握數(shù)據(jù)資產(chǎn)的企業(yè)群是大數(shù)據(jù)的首批和直接受益者,因為他們會自然、方便的對大數(shù)據(jù)進(jìn)行把玩、加工、消化、利用。而隨著應(yīng)用價值的逐步體現(xiàn)及大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,應(yīng)用將必然擴張到生產(chǎn)生活的方方面面,廣泛影響各行各業(yè)。
麥肯錫針對美國各個行業(yè)應(yīng)用大數(shù)據(jù)的潛在價值提升做了一個評估,從其中我們可以看到,大數(shù)據(jù)的應(yīng)用將使得金融保險、信息技術(shù)、公共管理、貿(mào)易物流等領(lǐng)域獲得極大的價值提升。
首先我們按照從硬件-基礎(chǔ)軟件-應(yīng)用軟件-信息服務(wù)和數(shù)據(jù)生成-存儲-處理-應(yīng)用兩條線各4個維度來劃分大數(shù)據(jù)的產(chǎn)業(yè)結(jié)構(gòu),涉及11大類主要的產(chǎn)品和服務(wù):采集設(shè)備、存儲設(shè)備、服務(wù)器、數(shù)據(jù)庫軟件、采集監(jiān)測軟件、智能搜索與分析軟件、系統(tǒng)集成、IT基礎(chǔ)設(shè)施服務(wù)、咨詢實施服務(wù)、信息安全以及云計算。
以上11種主要產(chǎn)品和服務(wù)都是大數(shù)據(jù)的重要構(gòu)成,缺一不可,但其中基礎(chǔ)軟件(數(shù)據(jù)庫軟件和分布式文件系統(tǒng))、應(yīng)用軟件是大數(shù)據(jù)產(chǎn)業(yè)價值轉(zhuǎn)化變現(xiàn)的最關(guān)鍵部分,云計算對大數(shù)據(jù)的廣泛應(yīng)用有著舉足輕重的意義,其他7種在某種意義上則是在原有基礎(chǔ)上持續(xù)更新并與大數(shù)據(jù)發(fā)展配套的過程。
在軟硬件和信息服務(wù)領(lǐng)域的垂直劃分中,我們認(rèn)為商業(yè)智能帶動的應(yīng)用軟件、云計算和信息安全是國內(nèi)大數(shù)據(jù)發(fā)展的三家馬車,也是更可能有所作為的地方。
1) 硬件與基礎(chǔ)軟件
大數(shù)據(jù)爆炸增長帶動硬件和基礎(chǔ)軟件發(fā)展。
存儲和服務(wù)基礎(chǔ)設(shè)施用于存儲產(chǎn)生的數(shù)據(jù),是數(shù)據(jù)周期的第一站。隨著“新摩爾定律”逐步得到驗證,預(yù)計大數(shù)據(jù)將呈現(xiàn)越來越快的增速,同時大數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)占比也將逐步提高,這直接推動著存儲和服務(wù)器行業(yè)的大發(fā)展。如何更快、更好、更準(zhǔn)確地把數(shù)據(jù)分門別類、按需存儲,提高存儲性能和計算能力,是存儲器和服務(wù)器提供商面臨的新問題?;A(chǔ)軟件提供商主要是提供操作系統(tǒng)、數(shù)據(jù)庫軟件等,對已經(jīng)存儲好的數(shù)據(jù)資源進(jìn)行高效管理,是存儲器、服務(wù)器的下游環(huán)節(jié)。存儲器、服務(wù)器等硬件設(shè)備的發(fā)展也將直接帶動基礎(chǔ)軟件的升級。
國際巨頭壟斷上述領(lǐng)域,寡頭格局已經(jīng)形成。
EMC、IBM、HP、Sumsung、Oracle等國際巨頭在硬件與基礎(chǔ)軟件領(lǐng)域精耕細(xì)作多年,市場競爭格局基本穩(wěn)定,寡頭競爭態(tài)勢明顯。因為其基礎(chǔ)軟件的優(yōu)勢,又逐步向更下游的應(yīng)用軟件等領(lǐng)域滲透,不斷完善自身產(chǎn)品線,提升客戶粘性。領(lǐng)先的技術(shù)優(yōu)勢、豐富的客戶資源、強大的并購能力等構(gòu)建了國際巨頭的護(hù)城河,使得國內(nèi)企業(yè)短期內(nèi)很難超越。
2) 商業(yè)智能應(yīng)用軟件
商業(yè)智能的體系和意義
從數(shù)據(jù)的最終利用深度來區(qū)分,商業(yè)智能劃分為數(shù)據(jù)報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘三個層次。其中,報表系統(tǒng)只是簡單地進(jìn)行數(shù)據(jù)管理,描述企業(yè)已經(jīng)發(fā)生的事件,比如Excel、水晶報表、Reporting Service等報表系統(tǒng);數(shù)據(jù)分析師對數(shù)據(jù)進(jìn)行優(yōu)化分析,解析造成企業(yè)
目前狀況的深層次原因,比如OLAP技術(shù);數(shù)據(jù)挖掘則是對數(shù)據(jù)進(jìn)行分析預(yù)測,發(fā)現(xiàn)知識、預(yù)測未來。商業(yè)智能的最終目的,是為了產(chǎn)生更好的商業(yè)決策。
商業(yè)智能的實現(xiàn)過程是通過收集來自企業(yè)內(nèi)部和外部各種數(shù)據(jù)源的不同數(shù)據(jù),提取有用信息,經(jīng)過數(shù)據(jù)清洗、轉(zhuǎn)換、重構(gòu)進(jìn)入數(shù)據(jù)倉庫或數(shù)據(jù)集市,然后通過合適的查詢和分析工具、數(shù)據(jù)挖掘工具、聯(lián)機分析處理工具對數(shù)據(jù)進(jìn)行加工處理,最終轉(zhuǎn)化為知識。從商業(yè)智能系統(tǒng)建立的技術(shù)角度看,構(gòu)建一個完整的商業(yè)智能系統(tǒng)涉及到的核心技術(shù)主要有數(shù)據(jù)倉庫(DW)技術(shù)、聯(lián)機分析處理(OLAP)技術(shù)、前端分析展示技術(shù)和數(shù)據(jù)挖掘(DM)技術(shù)等組成。
國內(nèi)現(xiàn)狀
國內(nèi)供應(yīng)商專注于報表軟件、應(yīng)用軟件和解決方案等領(lǐng)域。國內(nèi)BI廠商的共同特點是,產(chǎn)品線不全,廠商實力相對較弱,基本可以分為三類:第一類是從報表工具、展示工具軟件等延伸而來的廠商,這類廠商占絕大多數(shù),如潤乾、尚南科技等;第二類是從ERP等管理軟件延伸而來,如用友、浪潮、金蝶等,專注于戰(zhàn)線工具和分析模型方面,并開始向應(yīng)用軟件和行業(yè)解決方案轉(zhuǎn)型;第三類是專業(yè)BI廠商,如菲奈特融通、東方國信等,專注于BI應(yīng)用軟件和行業(yè)解決方案。國內(nèi)廠商在數(shù)據(jù)倉庫、數(shù)據(jù)集市、BI 工具平臺軟件等方面,缺乏有競爭力的產(chǎn)品。
3) 云計算
云計算的三種服務(wù)交付模式:IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺即服務(wù))和SaaS(軟件即服務(wù))。
IaaS
指的是以服務(wù)形式提供服務(wù)器、存儲和網(wǎng)絡(luò)硬件。這類基礎(chǔ)架構(gòu)一般是利用網(wǎng)格計算(GridComputing)架構(gòu)建立虛擬化的環(huán)境,因此虛擬化、集群和動態(tài)配置軟件也被涵蓋在IssS中,這方面代表有亞馬遜的彈性云服務(wù),ServePath下的GoGrid等;
PaaS
指的是以服務(wù)形式提供給開發(fā)人員應(yīng)用城市需開發(fā)及部署平臺,讓他們可利用此平臺來開發(fā)、部署和管理SaaS應(yīng)用程序;這種平臺一般包含數(shù)據(jù)庫、中間件及開發(fā)工具,所有都以服務(wù)形式通過互聯(lián)網(wǎng)提供;PaaS 也是SaaS 模式的一種應(yīng)用,這一層面的代表有Google App、Force.com、MOSSO等;
SaaS
指的是通過瀏覽器,以服務(wù)形式提供給用戶應(yīng)用程序;SaaS是一種軟件布局模型,其應(yīng)用專為網(wǎng)絡(luò)交付而設(shè)計,便于用戶通過互聯(lián)網(wǎng)托管、部署及介入;SaaS應(yīng)用軟件的價格通常為“全包”費用,囊括了通常的應(yīng)用軟件許可證費、軟件維護(hù)費以及技術(shù)支持費,將其統(tǒng)一為每個用戶的閱讀租用費;SaaS可以通過瀏覽器把應(yīng)用程序作為服務(wù)提供給成千上萬的用戶;這一層面的代表有Salesforce.com、google map、office live等;
云計算廠商則可以細(xì)分為平臺提供商、系統(tǒng)集成商和服務(wù)提供商。
平臺提供商
云計算需要能夠?qū)崿F(xiàn)虛擬化、自動負(fù)載平衡、隨需應(yīng)變的軟硬件平臺,這部分的提供商主要是傳統(tǒng)的軟硬件生產(chǎn)商,如Vmware、Oracle、Sun、IBM、Cisco等;國內(nèi)的相關(guān)公司包括浪潮信息、華勝天成、華為、中興、方正科技等;
系統(tǒng)集成商
幫助用戶搭建云計算的軟硬件平臺,尤其是企業(yè)私有云:代表廠商包括IBM、HP、Google、AT&T等;國內(nèi)公司包括華勝天成、浪潮軟件、東軟集團(tuán)等;
服務(wù)提供商
包括為企業(yè)和個人用戶提供計算和存儲資源的IaaS公司、為應(yīng)用開發(fā)者提供開發(fā)平臺的PaaS公司、SaaS應(yīng)用服務(wù)提供商;代表廠商包括Amazon、Rackspace、GoGrid、Force.com、Google、Salesforce等;國內(nèi)公司包括鵬博士、網(wǎng)宿科技、神州泰岳、用友、金蝶、焦點科技、生意寶等。
4) 信息安全
信息安全越發(fā)重要,迎來發(fā)展契機。
信息安全產(chǎn)品覆蓋硬件、軟件及服務(wù);細(xì)分領(lǐng)域眾多,競爭激烈且龍頭各異。
安全硬件主要包括防火墻/VPN、入侵檢測/防御系統(tǒng)(IDS/IPS)、統(tǒng)一威脅管理(UTM);安全軟件主要包括內(nèi)容安全與威脅管理、身份管理、訪問控制等;安全服務(wù)主要包括安全咨詢、等級評測、風(fēng)險評估、安全審計、運維管理、安全培訓(xùn)等方面。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10