
摘自上海申銀萬(wàn)國(guó)證券研究所報(bào)告《大數(shù)據(jù),互聯(lián)網(wǎng)經(jīng)濟(jì)新內(nèi)核》
來(lái)自36大數(shù)據(jù)
我們正處在一個(gè)數(shù)據(jù)量爆發(fā)增長(zhǎng)的時(shí)代。 在摩爾定律長(zhǎng)達(dá) 50 年的支配下, 當(dāng)今的信息產(chǎn)業(yè)呈現(xiàn)出前所未有的繁榮,新的互聯(lián)網(wǎng)技術(shù)不斷涌現(xiàn)。從傳統(tǒng)互聯(lián)網(wǎng)的 PC終端, 到移動(dòng)互聯(lián)網(wǎng)的智能手機(jī),再到物聯(lián)網(wǎng)傳感器,技術(shù)革新使數(shù)據(jù)生產(chǎn)能力呈指數(shù)級(jí)提升。 據(jù) IDC 預(yù)測(cè), 目前每年數(shù)據(jù)的生產(chǎn)量是 8ZB( 1ZB=1012GB) , 2020 年將達(dá)到 40ZB。 屬于大數(shù)據(jù)的時(shí)代已經(jīng)到來(lái)。
數(shù)據(jù)產(chǎn)業(yè)有望呈現(xiàn)“線上數(shù)據(jù)化->線下數(shù)據(jù)化-> 數(shù)據(jù)流通“三段式發(fā)展過(guò)程。
(1)線上數(shù)據(jù)化:互聯(lián)網(wǎng) 1.0 時(shí)代,以互聯(lián)網(wǎng)企業(yè)為代表,最早沉淀線上數(shù)據(jù);
(2)線下數(shù)據(jù)化:“互聯(lián)網(wǎng)+”時(shí)代,以傳統(tǒng)線下企業(yè)為代表,借助互聯(lián)網(wǎng)實(shí)現(xiàn)數(shù)據(jù)化;
(3)數(shù)據(jù)流通:在線上/線下全產(chǎn)業(yè)實(shí)現(xiàn)數(shù)據(jù)化的趨勢(shì)下,數(shù)據(jù)在產(chǎn)業(yè)鏈上下游甚至跨產(chǎn)業(yè)流通并創(chuàng)造價(jià)值。
數(shù)據(jù)開(kāi)放大勢(shì)所趨。信息使用的邊際收益是遞增的,信息流動(dòng)和分享的范圍越大,創(chuàng)造的價(jià)值就越高,而線上/線下數(shù)據(jù)化和數(shù)據(jù)開(kāi)放正是信息大范圍流動(dòng)的兩大前提。推動(dòng)數(shù)據(jù)開(kāi)放和流通在發(fā)達(dá)國(guó)家已成為共識(shí),美歐多國(guó)通過(guò)國(guó)家戰(zhàn)略為數(shù)據(jù)開(kāi)放背書(shū)。自從“互聯(lián)網(wǎng)+”上升為我國(guó)戰(zhàn)略后,中央不斷加大力度推動(dòng)數(shù)據(jù)開(kāi)放,在地方政府和產(chǎn)業(yè)界的帶動(dòng)下,部分地區(qū)已經(jīng)做了諸多有益的嘗試。
從“流量思維”到“數(shù)據(jù)思維”。表面上看“數(shù)據(jù)思維”取代“流量思維”是為迎合技術(shù)發(fā)展而發(fā)生的態(tài)度轉(zhuǎn)變,但更深層次,從流量到數(shù)據(jù)是對(duì)整個(gè)互聯(lián)網(wǎng)經(jīng)濟(jì)的重新定義和洗牌,兩種思維分別是兩代互聯(lián)網(wǎng)經(jīng)濟(jì)的代表。
(1)思維本質(zhì):從優(yōu)化資源配置到生產(chǎn)核心資源。 第一代互聯(lián)網(wǎng)重構(gòu)的是時(shí)間、空間,本質(zhì)上是資源的優(yōu)化配置;而第二代互聯(lián)網(wǎng)的核心是數(shù)據(jù),數(shù)據(jù)成為了新的生產(chǎn)要素。
(2)經(jīng)濟(jì)價(jià)值:從流量的天花板到數(shù)據(jù)的萬(wàn)億空間。流量時(shí)代,互聯(lián)網(wǎng)撬動(dòng)的GDP 約為 2.5 萬(wàn)億人民幣( 2013 年),占到國(guó)內(nèi) GDP 總量的 4.4%;在經(jīng)歷了第一代互聯(lián)網(wǎng)時(shí)期的爆發(fā)式增長(zhǎng), BAT 等互聯(lián)網(wǎng)巨頭的流量規(guī)模已經(jīng)形成,變現(xiàn)方式單一將導(dǎo)致流量變成一種相對(duì)廉價(jià)資源;數(shù)據(jù)思維時(shí)代,企業(yè)將從單純追求“量”向追求“質(zhì)”轉(zhuǎn)變,大數(shù)據(jù)能夠幫助企業(yè)從有限的流量中挖掘更大的價(jià)值;根據(jù)我們的推算,大數(shù)據(jù)有望撬動(dòng)中國(guó) GDP 至少在萬(wàn)億量級(jí),將完全比肩流量經(jīng)濟(jì)。
數(shù)據(jù)流通的兩種模式:閉環(huán)生態(tài)、開(kāi)放交易。
(1)模式一:“內(nèi)部創(chuàng)新+外延并購(gòu)”形成閉環(huán)。 典型公司:阿里巴巴等互聯(lián)網(wǎng)巨頭。 這一模式可以理解為,以大型互聯(lián)網(wǎng)公司擁有的海量數(shù)據(jù)資源為根基,通過(guò)內(nèi)部創(chuàng)新和外延并購(gòu)構(gòu)建閉環(huán)生態(tài),推動(dòng)數(shù)據(jù)在閉環(huán)中流動(dòng)以創(chuàng)造價(jià)值。從“數(shù)據(jù)魔方(賣數(shù)據(jù)) -> 達(dá)摩盤(大數(shù)據(jù)營(yíng)銷平臺(tái)) -> 入股第一財(cái)經(jīng)(閉環(huán)生態(tài)區(qū)圈)”的發(fā)展路徑可以洞悉阿里逐步收縮的大數(shù)據(jù)戰(zhàn)略。
(2)模式二:打造開(kāi)放的大數(shù)據(jù)交易平臺(tái)。 典型平臺(tái)和公司:貴陽(yáng)大數(shù)據(jù)交易所,九次方大數(shù)據(jù)公司等。貴陽(yáng)大數(shù)據(jù)交易所是全球第一家大數(shù)據(jù)交易所,由政府和產(chǎn)業(yè)界共同發(fā)起成立,將引領(lǐng)中國(guó)大數(shù)據(jù)交易市場(chǎng)的發(fā)展,九次方作為其第二大股東,將成為積極推動(dòng)大數(shù)據(jù)開(kāi)放交易的先行者。
掘金產(chǎn)業(yè)鏈。我們將大數(shù)據(jù)產(chǎn)業(yè)鏈按上中下游劃分為:資源、技術(shù)、應(yīng)用。
(1)“互聯(lián)網(wǎng)+”時(shí)代,所有企業(yè)都有潛力發(fā)展成為數(shù)據(jù)資源公司,處于產(chǎn)業(yè)鏈的核心地位,數(shù)據(jù)是其持續(xù)變現(xiàn)的資本;
(2)產(chǎn)業(yè)發(fā)展初期,數(shù)據(jù)技術(shù)型公司,包括硬件、 基礎(chǔ)軟件、分析服務(wù)、信息安全等,是最直接的受益群體;
(3)數(shù)據(jù)開(kāi)放的趨勢(shì)下,極有可能引爆新一輪大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的格局,誕生具備創(chuàng)新式數(shù)據(jù)思維及突出技術(shù)實(shí)力的應(yīng)用型公司。
互聯(lián)網(wǎng)+時(shí)代, 數(shù)據(jù)資源型企業(yè)發(fā)展迎來(lái)歷史機(jī)遇。 我們?cè)诋a(chǎn)業(yè)升級(jí)三段論中提到,大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)發(fā)展到了線下數(shù)據(jù)化的階段。 眾多的互聯(lián)網(wǎng)公司和線下企業(yè)在數(shù)據(jù)思維的驅(qū)動(dòng)下, 生產(chǎn)和存儲(chǔ)著海量的數(shù)據(jù)資源,各類數(shù)據(jù)已然成為跑馬圈地的主要對(duì)象。 由于大數(shù)據(jù)資源未來(lái)將是企業(yè)價(jià)值的重要載體, 我們甚至可以這樣認(rèn)為: 所有企業(yè)都有潛力發(fā)展成為數(shù)據(jù)資源公司。
資源型公司處在產(chǎn)業(yè)鏈中的核心地位。 BAT 之所以能夠在大數(shù)據(jù)時(shí)代繼續(xù)坐穩(wěn)互聯(lián)網(wǎng)企業(yè)龍頭的位置,是因?yàn)樗鼈儙缀鯄艛嗔怂阉鳌?社交、電商等關(guān)鍵領(lǐng)域的數(shù)據(jù),并借此聚攏技術(shù)型、 創(chuàng)意型以及其他資源型公司,構(gòu)建由自己主導(dǎo)的生態(tài)圈。線下龍頭企業(yè)在觸網(wǎng)后同樣能夠生產(chǎn)豐富的數(shù)據(jù)資源,它們極有可能復(fù)制 BAT 在線上的成功路徑。大北農(nóng)結(jié)合豬管網(wǎng)、智農(nóng)商城、農(nóng)信網(wǎng)等打造的智慧大北農(nóng)生態(tài)圈, 即是傳統(tǒng)行業(yè)龍頭轉(zhuǎn)型數(shù)據(jù)資源型公司的成功典范。
資源型公司擁有持續(xù)變現(xiàn)的基礎(chǔ)。 大數(shù)據(jù)資源將幫助一部分企業(yè)從訂單型向運(yùn)營(yíng)型升級(jí),交易不再是一錘子買賣, 而是持續(xù)挖掘數(shù)據(jù)價(jià)值變現(xiàn)的動(dòng)態(tài)過(guò)程。 一些依托數(shù)據(jù)資源的運(yùn)營(yíng)型公司或?qū)⑼ㄟ^(guò)如下三步構(gòu)建閉環(huán):
1)公司與客戶達(dá)成協(xié)議,共建信息化平臺(tái);
2) 平臺(tái)沉淀出大數(shù)據(jù),公司對(duì)此具有使用權(quán)( 甚至擁有權(quán)) ;
3) 公司利用這部分大數(shù)據(jù)資源,獲取長(zhǎng)期可持續(xù)的價(jià)值回報(bào)。
石基信息利用酒店管理系統(tǒng)獲取的數(shù)據(jù)與阿里合作建立酒店預(yù)定平臺(tái)、易華錄以 PPP 的方式得到智慧城市的核心數(shù)據(jù)等, 都是訂單型向運(yùn)營(yíng)型轉(zhuǎn)變的典型案例。
向數(shù)據(jù)資源型公司升級(jí)的浪潮已至, “大數(shù)據(jù)+” 時(shí)代來(lái)臨。 我們認(rèn)為,互聯(lián)網(wǎng)+改革帶來(lái)的價(jià)值和紅利未來(lái)主要將以大數(shù)據(jù)的形式來(lái)呈現(xiàn), “大數(shù)據(jù)+” 將是這輪產(chǎn)業(yè)升級(jí)的根本目的和動(dòng)力。 在國(guó)家和產(chǎn)業(yè)界的大力推動(dòng)下, 消費(fèi)、醫(yī)療、金融、 制造業(yè)等各個(gè)領(lǐng)域均掀起了大數(shù)據(jù)的應(yīng)用熱潮。 據(jù)統(tǒng)計(jì), 自“互聯(lián)網(wǎng)+” 戰(zhàn)略提出以來(lái),已有百余家 A 股上市的傳統(tǒng)企業(yè)給制定了轉(zhuǎn)型方案。 我們精選出其中最有可能成功升級(jí)為數(shù)據(jù)資源型公司的標(biāo)的, 分行業(yè)列于下表:
基于以下觀點(diǎn),我們認(rèn)為在互聯(lián)網(wǎng)+時(shí)代, 數(shù)據(jù)資源型公司的數(shù)量會(huì)迎來(lái)井噴式的增長(zhǎng),傳統(tǒng)行業(yè)龍頭可利用數(shù)據(jù)資源鞏固自身地位, 但其他公司也將獲得彎道超車的機(jī)會(huì)。
1)互聯(lián)網(wǎng)+對(duì)傳統(tǒng)行業(yè)最直接的影響就是線上化后的數(shù)據(jù)化, 且對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、分析的成本在不斷下降, 因而互聯(lián)網(wǎng)公司對(duì)大數(shù)據(jù)資源的壟斷將被打破, 行業(yè)競(jìng)爭(zhēng)開(kāi)啟新格局;
2)快速轉(zhuǎn)型的傳統(tǒng)龍頭企業(yè)將重新整合所在的細(xì)分行業(yè), 構(gòu)建以自身為核心的生態(tài)圈,推動(dòng)大數(shù)據(jù)在其中的流通,提升整個(gè)產(chǎn)業(yè)鏈的效率;
3)目前正處于“大數(shù)據(jù)+” 發(fā)展的早期, 對(duì)這樣一個(gè)明顯具有網(wǎng)絡(luò)效應(yīng)的產(chǎn)業(yè)而言, 搶占先發(fā)優(yōu)勢(shì)極為重要,數(shù)據(jù)資源的積累程度將直接影響企業(yè)在大數(shù)據(jù)時(shí)代的地位和影響力。
大數(shù)據(jù)市場(chǎng)規(guī)模
Wikibon 估測(cè) 2014 年全球大數(shù)據(jù)市場(chǎng)規(guī)模達(dá)到 285 億美元,同比增長(zhǎng) 53.2%,大數(shù)據(jù)成為全球 IT 支出新的增長(zhǎng)點(diǎn);
而根據(jù)易觀國(guó)際的測(cè)算口徑, 2017 年我國(guó)大數(shù)據(jù)市場(chǎng)有望達(dá)到 170 億元。 全球大數(shù)據(jù)市場(chǎng)中,行業(yè)解決方案、計(jì)算分析服務(wù)、存儲(chǔ)服務(wù)、數(shù)據(jù)庫(kù)服務(wù)和大數(shù)據(jù)應(yīng)用為市場(chǎng)份額排名最靠前的細(xì)分市場(chǎng),分別占據(jù)35.4%、 17.3%、 14.7%、 12.5%和 7.9%的市場(chǎng)份額。云服務(wù)的市場(chǎng)份額為 6.3%,基礎(chǔ)軟件占據(jù) 3.8%的市場(chǎng)份額,網(wǎng)絡(luò)服務(wù)僅占據(jù)了 2%的市場(chǎng)份額??梢钥闯觯?大數(shù)據(jù)技術(shù)占據(jù)了絕大多數(shù)市場(chǎng)份額, 將成為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的最直接受益者,但從更廣義的角度來(lái)看,大數(shù)據(jù)帶來(lái)的是社會(huì)多個(gè)領(lǐng)域的創(chuàng)新和變革, 并將對(duì)傳統(tǒng)行業(yè)進(jìn)行改造,未來(lái)大數(shù)據(jù)應(yīng)用領(lǐng)域的發(fā)展空間難以估量, 據(jù)此, 麥肯錫曾預(yù)測(cè)中國(guó)大數(shù)據(jù)潛在市場(chǎng)將達(dá)到 1.57 萬(wàn)億元。
從公司層面上看,以 IBM 為首的 IT 巨頭在收入上遙遙領(lǐng)先; 創(chuàng)業(yè)型公司Cloudera、 Splunk 等的收入與巨頭廠商仍有差距。 2013 年 IBM 大數(shù)據(jù)業(yè)務(wù)收入為 13.68 億美元, HP 和 Dell 的大數(shù)據(jù)收入分別為 8.69 和 6.52 億美元,排在第二三位。三家公司的大數(shù)據(jù)業(yè)務(wù)均占總體收入的 1%左右。 收入最高的純大數(shù)據(jù)公司為Palantir( 為政府和金融機(jī)構(gòu)提供數(shù)據(jù)分析軟件服務(wù)), Pivotal(大數(shù)據(jù)集成產(chǎn)品,提供 Hadoop,內(nèi)存 SQL 數(shù)據(jù)庫(kù)以及 MPP 等多種服務(wù)) 和 Splunk(大規(guī)模機(jī)器數(shù)據(jù)收集,存儲(chǔ),可視化分析) , 分別為 4.18 億, 3 億, 2.83 億美元。
技術(shù)路徑之爭(zhēng)
大數(shù)據(jù)處理系統(tǒng)一般需要經(jīng)過(guò) 4 個(gè)主要環(huán)節(jié),包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)存儲(chǔ)與管理、計(jì)算處理、數(shù)據(jù)分析。
(1)數(shù)據(jù)準(zhǔn)備:在進(jìn)行存儲(chǔ)和處理之前,需要對(duì)數(shù)據(jù)進(jìn)行清洗、整理,傳統(tǒng)數(shù)據(jù)處理體系中稱為 ETL( Extracting, Transforming, Loading)過(guò)程。
(2)數(shù)據(jù)存儲(chǔ)與管理:大數(shù)據(jù)存儲(chǔ)系統(tǒng)不僅需要以極低的成本存儲(chǔ)海量數(shù)據(jù),還要適應(yīng)多樣化的非結(jié)構(gòu)化數(shù)據(jù)管理需求,具備數(shù)據(jù)格式上的可擴(kuò)展性。
(3)計(jì)算處理環(huán)節(jié):海量數(shù)據(jù)處理要消耗大量的計(jì)算資源,對(duì)于傳統(tǒng)單機(jī)或并行計(jì)算技術(shù)來(lái)說(shuō),速度、可擴(kuò)展性和成本上都難以適應(yīng)大數(shù)據(jù)計(jì)算分析的新需求。分而治之的分布式計(jì)算成為大數(shù)據(jù)的主流計(jì)算架構(gòu),但在一些特定場(chǎng)景下的實(shí)時(shí)性還需要大幅提升。
(4)數(shù)據(jù)分析環(huán)節(jié):數(shù)據(jù)分析環(huán)節(jié)需要從紛繁復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律提取新的知識(shí),是大數(shù)據(jù)價(jià)值挖掘的關(guān)鍵。
大數(shù)據(jù)解決方案基本可分為兩類, 由主流數(shù)據(jù)庫(kù)廠商主導(dǎo)的傳統(tǒng)方案升級(jí): 數(shù)據(jù)庫(kù)一體機(jī)(例如 Oracle ExaData 以及 IBM Netezza 等),以及以開(kāi)源力量為主的大數(shù)據(jù)技術(shù)( 以 Hadoop 為代表)。 隨著數(shù)據(jù)的海量化和快速增長(zhǎng)的趨勢(shì)不斷增強(qiáng),傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)技術(shù)表現(xiàn)出明顯的不足,如何以合理的成本獲得海量數(shù)據(jù)的高可用性已經(jīng)成為現(xiàn)代 IT 領(lǐng)域的重大挑戰(zhàn)。 大數(shù)據(jù)對(duì)數(shù)據(jù)分析、計(jì)算和存儲(chǔ)三個(gè)環(huán)節(jié)影響較大,需要對(duì)技術(shù)架構(gòu)和算法進(jìn)行重構(gòu),是當(dāng)前和未來(lái)一段時(shí)間大數(shù)據(jù)技術(shù)創(chuàng)新的焦點(diǎn)。在所有大數(shù)據(jù)解決方案中,最為引人注目的是由主流數(shù)據(jù)庫(kù)廠商主導(dǎo)的傳統(tǒng)方案升級(jí),以及以開(kāi)源力量為主的大數(shù)據(jù)技術(shù)。 兩者是相互補(bǔ)充的關(guān)系。
目前大數(shù)據(jù)開(kāi)源技術(shù)中使用最廣的是 Hadoop, 一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架。 Hadoop 框架的核心設(shè)計(jì)是: HDFS 和 MapReduce。 HDFS 為海量的數(shù)據(jù)提供了存儲(chǔ), 提供高吞吐量來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集的應(yīng)用程序。 而 MapReduce 為海量的數(shù)據(jù)提供計(jì)算,它將單個(gè)任務(wù)打碎,并將碎片任務(wù)(Map)發(fā)送到多個(gè)節(jié)點(diǎn)上,之后再以單個(gè)數(shù)據(jù)集的形式加載(Reduce)到數(shù)據(jù)倉(cāng)庫(kù)里。 基于以上特點(diǎn), 用戶可以輕松地在 Hadoop 上開(kāi)發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。
Hadoop 是大數(shù)據(jù)行業(yè)應(yīng)用最廣的分布式系統(tǒng)
產(chǎn)業(yè)鏈劃分: 硬件+基礎(chǔ)軟件+分析服務(wù)+信息安全
硬件領(lǐng)域,主要包括服務(wù)器和存儲(chǔ)兩個(gè)重要組成部分:
(1)服務(wù)器方面, 大數(shù)據(jù)應(yīng)用拉動(dòng)服務(wù)器銷量增長(zhǎng), 國(guó)內(nèi)廠商的市場(chǎng)占有率進(jìn)一步加強(qiáng)。 IDC 報(bào)告顯示:中國(guó) X86 服務(wù)器全年銷售額 350 億元,同比增長(zhǎng) 29.7%,再次成為全球增長(zhǎng)貢獻(xiàn)最大的市場(chǎng)。本土廠商市場(chǎng)占有率較 2013 年提升了 9.1 個(gè)百分點(diǎn),達(dá)到 60.4%。同時(shí)X86 服務(wù)器市場(chǎng)容量進(jìn)一步向高端轉(zhuǎn)移,四路高端領(lǐng)域出貨量同比增長(zhǎng) 30%,達(dá)到市場(chǎng)平均增速的 1.5 倍。
(2)存儲(chǔ)方面,本土廠商市場(chǎng)占有率不斷增加,入門級(jí)及中端存儲(chǔ)增長(zhǎng)速度快。 IDC 數(shù)據(jù)顯示 2015 年第一季度,由于華為、宏杉科技、浪潮、曙光等本地廠商在市場(chǎng)和技術(shù)層面的井噴式發(fā)展,市場(chǎng)占有率已經(jīng)達(dá)到 49.9%,首次拿下國(guó)內(nèi)市場(chǎng)的半壁江山。 此外數(shù)據(jù)顯示,存儲(chǔ)市場(chǎng)在中低端保持了較高的增長(zhǎng),高端存儲(chǔ)呈現(xiàn)萎靡狀態(tài),隨著技術(shù)的演進(jìn),更多高端存儲(chǔ)將被通過(guò)中低端存儲(chǔ)Scaleout 的解決方案替代, 進(jìn)一步為本土廠家提供機(jī)會(huì)。
基礎(chǔ)軟件領(lǐng)域,外國(guó)廠家占有絕對(duì)優(yōu)勢(shì), 技術(shù)是核心競(jìng)爭(zhēng)力, 由于基礎(chǔ)軟件以開(kāi)源軟件為主,市場(chǎng)規(guī)模有限。
Wikibon 預(yù)計(jì)到 2017 年 Hadoop 和 NoSQL 軟件/服務(wù)收入將達(dá)到約 35 億美元, 其中, Cloudera(Hadoop)和 MongoDB(NoSQL)是相關(guān)領(lǐng)域的代表性企業(yè)。
在 Hadoop 生態(tài)領(lǐng)域, Cloudera 是規(guī)模最大、知名度最高的企業(yè),也是當(dāng)前大數(shù)據(jù)領(lǐng)域最強(qiáng)有力的解決方案服務(wù)商之一。 2014 年 4 月Cloudera 融資 9 億美元, 估值約 41 億美元。 2014 年 12 月正式宣布在中國(guó)設(shè)立分公司, Cloudera 免費(fèi)版在國(guó)內(nèi)市場(chǎng)已經(jīng)占據(jù)了 80%的份額,并有越來(lái)越多的用戶轉(zhuǎn)向收費(fèi)的商業(yè)版本。 MongoDB, 原名 10gen,是使用頗為廣泛的 MongoDB 非關(guān)系型數(shù)據(jù)庫(kù)的創(chuàng)建者,在今年年初的新一輪融資之后,估值已達(dá)到約 16 億美元。
分析服務(wù)領(lǐng)域, 是目前大數(shù)據(jù)市場(chǎng)最重要的組成部分, 2014 年市場(chǎng)規(guī)模占比達(dá)35%, 而相關(guān)企業(yè)也得到了投資者的熱烈追捧。 美國(guó)知名的大數(shù)據(jù)分析企業(yè)包括Palantir 和 Splunk。 Palantir 是一家面向政府、金融機(jī)構(gòu)的軟件提供商, 其估值已達(dá)到 200 億美元,成為繼 Uber、 Airbnb 之后全美估值第三高的創(chuàng)業(yè)公司,關(guān)于Palantir, 最傳奇的說(shuō)法是,它幫助美國(guó)政府找到了本·拉登。 Palantir 以反恐為切入點(diǎn), 如今,政府和金融業(yè)務(wù)已經(jīng)成為 Palantir 的兩大支柱產(chǎn)品, 年收入預(yù)期至少在10 億美元。 Splunk 成立于 2006 年,是第一家大數(shù)據(jù)處理的上市公司,在首個(gè)交易日以 109%的漲幅撐開(kāi)了人們對(duì)大數(shù)據(jù)的想象空間。作為一家商業(yè)智能軟件提供商,其軟件平臺(tái)可以實(shí)時(shí)對(duì)任何 APP、服務(wù)器或網(wǎng)絡(luò)設(shè)備的機(jī)器數(shù)據(jù)進(jìn)行索引、監(jiān)控與分析,并將結(jié)果生成圖形化報(bào)表,在此基礎(chǔ)上幫助客戶避免服務(wù)性能降低或中斷。
信息安全領(lǐng)域,隨著大數(shù)據(jù)的發(fā)展重要性不斷提升, 大數(shù)據(jù)時(shí)代傳統(tǒng)信息安全企業(yè)將面臨新的機(jī)遇和挑戰(zhàn)。 隨著大數(shù)據(jù)時(shí)代的到來(lái),解決網(wǎng)絡(luò)安全問(wèn)題變得越來(lái)越難,傳統(tǒng)防御威脅的手段已逐漸失效, 大數(shù)據(jù)時(shí)代也被稱作“大泄密” 時(shí)代, PWC(普華永道)指出, 2014 年全球所有行業(yè)檢測(cè)到的網(wǎng)絡(luò)攻擊共有 4280 萬(wàn)次,比去年增長(zhǎng)了 48%。諸多網(wǎng)絡(luò)安全故障的發(fā)生,都表明大數(shù)據(jù)時(shí)代的安全問(wèn)題日漸惡化,而企業(yè)在大數(shù)據(jù)應(yīng)用前首先要考慮的就是數(shù)據(jù)安全威脅。因此隨著大數(shù)據(jù)產(chǎn)業(yè)的快速發(fā)展, 信息安全領(lǐng)域投資規(guī)模也將不斷擴(kuò)大。
我們認(rèn)為大數(shù)據(jù)技術(shù)型企業(yè)將最先受益于大數(shù)據(jù)行業(yè)的爆發(fā)式增長(zhǎng)
(1)國(guó)產(chǎn)服務(wù)器廠商市場(chǎng)占有率不斷增加, 市場(chǎng)容量進(jìn)一步向高端領(lǐng)域轉(zhuǎn)移;
(2)基礎(chǔ)軟件領(lǐng)域國(guó)外企業(yè)占有核心技術(shù)優(yōu)勢(shì),國(guó)內(nèi)企業(yè)主要集中于下游大數(shù)據(jù)處理分析領(lǐng)域;
(3)主要廠商仍處于數(shù)據(jù)分析階段,即訂單驅(qū)動(dòng)型商業(yè)模式,不具有數(shù)據(jù)運(yùn)營(yíng)權(quán)。但行業(yè)轉(zhuǎn)型動(dòng)力明顯,主流數(shù)據(jù)分析型企業(yè)紛紛嘗試直接獲取數(shù)據(jù)資源或與數(shù)據(jù)資源方合作實(shí)現(xiàn)平臺(tái)化發(fā)展,獲得持續(xù)性收入;
(4)信息安全依然是大數(shù)據(jù)技術(shù)發(fā)展的保障,行業(yè)需求將隨整體市場(chǎng)規(guī)模的擴(kuò)大而不斷發(fā)展。
數(shù)據(jù)應(yīng)用型企業(yè)位于大數(shù)據(jù)產(chǎn)業(yè)鏈的下游,通過(guò)對(duì)開(kāi)放數(shù)據(jù)的運(yùn)用或與數(shù)據(jù)資源型企業(yè)的合作實(shí)現(xiàn)大數(shù)據(jù)價(jià)值挖掘后的變現(xiàn)。 相比資源型與技術(shù)型企業(yè),應(yīng)用型企業(yè)以新興創(chuàng)業(yè)公司為主,先天帶有互聯(lián)網(wǎng)基因,專注于解決行業(yè)痛點(diǎn),是實(shí)現(xiàn)大數(shù)據(jù)商業(yè)化的關(guān)鍵一環(huán),按照終端用戶又可分為 2B 和 2C 兩類。
2B:面向企業(yè)或者公共政府部門,提供數(shù)據(jù)分析結(jié)果的服務(wù), 如交通流量數(shù)據(jù)公司 Inrix,
2C:面向個(gè)人,提供基于數(shù)據(jù)分析的服務(wù); 如 FlightCaster 基于分析過(guò)去十年里每個(gè)航班的情況,然后將其與過(guò)去和現(xiàn)實(shí)的天氣情況進(jìn)行匹配,預(yù)測(cè)航班是否會(huì)晚點(diǎn)。
數(shù)據(jù)應(yīng)用型企業(yè)可能同時(shí)手握大數(shù)據(jù)資源并擁有大數(shù)據(jù)分析核心技術(shù),但與傳統(tǒng)線下企業(yè)和 IT 企業(yè)不同的是,我們更強(qiáng)調(diào)創(chuàng)新式思維模式及數(shù)據(jù)變現(xiàn)能力。 如 Netflix,美國(guó)最大的商業(yè)視頻網(wǎng)站,擁有 2900 萬(wàn)個(gè)用戶。每天采集海量的用戶數(shù)據(jù),不僅包括人們喜歡看什么類型的視頻,在哪看,用什么設(shè)備看等,還包括你何時(shí)快進(jìn),何時(shí)暫停,是否看完整個(gè)影片等。 Netflix 通過(guò)對(duì)海量數(shù)據(jù)的分析推出史上首部大數(shù)據(jù)制作的電視劇《紙牌屋》 。
數(shù)據(jù)應(yīng)用型企業(yè)不等同于數(shù)據(jù)分析型企業(yè),前者強(qiáng)調(diào)眾包思想,具有獨(dú)立的數(shù)據(jù)變現(xiàn)模式, 可以與數(shù)據(jù)資源型企業(yè)共創(chuàng)價(jià)值,充分挖掘大數(shù)據(jù)開(kāi)放流動(dòng)帶來(lái)的資源紅利, 體現(xiàn)了大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的理念;而數(shù)據(jù)分析型企業(yè)則更像是外包商, 為客戶提供服務(wù),是原有商業(yè)模式的補(bǔ)充。 對(duì)于外包和眾包, 寶潔公司負(fù)責(zé)科技創(chuàng)新的副總裁 Larry Huston 評(píng)價(jià)道, “外包是指我們雇傭人員提供服務(wù),勞資雙方的關(guān)系到此為止,其實(shí)和雇傭關(guān)系沒(méi)什么兩樣。但是現(xiàn)在我們的做法是從外部吸引人才的參與,使他們參與到這廣闊的創(chuàng)新與合作過(guò)程。這是兩種完全不同的概念。 ” 外包強(qiáng)調(diào)高度專業(yè)化,是企業(yè)的購(gòu)買活動(dòng),而眾包則是跨專業(yè)創(chuàng)新的過(guò)程, 應(yīng)用型企業(yè)與資源型企業(yè)不是雇傭而是合作關(guān)系。
政府?dāng)?shù)據(jù)開(kāi)放為數(shù)據(jù)應(yīng)用型企業(yè)提供了發(fā)展良機(jī), 數(shù)據(jù)的開(kāi)放和流通,將極大促進(jìn)數(shù)據(jù)價(jià)值釋放, 掀起新一輪大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的浪潮,不亞于當(dāng)初的移動(dòng)應(yīng)用及手游開(kāi)發(fā)。 關(guān)于政府?dāng)?shù)據(jù)開(kāi)放一個(gè)典型的例子就是 1983 年美國(guó)將用于軍事的衛(wèi)星定位系統(tǒng) GPS 向公眾開(kāi)放使用,并且在 2000 年后取消了對(duì)民用的 GPS 精度的限制。GPS 數(shù)據(jù)開(kāi)放后,帶動(dòng)了一連串的生產(chǎn)和生活服務(wù)創(chuàng)新,包括汽車導(dǎo)航、精準(zhǔn)農(nóng)業(yè)、通信等,同時(shí)創(chuàng)造了大量就業(yè)崗位,僅美國(guó)國(guó)內(nèi)就有約 300 萬(wàn)的就業(yè)崗位依賴于 GPS。再看互聯(lián)網(wǎng)開(kāi)放平臺(tái)為第三方企業(yè)創(chuàng)造的價(jià)值, 以騰訊為例, 騰訊希望成為互聯(lián)網(wǎng)連接器, 一端連接合作伙伴,一端連接海量用戶, 共同打造互聯(lián)網(wǎng)生態(tài), 從 2010 年實(shí)施平臺(tái)開(kāi)放以來(lái), 截止 2013 年末,第三方收益達(dá)到 50 億,今年有望突破百億, 創(chuàng)業(yè)者人數(shù)超過(guò) 500 萬(wàn)。 我們認(rèn)為類似于互聯(lián)網(wǎng)開(kāi)放平臺(tái)所能創(chuàng)造的價(jià)值, 依托大數(shù)據(jù)開(kāi)放平臺(tái), 在各細(xì)分垂直領(lǐng)域必將誕生一批“小而美” 的數(shù)據(jù)應(yīng)用型企業(yè)。
國(guó)外已有一些數(shù)據(jù)應(yīng)用型企業(yè)深耕多年, 涉及范圍有交通、醫(yī)療、 營(yíng)銷等。 Inrix是一家典型的數(shù)據(jù)應(yīng)用型企業(yè),致力于為全球交通問(wèn)題提供智能數(shù)據(jù)和先進(jìn)的分析方法,截至 2012 年 12 月已經(jīng)為全球 32 個(gè)國(guó)家的企業(yè)提供了服務(wù)。 目前奧迪公司、德國(guó)汽車俱樂(lè)部、荷蘭汽車協(xié)會(huì)、寶馬汽車公司、英國(guó)廣播公司、福特汽車公司、微軟公司、豐田汽車公司和沃達(dá)豐公司等都是它的親密合作伙伴。 Inrix 依靠分析歷史和實(shí)時(shí)路況數(shù)據(jù),能給出及時(shí)的路況報(bào)告,以幫助司機(jī)避開(kāi)正在堵車的路段,并且?guī)退麄兲崆耙?guī)劃好行程。
國(guó)內(nèi)多數(shù)的數(shù)據(jù)應(yīng)用型企業(yè)還處于初創(chuàng)階段, 2014 年底藍(lán)色光標(biāo)以接近 2500萬(wàn)美元的金額認(rèn)購(gòu)數(shù)據(jù)營(yíng)銷技術(shù)公司精碩科技(Admaster Inc)約 12%的股份, 后者估值超過(guò) 2 億美元大關(guān)。 AdMaste 是國(guó)內(nèi)少有的第三方數(shù)字營(yíng)銷監(jiān)測(cè)和調(diào)研機(jī)構(gòu),專注于為廣告主提供全流程的網(wǎng)絡(luò)廣告效果監(jiān)測(cè)、分析評(píng)估、媒介優(yōu)化咨詢和技術(shù)解決方案等服務(wù)。 在細(xì)分領(lǐng)域, 國(guó)內(nèi)影視大數(shù)據(jù)龍頭企業(yè)艾漫科技于今年年初完成 A輪超 6000 萬(wàn)人民幣融資,這是迄今為止國(guó)內(nèi)關(guān)于娛樂(lè)影視大數(shù)據(jù)領(lǐng)域最大的一筆 A輪融資,由榮聯(lián)創(chuàng)富基金和創(chuàng)勢(shì)資本聯(lián)合投資。
基于以下觀點(diǎn),我們認(rèn)為數(shù)據(jù)應(yīng)用型企業(yè)在未來(lái)幾年將會(huì)進(jìn)入快速發(fā)展階段。
(1)數(shù)據(jù)規(guī)模爆炸加政府助推數(shù)據(jù)開(kāi)放, 任何一個(gè)企業(yè)掌握大數(shù)據(jù),都不可能只憑借其一己之力充分挖掘大數(shù)據(jù)的價(jià)值,勢(shì)必應(yīng)當(dāng)群策群力。
(2)政府、 金融、電信、電子商務(wù)、物流、媒體等行業(yè)正迎來(lái)大數(shù)據(jù)應(yīng)用井噴期,萬(wàn)億市場(chǎng)規(guī)模可期, 各大生態(tài)體系都將為新型企業(yè)崛起提供機(jī)會(huì)。
(3)應(yīng)用型企業(yè)兼具互聯(lián)網(wǎng)/大數(shù)據(jù)思維與技術(shù),相比傳統(tǒng)企業(yè),可以更快發(fā)現(xiàn)行業(yè)痛點(diǎn)并加以解決, 實(shí)現(xiàn)彎道超車。
(4)數(shù)據(jù)分析型企業(yè)轉(zhuǎn)型動(dòng)機(jī)強(qiáng)烈,希望參與大數(shù)據(jù)應(yīng)用變現(xiàn)帶來(lái)的巨大收益。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03