
大數(shù)據(jù)分析領(lǐng)域的四大窘迫
在深圳大數(shù)據(jù)峰會(huì)上,永洪科技創(chuàng)始人&CEO何春濤依托他在BI和大數(shù)據(jù)分析20年的專業(yè)經(jīng)驗(yàn),為大家解析目前大數(shù)據(jù)分析領(lǐng)域的四個(gè)窘迫,以及5年內(nèi)全球范圍內(nèi)大數(shù)據(jù)分析領(lǐng)域的發(fā)展趨勢(shì),并就2016上半年永洪科技可喜的進(jìn)展?fàn)顩r向大家做了匯報(bào)。
大數(shù)據(jù)分析領(lǐng)域的四大窘迫
1、數(shù)據(jù)分析之?dāng)?shù)據(jù)準(zhǔn)備瓶頸:OLAP
我們知道從上個(gè)世紀(jì)90年代,甚至包括80年代末,OLAP就已經(jīng)被很好地使用了。但是我們知道企業(yè)的數(shù)據(jù)和運(yùn)營(yíng)的過程,是一個(gè)持續(xù)動(dòng)態(tài)變化的過程,它需要在第一時(shí)間交給業(yè)務(wù)部門做數(shù)據(jù)分析,而OLAP做不到這一點(diǎn)。一旦有一個(gè)數(shù)據(jù)分析的變化,我們需要交給IT部門去重新構(gòu)建OLAP。所以如果這個(gè)瓶頸不打掉,企業(yè)的數(shù)據(jù)化運(yùn)營(yíng)的鏈條是不通暢的,并且業(yè)務(wù)流程會(huì)很緩慢,同時(shí)企業(yè)的運(yùn)營(yíng)效率和競(jìng)爭(zhēng)能力也會(huì)大打折扣。
2、大數(shù)據(jù)分析之找到答案瓶頸:靜態(tài)報(bào)告
如果我們采用郵件的形式溝通,假設(shè)今天發(fā)出去,第二天才有回復(fù),那這一天就浪費(fèi)了。靜態(tài)報(bào)告就跟郵件一樣,我們需要的是一個(gè)及時(shí)交互的過程,對(duì)數(shù)據(jù)進(jìn)行分析、發(fā)掘它的價(jià)值。假如看到報(bào)告后,我們就發(fā)現(xiàn)了一個(gè)問題,然后可能就會(huì)去問第二個(gè)問題。比如華南的幾個(gè)業(yè)務(wù)增長(zhǎng)發(fā)生了變化,上個(gè)季度可能是100%的增長(zhǎng),到這個(gè)季度增長(zhǎng)降成了10%,這個(gè)時(shí)候我們就會(huì)去問為什么,但是靜態(tài)報(bào)告是不能告訴我們答案的。這個(gè)問題只能再交給IT部門重新計(jì)算一遍,再給出一張靜態(tài)報(bào)告。如果不打掉這個(gè)窘迫,會(huì)給企業(yè)數(shù)據(jù)化運(yùn)營(yíng)帶來(lái)很大的挑戰(zhàn)。
3、大數(shù)據(jù)分析之分析流程瓶頸:IT部門
一個(gè)企業(yè)里面有非常多的部門,假如有制造、市場(chǎng)、設(shè)計(jì)、人事、財(cái)務(wù)等部門。當(dāng)這些部門有數(shù)據(jù)分析的需求時(shí),他們都會(huì)遞交給IT部門,然后IT部門的加班非常嚴(yán)重,他們疲于應(yīng)付,但是這樣做出的結(jié)果還非常不好,大家對(duì)IT部門的詬病都很深。比如做中秋節(jié)的策劃,這個(gè)促銷策劃需要一些數(shù)據(jù)分析的報(bào)告來(lái)支撐。但是IT部門很可能在中秋節(jié)之前,還沒有把報(bào)告交給市場(chǎng)部門,這會(huì)給企業(yè)的營(yíng)銷帶來(lái)極大的不便。
4、大數(shù)據(jù)分析之廠商瓶頸:缺乏高質(zhì)量的本土廠商
我們認(rèn)為在國(guó)內(nèi)缺乏高質(zhì)量的本土廠商。以前大家在聊大數(shù)據(jù)分析這件事情時(shí),很可能會(huì)說SAP、IBM等等,卻沒有一家真的做得很棒的本土廠商出現(xiàn)。也有一些本土大數(shù)據(jù)分析廠商,往往以非常低的價(jià)格和比較差的服務(wù)去做一些低端的市場(chǎng)。
我們知道其實(shí)在目前的中國(guó),已經(jīng)有非常多的好的企業(yè),在各自的行業(yè)崛起。以前我們買一個(gè)電視機(jī),可能要買東芝,后來(lái)我們可以買海爾。以前買空調(diào)需要買三菱,現(xiàn)在我們要買美的或者格力。在各個(gè)行業(yè)都發(fā)生了巨大的改變,有非常多的本土廠商在崛起,但是大數(shù)據(jù)分析這個(gè)領(lǐng)域,我們認(rèn)為是沒有的。所以這是我們非常大的一個(gè)責(zé)任,希望可以和諸位一起深入有效地合作,去改變這個(gè)現(xiàn)狀,讓本土的廠商可以提供已有的服務(wù)和產(chǎn)品,幫助大家做好大數(shù)據(jù)分析的支撐和服務(wù)的工作。
最近五年全球的大數(shù)據(jù)分析的趨勢(shì)
1、探索性分析成為BI選型的唯一選擇
這是Gartner2012年、2013年、2014年、2015年連續(xù)4年的數(shù)據(jù)分析的研究報(bào)告,提到的唯一的一個(gè)共性,探索性分析已經(jīng)成為BI選型的唯一選擇。在以前可能大家會(huì)說,數(shù)據(jù)分析我們就會(huì)用Cognos、BIEE或者BO,但是在今年Gartner的報(bào)告里面,Cognos和BO已經(jīng)驅(qū)逐到第四象限,而BIEE已經(jīng)被驅(qū)逐出去了。所以這樣一個(gè)探索性分析的潮流,已經(jīng)完全改變了數(shù)據(jù)分析的現(xiàn)狀和未來(lái)。
為什么?就是因?yàn)橹拔曳治龅降母蠹曳窒淼哪切┢款i,其中業(yè)務(wù)人員自己動(dòng)手基于數(shù)據(jù)做分析,從發(fā)現(xiàn)問題找到答案再采取行動(dòng),整個(gè)過程都已經(jīng)變成了一個(gè)全球性的潮流。在這個(gè)方面,我也號(hào)召大家好好地審視一下自身的企業(yè),到底應(yīng)該怎么樣構(gòu)建下一代數(shù)據(jù)分析平臺(tái),去支撐未來(lái)5到10年的大數(shù)據(jù)分析的需求。
2、良好的企業(yè)管控下的探索式分析成為主流
早先業(yè)務(wù)人員使用數(shù)據(jù)分析,往往要使用一個(gè)離線的桌面程序,大家經(jīng)常用的桌面程序是什么呢?Excel,還有包括后面出現(xiàn)的excel的高級(jí)升級(jí)版。這些離線的探索性分析的產(chǎn)品,在上個(gè)世紀(jì)90年代后期一直到2000年初,都獲取了非常大的市場(chǎng)。
但是后來(lái)從Gartner的研究報(bào)告我們可以看到,很多企業(yè)尤其是大中型企業(yè)已經(jīng)發(fā)現(xiàn),如果采用離線的分析工具來(lái)對(duì)數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)的使用是缺乏良好的安全管控的,有可能非常重要的銷售數(shù)據(jù)、生產(chǎn)數(shù)據(jù),被分發(fā)到企業(yè)每個(gè)人員的終端筆記本上去了,這對(duì)企業(yè)的數(shù)據(jù)管控來(lái)說是非常可怕的。
我們目前構(gòu)建數(shù)據(jù)分析,尤其對(duì)外提供數(shù)據(jù)分析的時(shí)候,有一個(gè)說法叫“數(shù)據(jù)不出口,數(shù)據(jù)服務(wù)要出口”,是什么意思呢?數(shù)據(jù)的原料是不能夠離開這個(gè)企業(yè)的,但是數(shù)據(jù)的服務(wù)是可以從這個(gè)企業(yè)遞交給第三方的。那么去中心化的探索性分析被放棄了,很重要的一點(diǎn)就是我們需要在良好的企業(yè)管控之下,去進(jìn)行有序的、高質(zhì)量的、高安全性的數(shù)據(jù)化運(yùn)營(yíng)工作。
3、云計(jì)算成為必然趨勢(shì)
我們可以發(fā)現(xiàn)一個(gè)大趨勢(shì),最近這5年云計(jì)算已經(jīng)變成了一個(gè)現(xiàn)實(shí)了。像國(guó)外的AWS、IBM,他們已經(jīng)成為云計(jì)算非常大的玩家,在國(guó)內(nèi)我們也看到有騰訊云、阿里云等眾多的玩家。云計(jì)算改變了企業(yè)的IT服務(wù),但是從TEWI和Gartner市場(chǎng)的統(tǒng)計(jì)報(bào)告我們可以看到,幾乎所有大數(shù)據(jù)分析的廠商,他們收入的90%還是來(lái)自于線上的數(shù)據(jù)。為什么?這是一個(gè)很現(xiàn)實(shí)的問題,就是我們企業(yè)里面的數(shù)據(jù),絕大多數(shù)的企業(yè)的數(shù)據(jù),是不允許離開這個(gè)企業(yè)的。
所以我們分析這件事情的時(shí)候認(rèn)為,企業(yè)的數(shù)據(jù)化運(yùn)營(yíng)工作,會(huì)變成一個(gè)以私有云和公有云混合到一起的服務(wù)工作。它肯定不會(huì)是以前單純的私有云的服務(wù),也不會(huì)是大家想象的可能在未來(lái)5年,全部變成了公有云的服務(wù),它會(huì)變成一個(gè)混合架構(gòu)。
4、分析應(yīng)用市場(chǎng)將涌現(xiàn)巨大的創(chuàng)業(yè)機(jī)會(huì)
目前大數(shù)據(jù)分析的相關(guān)技術(shù)還在持續(xù)的演進(jìn)當(dāng)中,包括云計(jì)算、深度分析、自然語(yǔ)言等技術(shù)正在不斷地成熟,并且會(huì)被引進(jìn)到大數(shù)據(jù)分析這個(gè)領(lǐng)域里面,幫助企業(yè)更好地進(jìn)行數(shù)據(jù)的價(jià)值發(fā)掘工作。
另外我們看到,商業(yè)智能與分析是一個(gè)充分競(jìng)爭(zhēng)的全球化市場(chǎng),它對(duì)創(chuàng)業(yè)者的要求是非常高的。比如說,永洪最開始創(chuàng)立的時(shí)候,就需要跟Cognos、BO一起去競(jìng)爭(zhēng),因?yàn)檫@個(gè)市場(chǎng)是沒有任何壁壘的,它不需要牌照,在全球是一體化的競(jìng)爭(zhēng)工作。所以當(dāng)我們創(chuàng)業(yè)者要去做這個(gè)領(lǐng)域的時(shí)候,一定要確保自己在這個(gè)領(lǐng)域具備足夠強(qiáng)的競(jìng)爭(zhēng)力。另外我們也發(fā)現(xiàn),雖然在平臺(tái)和支撐上面創(chuàng)業(yè)的機(jī)會(huì)不是很多,但是在應(yīng)用市場(chǎng)這個(gè)機(jī)會(huì)非常的多。所以這給我們做垂直化應(yīng)用的企業(yè),帶來(lái)了很多的機(jī)會(huì)。
下一個(gè)趨勢(shì),我們認(rèn)為分析應(yīng)用市場(chǎng)將會(huì)涌現(xiàn)出巨大的機(jī)會(huì),永洪內(nèi)部培訓(xùn)很多同事,如果他們想做垂直的產(chǎn)品,我們也會(huì)把永洪的平臺(tái)開放給他們,讓他們基于永洪的產(chǎn)品去做像制造行業(yè)、銀行、能源、交通各個(gè)領(lǐng)域的垂直產(chǎn)品的分析。我們認(rèn)為分析市場(chǎng)將來(lái)會(huì)標(biāo)準(zhǔn)化,如果有人基于某個(gè)平臺(tái)構(gòu)建好一個(gè)分析應(yīng)用之后,他可以快速地遞交給全球各地的用戶,這是基于標(biāo)準(zhǔn)化的前提所能夠達(dá)到的一個(gè)結(jié)果。那么在標(biāo)準(zhǔn)化基礎(chǔ)上,會(huì)誕生幾家很巨大的平臺(tái)廠商。
5、大數(shù)據(jù)分析未來(lái)有望像PC和汽車一樣成為企業(yè)標(biāo)配
BI與大數(shù)據(jù)分析領(lǐng)域,我們認(rèn)為它還是處于比較早期的階段,像20年代的汽車行業(yè)。20年代汽車還是一個(gè)非常小眾的市場(chǎng),沒有進(jìn)入每個(gè)家庭。它也有點(diǎn)像80年代的PC行業(yè),當(dāng)時(shí)整個(gè)上網(wǎng)機(jī)會(huì)還不是特別的多,如果要上機(jī),我們需要單獨(dú)到一個(gè)IT中心去進(jìn)行上機(jī)的申請(qǐng)和最后上機(jī)的實(shí)際操作。但是大家知道,從80年代以后到90年代到2000年,PC變成企業(yè)和家庭里面每個(gè)人的標(biāo)配,到后來(lái)我們的手機(jī)變成每個(gè)企業(yè)和家庭的標(biāo)配。那么大數(shù)據(jù)分析將來(lái)也會(huì)變成企業(yè)里的每個(gè)業(yè)務(wù)人員的標(biāo)配。
我們認(rèn)為這在將來(lái)一定會(huì)變成現(xiàn)實(shí)的,這是在現(xiàn)在和將來(lái)永洪和大家一起持續(xù)努力的一個(gè)方向。我們要讓企業(yè)里的每個(gè)人,都可以成為我們的用戶,都可以因?yàn)槲覀兊臄?shù)據(jù)分析的能力,給自己賦能。這就是永洪的一個(gè)愿景:釋放數(shù)據(jù)的價(jià)值,人人都是數(shù)據(jù)分析師。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11