
大數(shù)據(jù)平臺(tái)在互聯(lián)網(wǎng)行業(yè)的應(yīng)用
本文是對(duì)大數(shù)據(jù)在互聯(lián)網(wǎng)行業(yè)應(yīng)用的總結(jié)。以實(shí)際經(jīng)驗(yàn)講解了大數(shù)據(jù)從雛形到發(fā)展,以及發(fā)展過(guò)程中傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)到大數(shù)據(jù)平臺(tái)的轉(zhuǎn)化和大數(shù)據(jù)的可視化應(yīng)用。
大數(shù)據(jù)顯雛形——發(fā)展
所有公司在一開(kāi)始時(shí),數(shù)據(jù)的建設(shè)都是比較落后的,但隨著互聯(lián)網(wǎng)的環(huán)境推動(dòng),以及公司計(jì)劃2013年在紐約交易所上市,這時(shí)候面臨一個(gè)很大的問(wèn)題。在上市之前,公司的數(shù)據(jù),無(wú)論是流量數(shù)據(jù)還是財(cái)務(wù)產(chǎn)品數(shù)據(jù)都需要經(jīng)過(guò)非常嚴(yán)格的審計(jì)。為此,我們開(kāi)始整理數(shù)據(jù),做數(shù)據(jù)報(bào)表,花費(fèi)一年多的時(shí)間做數(shù)據(jù)整理、數(shù)據(jù)規(guī)范,慢慢的大數(shù)據(jù)的平臺(tái)有了雛形。
后來(lái)公司上市之后,數(shù)據(jù)運(yùn)營(yíng)的重點(diǎn)從反映過(guò)去和現(xiàn)在的狀況轉(zhuǎn)變成指導(dǎo)業(yè)務(wù)、管理業(yè)績(jī)、支持銷(xiāo)售。
2015年到2016年這兩年,公司將目標(biāo)投入到數(shù)據(jù)智能上,建立了一個(gè)非常大的系統(tǒng)平臺(tái),并且讓整個(gè)銷(xiāo)售和產(chǎn)品運(yùn)營(yíng)體系全面實(shí)施數(shù)據(jù)化運(yùn)營(yíng)。在這個(gè)平臺(tái)上,我們不僅僅要進(jìn)行管理銷(xiāo)售,還要構(gòu)建銷(xiāo)售能力模型,預(yù)測(cè)未來(lái)業(yè)績(jī)。因?yàn)樵诿绹?guó)市場(chǎng)的股價(jià),更多的是依賴公司未來(lái)的發(fā)展,公司未來(lái)預(yù)期決定了公司現(xiàn)在的股價(jià),因此總共的業(yè)績(jī)預(yù)測(cè)非常重要,能夠非常精確的3 預(yù)測(cè)銷(xiāo)售更加重要。
大數(shù)據(jù)平臺(tái)建設(shè)
公司擁有很多的業(yè)務(wù)數(shù)據(jù)庫(kù),有訂單、CRM、合同管理、人力資源等數(shù)據(jù)庫(kù)。以往,我們會(huì)把這些數(shù)據(jù)庫(kù)里的數(shù)據(jù)做集成,做一個(gè)簡(jiǎn)單的數(shù)據(jù)倉(cāng)庫(kù),然后根據(jù)業(yè)務(wù)需求,在數(shù)據(jù)集成的基礎(chǔ)上,通過(guò)帆軟報(bào)表建立一個(gè)決策系統(tǒng),做數(shù)據(jù)展示,提供服務(wù)。這個(gè)過(guò)程的好處是開(kāi)發(fā)成本低,投入成本低,技術(shù)架構(gòu)簡(jiǎn)單,可以非??焖俚脑诠緝?nèi)部運(yùn)行起來(lái)。
但是這樣的方式隨著業(yè)務(wù)系統(tǒng)的增多,逐漸開(kāi)始不適用。一是業(yè)務(wù)數(shù)據(jù)多樣化、數(shù)據(jù)未集中管理、有效利用數(shù)據(jù)難度大;數(shù)據(jù)存儲(chǔ)能力受限,無(wú)法追溯較遠(yuǎn)的歷史數(shù)據(jù)。二是很多情況下,不同的產(chǎn)品經(jīng)理和工程師所提的需求是不同的,而且這些不同的需求本身是交織在一起的。因此不同的團(tuán)隊(duì)做出同樣的指標(biāo),由于數(shù)據(jù)指標(biāo)定義不一致,存在意義相近重復(fù)指標(biāo)的時(shí)候,管理層很難做出決策。三是分析和運(yùn)營(yíng)使用的數(shù)據(jù)渠道完全依賴于自身數(shù)據(jù)的監(jiān)控,這會(huì)導(dǎo)致IT部門(mén)工作壓力較大。
除了以上反映的問(wèn)題,公司在基于未來(lái)發(fā)展情況下又呈現(xiàn)了新一輪的現(xiàn)狀,并提出了以下需求:
l 業(yè)務(wù)的多元化發(fā)展,公司大量的并購(gòu)導(dǎo)致集團(tuán)數(shù)據(jù)量和數(shù)據(jù)需求爆發(fā)式增長(zhǎng);
l 數(shù)據(jù)網(wǎng)狀流通,基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)指標(biāo)缺少統(tǒng)一的元數(shù)據(jù)管理;
l 為了更好發(fā)掘數(shù)據(jù)價(jià)值,提升數(shù)據(jù)能力、構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)體系成為當(dāng)務(wù)之急。
大數(shù)據(jù)平臺(tái)業(yè)務(wù)架構(gòu)
集團(tuán)的業(yè)務(wù)架構(gòu)大體可以分為幾塊內(nèi)容。第一個(gè)是數(shù)據(jù)模型師。主要的工作是做好元數(shù)據(jù)管理,數(shù)據(jù)模型的開(kāi)發(fā)以及建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。第二個(gè)是數(shù)據(jù)開(kāi)發(fā)員,它會(huì)對(duì)接產(chǎn)品,然后去做一些業(yè)務(wù)開(kāi)發(fā)。第三個(gè)是業(yè)務(wù)人員,業(yè)務(wù)人員是運(yùn)營(yíng)、銷(xiāo)售、市場(chǎng)人員,在這個(gè)地方做了很多可視化來(lái)幫助他們做出決策。最后是公司的數(shù)據(jù)分析部門(mén),他們有很多對(duì)于審計(jì)包括公司一些非常核心的數(shù)據(jù)的分析需求,他們會(huì)通過(guò)獨(dú)立的數(shù)據(jù)查詢系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)多維度分析。
下圖是技術(shù)架構(gòu),在底層進(jìn)行數(shù)據(jù)存儲(chǔ),抓取數(shù)據(jù),并將存儲(chǔ)層的數(shù)據(jù)傳給處理層,在處理層完成業(yè)務(wù)計(jì)算,形成指標(biāo)。然后前端通過(guò)帆軟報(bào)表的應(yīng)用,將數(shù)據(jù)以業(yè)務(wù)報(bào)表的方式進(jìn)行圖形化展示,并在移動(dòng)報(bào)表APP上進(jìn)行展示。
除去這個(gè),我們還在管理上做了數(shù)據(jù)中心的建設(shè)規(guī)范。然后是數(shù)據(jù)質(zhì)量管理,包括確保數(shù)據(jù)的準(zhǔn)確性,為保證數(shù)據(jù)的及時(shí)性還建立了一個(gè)運(yùn)行和管理規(guī)范。這四塊結(jié)合起來(lái)以保證平臺(tái)的平穩(wěn)運(yùn)行。
大數(shù)據(jù)可視化
數(shù)據(jù)可視化是這個(gè)平臺(tái)最后的一步也是應(yīng)用范圍最廣的一步。這方面,由于我們
1、需求來(lái)源多:團(tuán)隊(duì)需要同時(shí)對(duì)接財(cái)務(wù)部、銷(xiāo)售中心、客服中心、管理層等各級(jí)部門(mén),且各個(gè)部門(mén)關(guān)注的指標(biāo)千差萬(wàn)別。
2、報(bào)表可視化方式多:需要通過(guò)明細(xì)表、匯總表、鉆取表以及各類圖表來(lái)分別滿足各個(gè)部門(mén)的不同管理職級(jí)的需求,還要給給需求方提供離線報(bào)表、實(shí)時(shí)報(bào)表、郵件&短信推送數(shù)據(jù)等多種渠道。
3、自定義開(kāi)發(fā)多:為了對(duì)接公司內(nèi)部的業(yè)務(wù)系統(tǒng),需要經(jīng)常自定義開(kāi)發(fā)。
所以,需要一個(gè)滿足這些需求的可視化報(bào)表開(kāi)發(fā)工具。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場(chǎng)景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問(wèn)題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09