
教研部出品
編輯:葉不凡
隨著市場(chǎng)趨于成熟,要想保持企業(yè)的長(zhǎng)期競(jìng)爭(zhēng)力,產(chǎn)品和運(yùn)營(yíng)的改進(jìn)工作需要越來(lái)越精細(xì)化。
在電商領(lǐng)域,客戶的留存率是一個(gè)很重要的指標(biāo),為了提升留存率,需要精細(xì)化地分析客戶是哪一步流失的,按照購(gòu)買進(jìn)程和先后順序設(shè)置關(guān)鍵的節(jié)點(diǎn),分析這些節(jié)點(diǎn)的流失情況,從而得出客戶流失漏斗的模型。幫助我們通過(guò)對(duì)流失率高的環(huán)節(jié)進(jìn)行精細(xì)化分析,查找原因,假設(shè)購(gòu)物車在結(jié)算的時(shí)候用戶的使用體驗(yàn)不好,在核對(duì)訂單數(shù)據(jù)時(shí)常莫名出現(xiàn)這樣或那樣的技術(shù)問題,支付方式的設(shè)計(jì)不夠友好等,根據(jù)這些原因就可以有的放矢的在產(chǎn)品和運(yùn)營(yíng)側(cè)做出改進(jìn)了。
在保險(xiǎn)行業(yè),為了提高銷售效率,可以先通過(guò)模型預(yù)測(cè)出用戶的銷售響應(yīng)率,再根據(jù)用戶的響應(yīng)情況將用戶分別劃分為幾等,交由不同級(jí)別的銷售人員進(jìn)行跟進(jìn)。我們總掛在嘴邊上談?wù)摰?a href='/map/yonghuhuaxiang/' style='color:#000;font-size:inherit;'>用戶畫像,增長(zhǎng)黑客,產(chǎn)品畫像等等,實(shí)質(zhì)上都是在為實(shí)現(xiàn)更精細(xì)化地運(yùn)營(yíng)或者產(chǎn)品做出改進(jìn)。
這其中精細(xì)化對(duì)產(chǎn)品的改進(jìn)和運(yùn)營(yíng)將視企業(yè)應(yīng)用數(shù)據(jù)能力的高低從而對(duì)企業(yè)提出了很高的要求,因?yàn)檫@些改進(jìn)和決策的制定肯定不能拍腦門或者憑經(jīng)驗(yàn),它們需要建立在堅(jiān)實(shí)、可靠的數(shù)據(jù)分析的結(jié)果之上。
企業(yè)數(shù)據(jù)能力其實(shí)就是企業(yè)應(yīng)用數(shù)據(jù)的能力。這種能力總體上是由企業(yè)數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)的文化、具有特定技能的人以及具有特定功能的業(yè)務(wù)系統(tǒng)共同構(gòu)成。
那么企業(yè)要如何建設(shè)這種數(shù)據(jù)能力來(lái)適應(yīng)市場(chǎng)對(duì)于企業(yè)數(shù)據(jù)能力越來(lái)越高的要求呢?
從客戶留存率的分析過(guò)程中發(fā)現(xiàn)主要有以下三方面的工作:
為了更好的支持這三方面的工作,我們可以從以下這幾點(diǎn)入手:
1.對(duì)業(yè)務(wù)數(shù)據(jù)的維護(hù)和管理。這其中包括數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)湖的建設(shè),數(shù)據(jù)的標(biāo)準(zhǔn)、數(shù)據(jù)的質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)模型等數(shù)據(jù)治理相關(guān)內(nèi)容。不僅提高了尋找數(shù)據(jù)的效率,而且還保障了使用數(shù)據(jù)的安全。
2.基于特定主題的數(shù)據(jù)分析。包括基于各種業(yè)務(wù)指標(biāo)的計(jì)算,數(shù)據(jù)建模等。
3.利用數(shù)據(jù)管理及分析的相關(guān)工具及平臺(tái)對(duì)各業(yè)務(wù)數(shù)據(jù)進(jìn)行管理和分析。
由于以上三個(gè)方面對(duì)應(yīng)了不同的專業(yè)領(lǐng)域,不僅企業(yè)需要的技能很不一樣,企業(yè)內(nèi)部甚至常常需要分成不同的團(tuán)隊(duì)來(lái)支持。數(shù)據(jù)的日常維護(hù)和管理需要數(shù)據(jù)工程能力,數(shù)據(jù)分析需要的是分析和建模的能力,工具平臺(tái)的開發(fā)則需要軟件開發(fā)能力。
除了包含大量的規(guī)范文檔定義、流程設(shè)計(jì)、溝通宣導(dǎo)等數(shù)據(jù)管理工作之外,還要在企業(yè)內(nèi)部實(shí)現(xiàn)落地。通過(guò)工具平臺(tái)內(nèi)的內(nèi)建流程幫助企業(yè)數(shù)據(jù)管理的演進(jìn)上更進(jìn)一步。企業(yè)內(nèi)部只需少量的數(shù)據(jù)管理專家,并通過(guò)配合數(shù)據(jù)平臺(tái)研發(fā)團(tuán)隊(duì)來(lái)實(shí)現(xiàn)數(shù)據(jù)的管理。比如對(duì)于數(shù)據(jù)質(zhì)量的管理,數(shù)據(jù)管理專家可以針對(duì)具體的業(yè)務(wù)數(shù)據(jù)定義專用的數(shù)據(jù)質(zhì)量規(guī)則,如空值規(guī)則,值域范圍規(guī)則等。通過(guò)數(shù)據(jù)平臺(tái)將定義的這些規(guī)則進(jìn)行落地。然后數(shù)據(jù)平臺(tái)定期運(yùn)行腳本進(jìn)行相應(yīng)的數(shù)據(jù)質(zhì)量檢查,并生成數(shù)據(jù)質(zhì)量報(bào)告以及數(shù)據(jù)質(zhì)量告警,幫助團(tuán)隊(duì)進(jìn)行數(shù)據(jù)質(zhì)量改進(jìn)的工作。
數(shù)據(jù)分析工作也同樣需要工具平臺(tái)的支持。即使能通過(guò)一個(gè)簡(jiǎn)單的sql查詢語(yǔ)句就能實(shí)現(xiàn)的分析工作,也同樣需要提供一個(gè)查詢界面,慢慢的隨著分析工作趨于復(fù)雜,直接粗放的使用數(shù)據(jù)庫(kù)工具進(jìn)行分析會(huì)越來(lái)越顯得吃力和低效。通過(guò)將分析細(xì)分為即席查詢分析,實(shí)時(shí)報(bào)表,建模分析,線上模型推理等內(nèi)容。想要支持這些分析工作,沒有一個(gè)高效的工具平臺(tái)支撐是很難完成的。
如下圖所示:
企業(yè)不僅要從需求端發(fā)展數(shù)據(jù)管理和數(shù)據(jù)分析能力,而且數(shù)據(jù)平臺(tái)的建設(shè)同樣不可或缺,而且數(shù)據(jù)平臺(tái)的成熟程度直接關(guān)系到數(shù)據(jù)管理和數(shù)據(jù)分析的效率。
慢慢地隨著企業(yè)的不斷發(fā)展壯大,數(shù)據(jù)平臺(tái)會(huì)越來(lái)越成為數(shù)據(jù)能力的核心內(nèi)容。,隨著大量的數(shù)據(jù)平臺(tái)定制化需求被提出,數(shù)據(jù)平臺(tái)越來(lái)越難以滿足數(shù)據(jù)管理和數(shù)據(jù)分析的需求。
由于每個(gè)企業(yè)各自所處的情況不同,以上三個(gè)方面的工作量及對(duì)應(yīng)的人員需求量也不盡相同。有的企業(yè)將數(shù)據(jù)相關(guān)工具和平臺(tái)建設(shè)通過(guò)外部的采購(gòu)來(lái)實(shí)現(xiàn),功能上會(huì)相對(duì)完善,并且只需要完成工具平臺(tái)的運(yùn)維,管理流程落地和內(nèi)部系統(tǒng)集成,并且工具平臺(tái)的相關(guān)研發(fā)人員也可以盡量減少。如果工具和平臺(tái)采用的是基于開源工具自建的,雖然會(huì)有較多的自定義功能,但這需要擴(kuò)大工具平臺(tái)的研發(fā)團(tuán)隊(duì)。當(dāng)然也會(huì)有一些其他的企業(yè),如果數(shù)據(jù)管理和數(shù)據(jù)分析人員擁有較強(qiáng)的軟件研發(fā)能力,那么工具平臺(tái)的研發(fā)可能就與數(shù)據(jù)管理和分析合并到工作中去了。
通過(guò)對(duì)數(shù)據(jù)工作的拆解和分析,也可以從以下幾個(gè)維度來(lái)思考企業(yè)數(shù)據(jù)能力的建設(shè)。
一、數(shù)據(jù)人才資源的建設(shè)
從能力及其角色要求上可以大致將數(shù)據(jù)人才分為數(shù)據(jù)工程師/數(shù)據(jù)架構(gòu)師,數(shù)據(jù)分析師/數(shù)據(jù)科學(xué)家。作為對(duì)這些角色的定義。企業(yè)對(duì)這些角色的工作范圍和能力都有其相應(yīng)的要求,這樣企業(yè)就可以根據(jù)自身具體情況規(guī)劃出符合自身文化的數(shù)據(jù)人才資源體系結(jié)構(gòu),從而在招聘和培養(yǎng)人才上面有一個(gè)整體的思路和規(guī)劃。
二、人員組織和協(xié)作
企業(yè)的組織結(jié)構(gòu)一般分為職能型、項(xiàng)目型和矩陣型。
職能型組織一般是將核心的工作劃分為不同的功能部門,如產(chǎn)品,運(yùn)營(yíng),銷售,財(cái)務(wù),審計(jì)等,這些部門按照職責(zé)范圍大小組成從上到下的層級(jí),最終形成金字塔型的結(jié)構(gòu)。職能型組織結(jié)構(gòu)一個(gè)典型的例子就是政府部門和一些傳統(tǒng)的大型國(guó)企。其優(yōu)勢(shì)是利于各部門形成自己各自的專業(yè)優(yōu)勢(shì),劣勢(shì)是難以組成項(xiàng)目組以面向問題的方式解決企業(yè)問題。
項(xiàng)目型組織是以面向項(xiàng)目的方式組成項(xiàng)目組來(lái)實(shí)現(xiàn)人員組織和協(xié)作,其典型的例子是以外包業(yè)務(wù)為主的服務(wù)型公司。其優(yōu)勢(shì)是解決問題的效率高,但是不容易積累沉淀組織能力。
矩陣型組織則是希望避免職能型組織帶來(lái)的部門墻問題,在職能型的基礎(chǔ)上引入項(xiàng)目組織形式,在項(xiàng)目需要時(shí)從各職能部門抽調(diào)人員形成項(xiàng)目組,由項(xiàng)目組來(lái)統(tǒng)一管理。矩陣型組織常常使得某一個(gè)角色存在多位領(lǐng)導(dǎo),從而給員工晉升及工作安排帶來(lái)問題。
對(duì)于一個(gè)中大型企業(yè)而言,可以通過(guò)設(shè)立數(shù)據(jù)部并且將內(nèi)部進(jìn)一步細(xì)分為數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)工具平臺(tái)研發(fā)三類角色崗位,形成職能型的垂直組織結(jié)構(gòu)。并且從各類細(xì)分角色抽調(diào)一部分人組成項(xiàng)目組以支撐業(yè)務(wù)數(shù)據(jù)分析工作。這樣就形成了矩陣型的組織結(jié)構(gòu)。
通過(guò)對(duì)以上組織結(jié)構(gòu)的分析,企業(yè)要想做好數(shù)據(jù)工作,肯定還得涉及到很多需要更多智慧的管理工作細(xì)節(jié)。
三、數(shù)據(jù)工具平臺(tái)建設(shè)
企業(yè)的工具平臺(tái)往往是數(shù)據(jù)能力的依托和沉淀。數(shù)據(jù)管理中的標(biāo)準(zhǔn)和流程需要工具平臺(tái)的支持否則很容易變成空中樓閣。而數(shù)據(jù)分析當(dāng)中的一些工作也需要沉淀,如果不能在組織內(nèi)進(jìn)行交流和分享,那么企業(yè)的數(shù)據(jù)分析就變成了只是靠數(shù)據(jù)分析師自身的能力罷了。
一般我們將工具平臺(tái)的建設(shè)劃分為三種模式:
1.外部采購(gòu)。時(shí)間成本可以節(jié)省不少,但需要注意采購(gòu)的產(chǎn)品的功能邊界,并注意該產(chǎn)品是否可以和內(nèi)部系統(tǒng)有效集成,是否可以支持靈活的功能定制。
2.自建。一般考慮根據(jù)開源的項(xiàng)目進(jìn)行改造,這樣的方式的優(yōu)勢(shì)是可定制能力極強(qiáng),其缺點(diǎn)就是需要大量的相關(guān)人才資源做支撐且需要一定的時(shí)間周期。
3.還有一種處于中間的模式,即:在采購(gòu)產(chǎn)品的同時(shí)采購(gòu)定制化服務(wù),或者和第三方公司合作在基于開源產(chǎn)品的基礎(chǔ)上聯(lián)合開發(fā)和定制所需功能。
對(duì)于這些不同的工具平臺(tái)建設(shè)模式從長(zhǎng)遠(yuǎn)來(lái)看一個(gè)技術(shù)驅(qū)動(dòng)的企業(yè)肯定對(duì)可定制能力有很高的要求,所以是否具備可定制能力將是一個(gè)必選項(xiàng)。而從功能上來(lái)看,采購(gòu)的產(chǎn)品和服務(wù)往往難以完整的實(shí)現(xiàn)企業(yè)特定的數(shù)據(jù)管理和分析需求,因此就得需要企業(yè)通過(guò)基于這些產(chǎn)品提供的API進(jìn)行定制開發(fā)從而將已提供的功能界面舍棄。
假設(shè)如果我們要用阿里云的數(shù)據(jù)服務(wù),那么如何實(shí)施數(shù)據(jù)質(zhì)量管理呢?這時(shí)就得需要基于阿里云的API來(lái)開發(fā)一個(gè)質(zhì)量管理的工具,通過(guò)定義質(zhì)量規(guī)則,配合定期的質(zhì)量檢測(cè)任務(wù)調(diào)度來(lái)實(shí)現(xiàn)。
因此,企業(yè)開發(fā)自己的數(shù)據(jù)平臺(tái)界面將是企業(yè)數(shù)據(jù)工具和平臺(tái)建設(shè)的關(guān)鍵一步。它相當(dāng)于定義了企業(yè)自己的數(shù)據(jù)工作接口,而企業(yè)的特定需求服務(wù)是這一接口的具體實(shí)現(xiàn)而已。接口的定義往往比實(shí)現(xiàn)更重要,因?yàn)闀?huì)有太多的企業(yè)資產(chǎn)依賴這樣的接口去實(shí)現(xiàn),比如大量的ETL腳本。接口定義好了,企業(yè)就可以按照自己的方式去設(shè)計(jì)開發(fā)上層軟件,而這些上層軟件則構(gòu)成了企業(yè)的核心資產(chǎn)和競(jìng)爭(zhēng)力,而某個(gè)接口的具體實(shí)現(xiàn),則可以較為輕松的替換并且不影響企業(yè)的主要業(yè)務(wù)。
最后總結(jié)一下,綜上所述從數(shù)據(jù)工作做什么出發(fā)簡(jiǎn)要分析了企業(yè)如何進(jìn)行數(shù)據(jù)能力建設(shè),且結(jié)合自己的經(jīng)驗(yàn)從而分享一些自己的認(rèn)識(shí)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10