
國家全面倡導數(shù)字化,顯然是預見了經(jīng)濟發(fā)展的大趨勢。為此,各大企業(yè)積極響應國家號召,緊鑼密鼓地部署并推進數(shù)字化轉(zhuǎn)型。然而,隨著時間的推移,各種挑戰(zhàn)和瓶頸逐漸暴露出來,越來越多轉(zhuǎn)型的企業(yè)陷入四面楚歌、難以突圍的境況。
企業(yè)數(shù)字化轉(zhuǎn)型往往后勁力量越來越薄弱,無法達到預期效果,問題可能出在根部,所謂根部就是注重數(shù)字化人才培養(yǎng)。
從小數(shù)據(jù)到大數(shù)據(jù)的分析思路均源于驗證性數(shù)據(jù)分析,因此,業(yè)務需求尤為重要,而需求從何而來是由數(shù)據(jù)分析師所處的行業(yè)而定。
數(shù)據(jù)分析的需求來源包括閱讀運營報告、痛點研究、未來戰(zhàn)略方向。
談到運營報告就不得不提及數(shù)據(jù)庫。我們經(jīng)常將數(shù)據(jù)庫喻為“數(shù)據(jù)海洋”,其數(shù)量和內(nèi)容之多超出我們的想象。就電商公司而言,數(shù)據(jù)庫裝載幾千張表是很正常的現(xiàn)象,每張表的數(shù)據(jù)從幾十列到上百列不等,整個數(shù)據(jù)庫至少有幾萬列數(shù)據(jù)。一名數(shù)據(jù)分析師僅僅了解這些字段(基于描述類工作),估計沒有一年半載是辦不到的。
運營報告包含很多有用字段,凡是能在報告里出現(xiàn)的字段都是經(jīng)過業(yè)務人員過濾并經(jīng)過幾年的持續(xù)修改而成的,這恰恰包含了數(shù)據(jù)分析所需要的統(tǒng)計信息。
如果事先有對業(yè)務問題進行總結(jié),那么運營報告中的字段將得到大幅縮減。例如,如果消費者關注商品顏色,那么運營報告需要提及這一字段,并設計相應的營銷方案;相反,如果最近業(yè)務更加關注客戶滿意度,那么商品顏色這一字段就用不上了,運營報告自然也不會提及這一字段。由此看來,數(shù)據(jù)庫中只有部分字段能夠充分利用起來(通常認為只有不足10% 的字段經(jīng)常被使用),而其他字段可能暫時還沒有用。
(1)因變量y 和自變量x 從何而來?
公司每段時期出現(xiàn)的問題都會呈現(xiàn)在報告中,問題所在之處就是量化y。有了y 后,需要對問題進行歸因,而變量x 就是結(jié)果y 的歸因因素,因此尋找影響因素x 是建模的主要過程。尋找x,不是從數(shù)據(jù)海洋中搜尋,而是判斷運營報告中提到的字段。
理論上說,報告中涉及的字段都有可能成為y 或x,但企業(yè)在每段時期暴露的嚴重問題涉及的字段才最有可能是y,而且y 并不會很多,因為大多數(shù)問題,只有幾個主導的因素。例如,訂單下滑、滿意度不佳、活躍度不夠等問題的根本原因可能是廣告投放失效,那么廣告投放就是當前的y。x 是歸因的依據(jù)。模型是尋找影響因素最快捷的方式,如果能夠掌握數(shù)據(jù)分析方法,那么搜尋x 的過程就簡捷多了。
我們是否需要尋找報告之外的x 呢?這實際上涉及數(shù)據(jù)分析的創(chuàng)新,但創(chuàng)新是發(fā)生在夯實的業(yè)務基礎之上的。也就是只有具備了數(shù)據(jù)分析技術、業(yè)務知識,再加上時間的積累,創(chuàng)新才有望發(fā)生。數(shù)據(jù)分析師職業(yè)生涯前2 ~ 3 年,無須尋找這部分x。
(2)搭建模型的前提是業(yè)務準備
數(shù)據(jù)降維(x 的篩選過程)和角色問題確定后,需要做的是模型搭建。數(shù)據(jù)分析師應該用“點→線→面”的思路來完成業(yè)務梳理,進而完成構(gòu)筑模型所需的一切業(yè)務準備。只有把點的問題還原成面的問題,痛點問題才有望被解決。
點的問題就是造成損失的環(huán)節(jié)。例如,商品導致的業(yè)務問題,如毛利潤太低、供應商供貨問題等。損失之處就是因變量y。然后圍繞因變量y 探討解決方案,這就是自變量x 與因變量y 間的結(jié)構(gòu)關系,y 的問題就是點的問題。線的問題,即自變量x 是如何影響因變量y 的,其重點在尋求歸因,即整體結(jié)構(gòu)。如果我們將各部門發(fā)生的事件歸納起來,并通過點和線的分析方式將這些事件編織成面的問題,然后使用統(tǒng)計技術控制每個環(huán)節(jié),促使業(yè)務問題與統(tǒng)計解決方案同步,那么統(tǒng)計方法將得到有效的運用。
企業(yè)在某段時間可能會面臨某個嚴重的業(yè)務問題,企業(yè)所有資源和人力都將用于解決這個問題,數(shù)據(jù)分析師當然也不例外。企業(yè)每個時期的痛點各不相同,問題一般會持續(xù)3~6 個月。例如,老客戶流失嚴重,首先需要找到y(tǒng),如果數(shù)據(jù)庫中沒有字段與該問題對應,則需要想辦法構(gòu)建人工字段b,即用商品購買周期的兩倍來預判客戶流失(這是人工字段)的嚴重性。有了y 后,要尋找影響因素x,構(gòu)建客戶流失模型。完成模型構(gòu)建后,在因變量與自變量間歸因是不是就自然發(fā)生了呢?最終就能找到痛點的真正原因了呢?顯然,據(jù)此得出的結(jié)論過于單薄。
痛點問題是很多問題的綜合性表現(xiàn),且一個模型能解釋的信息是有限的。對痛點問題進行歸因是環(huán)環(huán)相套的。
研究痛點僅僅是幫助我們發(fā)現(xiàn)歸因鏈中有問題的環(huán)節(jié),而此環(huán)節(jié)必須還原到產(chǎn)品或行為分析的框架中才能有效地歸因,否則就會出現(xiàn)“頭痛醫(yī)頭”的現(xiàn)象。
企業(yè)數(shù)字化轉(zhuǎn)型成敗還取決于數(shù)據(jù)分析專業(yè)人才的支持,數(shù)字化轉(zhuǎn)型需數(shù)字化人才,無論高尖端企業(yè)還是傳統(tǒng)行業(yè),建設數(shù)字化人才團隊是當務之急。
未來5年,甚至更長時間,擁有具備業(yè)務、數(shù)據(jù)、架構(gòu)、內(nèi)部推動、項目管理等綜合能力的數(shù)字化人才,尤其高效決策的數(shù)字化管理思維的人才,是企業(yè)決勝千里的關鍵。
在此期間,建議數(shù)據(jù)分析師可以做如下事情:
第一,調(diào)試模型使“精確”變成精確,以符合當前應用場景。模型判斷的準則永遠是業(yè)務標準,而最了解業(yè)務之人當屬老板,所以老板確定的方向出錯的可能性很小,要相信此錨。
第二,數(shù)據(jù)分析團隊應該適當?shù)剞D(zhuǎn)移工作重點,如參與線下業(yè)務活動,以了解營銷、物流配送、供應商談判、客服等業(yè)務,從而了解業(yè)務與數(shù)據(jù)間的關系,但不要本末倒置。
第三,參加數(shù)據(jù)分析培訓,提升自己。
8月19日直播課,由徐楊老師帶領大家學習!
直播內(nèi)容:
1.縱有千古:數(shù)字化的前世今生
2.橫有八荒:數(shù)字化工作的價值聚集:數(shù)據(jù)科學
3.前途似海:數(shù)字化人才的崗位需求
4.未來可期:如何成為企業(yè)需要的數(shù)字化人才
掃描海報二維碼,免費聽課!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10