
國家全面倡導(dǎo)數(shù)字化,顯然是預(yù)見了經(jīng)濟(jì)發(fā)展的大趨勢。為此,各大企業(yè)積極響應(yīng)國家號(hào)召,緊鑼密鼓地部署并推進(jìn)數(shù)字化轉(zhuǎn)型。然而,隨著時(shí)間的推移,各種挑戰(zhàn)和瓶頸逐漸暴露出來,越來越多轉(zhuǎn)型的企業(yè)陷入四面楚歌、難以突圍的境況。
企業(yè)數(shù)字化轉(zhuǎn)型往往后勁力量越來越薄弱,無法達(dá)到預(yù)期效果,問題可能出在根部,所謂根部就是注重?cái)?shù)字化人才培養(yǎng)。
從小數(shù)據(jù)到大數(shù)據(jù)的分析思路均源于驗(yàn)證性數(shù)據(jù)分析,因此,業(yè)務(wù)需求尤為重要,而需求從何而來是由數(shù)據(jù)分析師所處的行業(yè)而定。
數(shù)據(jù)分析的需求來源包括閱讀運(yùn)營報(bào)告、痛點(diǎn)研究、未來戰(zhàn)略方向。
談到運(yùn)營報(bào)告就不得不提及數(shù)據(jù)庫。我們經(jīng)常將數(shù)據(jù)庫喻為“數(shù)據(jù)海洋”,其數(shù)量和內(nèi)容之多超出我們的想象。就電商公司而言,數(shù)據(jù)庫裝載幾千張表是很正常的現(xiàn)象,每張表的數(shù)據(jù)從幾十列到上百列不等,整個(gè)數(shù)據(jù)庫至少有幾萬列數(shù)據(jù)。一名數(shù)據(jù)分析師僅僅了解這些字段(基于描述類工作),估計(jì)沒有一年半載是辦不到的。
運(yùn)營報(bào)告包含很多有用字段,凡是能在報(bào)告里出現(xiàn)的字段都是經(jīng)過業(yè)務(wù)人員過濾并經(jīng)過幾年的持續(xù)修改而成的,這恰恰包含了數(shù)據(jù)分析所需要的統(tǒng)計(jì)信息。
如果事先有對(duì)業(yè)務(wù)問題進(jìn)行總結(jié),那么運(yùn)營報(bào)告中的字段將得到大幅縮減。例如,如果消費(fèi)者關(guān)注商品顏色,那么運(yùn)營報(bào)告需要提及這一字段,并設(shè)計(jì)相應(yīng)的營銷方案;相反,如果最近業(yè)務(wù)更加關(guān)注客戶滿意度,那么商品顏色這一字段就用不上了,運(yùn)營報(bào)告自然也不會(huì)提及這一字段。由此看來,數(shù)據(jù)庫中只有部分字段能夠充分利用起來(通常認(rèn)為只有不足10% 的字段經(jīng)常被使用),而其他字段可能暫時(shí)還沒有用。
(1)因變量y 和自變量x 從何而來?
公司每段時(shí)期出現(xiàn)的問題都會(huì)呈現(xiàn)在報(bào)告中,問題所在之處就是量化y。有了y 后,需要對(duì)問題進(jìn)行歸因,而變量x 就是結(jié)果y 的歸因因素,因此尋找影響因素x 是建模的主要過程。尋找x,不是從數(shù)據(jù)海洋中搜尋,而是判斷運(yùn)營報(bào)告中提到的字段。
理論上說,報(bào)告中涉及的字段都有可能成為y 或x,但企業(yè)在每段時(shí)期暴露的嚴(yán)重問題涉及的字段才最有可能是y,而且y 并不會(huì)很多,因?yàn)榇蠖鄶?shù)問題,只有幾個(gè)主導(dǎo)的因素。例如,訂單下滑、滿意度不佳、活躍度不夠等問題的根本原因可能是廣告投放失效,那么廣告投放就是當(dāng)前的y。x 是歸因的依據(jù)。模型是尋找影響因素最快捷的方式,如果能夠掌握數(shù)據(jù)分析方法,那么搜尋x 的過程就簡捷多了。
我們是否需要尋找報(bào)告之外的x 呢?這實(shí)際上涉及數(shù)據(jù)分析的創(chuàng)新,但創(chuàng)新是發(fā)生在夯實(shí)的業(yè)務(wù)基礎(chǔ)之上的。也就是只有具備了數(shù)據(jù)分析技術(shù)、業(yè)務(wù)知識(shí),再加上時(shí)間的積累,創(chuàng)新才有望發(fā)生。數(shù)據(jù)分析師職業(yè)生涯前2 ~ 3 年,無須尋找這部分x。
(2)搭建模型的前提是業(yè)務(wù)準(zhǔn)備
數(shù)據(jù)降維(x 的篩選過程)和角色問題確定后,需要做的是模型搭建。數(shù)據(jù)分析師應(yīng)該用“點(diǎn)→線→面”的思路來完成業(yè)務(wù)梳理,進(jìn)而完成構(gòu)筑模型所需的一切業(yè)務(wù)準(zhǔn)備。只有把點(diǎn)的問題還原成面的問題,痛點(diǎn)問題才有望被解決。
點(diǎn)的問題就是造成損失的環(huán)節(jié)。例如,商品導(dǎo)致的業(yè)務(wù)問題,如毛利潤太低、供應(yīng)商供貨問題等。損失之處就是因變量y。然后圍繞因變量y 探討解決方案,這就是自變量x 與因變量y 間的結(jié)構(gòu)關(guān)系,y 的問題就是點(diǎn)的問題。線的問題,即自變量x 是如何影響因變量y 的,其重點(diǎn)在尋求歸因,即整體結(jié)構(gòu)。如果我們將各部門發(fā)生的事件歸納起來,并通過點(diǎn)和線的分析方式將這些事件編織成面的問題,然后使用統(tǒng)計(jì)技術(shù)控制每個(gè)環(huán)節(jié),促使業(yè)務(wù)問題與統(tǒng)計(jì)解決方案同步,那么統(tǒng)計(jì)方法將得到有效的運(yùn)用。
企業(yè)在某段時(shí)間可能會(huì)面臨某個(gè)嚴(yán)重的業(yè)務(wù)問題,企業(yè)所有資源和人力都將用于解決這個(gè)問題,數(shù)據(jù)分析師當(dāng)然也不例外。企業(yè)每個(gè)時(shí)期的痛點(diǎn)各不相同,問題一般會(huì)持續(xù)3~6 個(gè)月。例如,老客戶流失嚴(yán)重,首先需要找到y(tǒng),如果數(shù)據(jù)庫中沒有字段與該問題對(duì)應(yīng),則需要想辦法構(gòu)建人工字段b,即用商品購買周期的兩倍來預(yù)判客戶流失(這是人工字段)的嚴(yán)重性。有了y 后,要尋找影響因素x,構(gòu)建客戶流失模型。完成模型構(gòu)建后,在因變量與自變量間歸因是不是就自然發(fā)生了呢?最終就能找到痛點(diǎn)的真正原因了呢?顯然,據(jù)此得出的結(jié)論過于單薄。
痛點(diǎn)問題是很多問題的綜合性表現(xiàn),且一個(gè)模型能解釋的信息是有限的。對(duì)痛點(diǎn)問題進(jìn)行歸因是環(huán)環(huán)相套的。
研究痛點(diǎn)僅僅是幫助我們發(fā)現(xiàn)歸因鏈中有問題的環(huán)節(jié),而此環(huán)節(jié)必須還原到產(chǎn)品或行為分析的框架中才能有效地歸因,否則就會(huì)出現(xiàn)“頭痛醫(yī)頭”的現(xiàn)象。
企業(yè)數(shù)字化轉(zhuǎn)型成敗還取決于數(shù)據(jù)分析專業(yè)人才的支持,數(shù)字化轉(zhuǎn)型需數(shù)字化人才,無論高尖端企業(yè)還是傳統(tǒng)行業(yè),建設(shè)數(shù)字化人才團(tuán)隊(duì)是當(dāng)務(wù)之急。
未來5年,甚至更長時(shí)間,擁有具備業(yè)務(wù)、數(shù)據(jù)、架構(gòu)、內(nèi)部推動(dòng)、項(xiàng)目管理等綜合能力的數(shù)字化人才,尤其高效決策的數(shù)字化管理思維的人才,是企業(yè)決勝千里的關(guān)鍵。
在此期間,建議數(shù)據(jù)分析師可以做如下事情:
第一,調(diào)試模型使“精確”變成精確,以符合當(dāng)前應(yīng)用場景。模型判斷的準(zhǔn)則永遠(yuǎn)是業(yè)務(wù)標(biāo)準(zhǔn),而最了解業(yè)務(wù)之人當(dāng)屬老板,所以老板確定的方向出錯(cuò)的可能性很小,要相信此錨。
第二,數(shù)據(jù)分析團(tuán)隊(duì)?wèi)?yīng)該適當(dāng)?shù)剞D(zhuǎn)移工作重點(diǎn),如參與線下業(yè)務(wù)活動(dòng),以了解營銷、物流配送、供應(yīng)商談判、客服等業(yè)務(wù),從而了解業(yè)務(wù)與數(shù)據(jù)間的關(guān)系,但不要本末倒置。
第三,參加數(shù)據(jù)分析培訓(xùn),提升自己。
8月19日直播課,由徐楊老師帶領(lǐng)大家學(xué)習(xí)!
直播內(nèi)容:
1.縱有千古:數(shù)字化的前世今生
2.橫有八荒:數(shù)字化工作的價(jià)值聚集:數(shù)據(jù)科學(xué)
3.前途似海:數(shù)字化人才的崗位需求
4.未來可期:如何成為企業(yè)需要的數(shù)字化人才
掃描海報(bào)二維碼,免費(fèi)聽課!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03