
文章來源于:微信公眾號接地氣學(xué)堂
作者:接地氣的陳老師
總有不懂?dāng)?shù)據(jù)的人,把算法工程師當(dāng)算命工程師用。用完了還嫌棄預(yù)測不準(zhǔn),甚至還把業(yè)務(wù)開展不力甩鍋給預(yù)測。公司業(yè)績遇到問題,不是集中起來想辦法,而是集中起來批斗為什么沒有預(yù)測到……全!是!扯!蛋!今天系統(tǒng)科普一下,到底數(shù)據(jù)預(yù)測能干啥。為數(shù)據(jù)分析師們發(fā)聲。
1無法預(yù)測的場景
數(shù)據(jù)預(yù)測,得有數(shù)據(jù)才能預(yù)測,這是個基本前提。所以沒有數(shù)據(jù),預(yù)測個屁。典型的沒有數(shù)據(jù)的場景有:
宏觀政策,在公布以前是沒有任何數(shù)據(jù)可以記錄的,它壓根就不存在。咋記錄法,又咋預(yù)測法。因此完全無法預(yù)測效果,只能等到公布以后才能觀察。會有人說:大政方針也要看數(shù)據(jù)來定,那理論上可以通過數(shù)據(jù)來預(yù)測方針的公布時間。想得美。大政方針往往涉及利益集團間的博弈,因此具體啥時候推出,很有可能是各方激烈斗爭的結(jié)果,跟數(shù)據(jù)不完全有關(guān)系。真想摸清楚大政方針的走向,得找關(guān)系。走上層路線,接近權(quán)力核心。光站在外邊看,就是隔靴搔癢。
主觀意愿問題同理。人的主觀意愿會表現(xiàn)在表情、言談、舉止,唯獨很難表現(xiàn)在可記錄的數(shù)據(jù)上。人的腦門上沒有一個大窟窿,里邊的數(shù)據(jù)嗶嗶嗶嗶不停往外冒。想搞清某個人的主觀意愿,你得跟他溝通,而不是糾結(jié)數(shù)據(jù)。如果是針對某位大人物的,就鞍前馬后伺候好,察言觀色;如果是針對普通用戶的,走用戶研究路線,那邊有整套的方法。
全新創(chuàng)意問題也同理。沒有出現(xiàn)過的東西,是沒有數(shù)據(jù)可預(yù)測的。很多人不服氣——這為啥都不能預(yù)測!
不服氣的同學(xué)們,請聽題:
不服,來戰(zhàn)!預(yù)測吧,阿魯巴!
你也拍桌子罵娘——起碼告訴我阿魯巴是個啥??!是滴,答對了。這就是解決全新創(chuàng)意問題的辦法:把抽象的概念具體化,然后拿著具體概念做測試。
概念越具體,才越能測試出用戶的真實態(tài)度。比如加個條件:阿魯巴是一臺手機。是不是就稍微有點感覺。再加個條件:阿魯巴是一臺薄的像紙一樣的手機,是不是更有感覺了。根據(jù)概念的具體程度,有三個層級的活可以做(如下圖)
這又是個用戶研究的活,找你的用研中心,讓他們開工。拿到第一批到第N批測試數(shù)據(jù)后,數(shù)據(jù)分析師可以幫忙搞搞分析。但是先采集真實數(shù)據(jù)是前提。
2可預(yù)測但被人扭曲
從本質(zhì)上看,數(shù)據(jù)只是業(yè)務(wù)表現(xiàn)的數(shù)字記錄,業(yè)務(wù)本身才是重點。一個簡單的事實是:業(yè)務(wù)是做出來的,不是算出來的。決定業(yè)務(wù)走勢的是:到底業(yè)務(wù)部門的哥們有多大本事。所以凡是人為能干預(yù)的,都很難做出精準(zhǔn)預(yù)測,甚至預(yù)測本身有可能反噬業(yè)務(wù)表現(xiàn)。
比如:
不過上邊都不是最狠的,最狠的是:建立科學(xué)預(yù)測體系,評價產(chǎn)品銷量。然后市場部大老板自己收了供應(yīng)商回扣,一句:“老夫從業(yè)20年,從來沒見過這種情況,你這預(yù)測不符合業(yè)務(wù)”。大筆一揮,直接按回扣數(shù)額預(yù)測銷量。遇到這種事,說理都沒地方說理去。
簡單來說,業(yè)務(wù)想搞事,你預(yù)測得準(zhǔn)也會變得不準(zhǔn)。業(yè)務(wù)想甩鍋,永遠(yuǎn)都可以說:預(yù)測的不夠準(zhǔn),導(dǎo)致決策不夠精準(zhǔn)。這就好比開車的時候,預(yù)測到前方轉(zhuǎn)彎有大石頭,預(yù)計1分鐘后撞上。開車的人聽到這個預(yù)測就得踩剎車。而不是繼續(xù)狂飆,撞上石頭以后再來抱怨:“你預(yù)測的不準(zhǔn),不是60秒后撞上,而是59.99秒以后撞上,導(dǎo)致我沒踩剎車?!薄鉚M不踩剎車,還來怪預(yù)測了。
所以,這個問題本質(zhì)是責(zé)任誰承擔(dān)的問題。合理的責(zé)任劃分方式,是:只要有人為干預(yù)環(huán)節(jié),統(tǒng)統(tǒng)是決策人本身承擔(dān)責(zé)任。本身數(shù)據(jù)預(yù)測只是一個判斷依據(jù)。除了數(shù)據(jù),做業(yè)務(wù)的經(jīng)驗、能力、人脈資源、市場嗅覺、用戶感知,都是判斷依據(jù)。用起來呀。
在具體方法上,所有有人為干預(yù)的業(yè)務(wù)流程,都可以分階段輸出預(yù)測結(jié)果。根據(jù)上一階段的情況,隨時修正預(yù)測值,只要預(yù)測的定性沒有錯(前方本來沒石頭,預(yù)測成有石頭,就是定性錯誤)就能交付業(yè)務(wù)使用。這樣才能保證最終結(jié)果不出問題。就像開車上路,導(dǎo)航是實時更新預(yù)計到達(dá)時間和道路擁堵情況,而不是一上來預(yù)測個最終時間一樣。
3可預(yù)測但有限制
數(shù)據(jù)預(yù)測有個基本前提:過去的經(jīng)驗未來會重現(xiàn),未來的走勢和過去的邏輯相同。無論是簡單的靠經(jīng)驗推導(dǎo),還是復(fù)雜的算法邏輯,都是基于這個前提的。正是有這個前提,才能根據(jù)歷史數(shù)據(jù)才預(yù)測未來。所以,所有預(yù)測都會加上一句:在XX背景/前提/假設(shè)下預(yù)測。正因此,很多經(jīng)典的預(yù)測結(jié)果,都是基于農(nóng)林牧漁、醫(yī)療生物,這種有客觀依據(jù),不宜改變規(guī)律,內(nèi)在科學(xué)原理的業(yè)務(wù)得出的。
但是商業(yè)社會顯然不符合這些個條件。商業(yè)社會就是充滿不確定性,受突發(fā)事件和意外影響。甚至商業(yè)社會還可以人為制造熱點,操控輿情,無風(fēng)掀起三尺浪。不是商業(yè)企業(yè)孜孜不倦的教育,女士們還在用雪花膏,哪來整套整套的水、乳、液、精華、各種色號……男士們還在下圍棋、象棋、軍棋,哪來的皮膚、武器、暴擊、加速、閃現(xiàn)、命中……所以本質(zhì)上所有的預(yù)測都是有前提下適度預(yù)測,遇到新的場景就得重新找數(shù)據(jù)集重新修正。
用過去預(yù)測未來,有三種基本預(yù)測方法(如下圖):
沒有一種方法是絕對準(zhǔn)確的,都得結(jié)合預(yù)測效果做修正;輸入的數(shù)據(jù)越少,輸入的關(guān)鍵變量越少,預(yù)測精度必然越低。細(xì)分越具體的場景,可采集的數(shù)據(jù)越多,短期內(nèi)預(yù)測的波動性會越小。所以想取得好的預(yù)測效果,得仔細(xì)挑選場景,確保優(yōu)質(zhì)的信息來源,建立修正機制。這些,又和需要與業(yè)務(wù)大量溝通,密切協(xié)作有關(guān)系。
只有算命的,才是:
真正的數(shù)據(jù)預(yù)測,就是需要體系化運作。比起賭運氣賭最后的結(jié)果99.999999%準(zhǔn)確。而是細(xì)致分析預(yù)測場景,結(jié)合業(yè)務(wù)動作,選擇合適的方法,達(dá)到業(yè)務(wù)上的目標(biāo)即可。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10