
數(shù)據(jù)分析的幾大誤區(qū)
上大學時,我和另一個姑娘(某理科大神)經(jīng)常搭伙做飯。有天我倆一起去超市買油,站在琳瑯滿目的貨架前,我直接拎起一瓶,沖她叫:“就拿這瓶吧,最便宜!”姑娘白了我一眼,轉頭說道:“克單價一點都不便宜好不好!數(shù)學是體育老師教的吧?”接著眼神刷刷兩下掃完整個貨架,心算完畢,拎起另一瓶說:“這克單價最便宜,拿這個!”我當時就囧了,訕訕地拎起油,念叨著:總金額不便宜呢……
大千世界當中,我們總是需要“數(shù)據(jù)”去輔助下判斷、做抉擇。生活當中,可能僅需要描述性數(shù)據(jù)就足夠了,比如你買油是看克單價還是總金額。但工作當中,卻必須深諳各種復雜的數(shù)據(jù)分析方法,數(shù)據(jù)成為建功立業(yè)、獎懲論責的重要手段。數(shù)據(jù)本身是客觀的,但如何捯飭數(shù)據(jù),卻是主觀的。數(shù)據(jù)可以“作弊”,可以有“偏見”,也可以用來糊弄別人,麻痹自己。
所以,知道數(shù)據(jù)的把戲,比機械地完成數(shù)據(jù),對工作的實踐意義更大,至少可以保證我們不會被數(shù)據(jù)“玩弄”:
你買油是按照克單價?還是總金額?這個例子比較簡單。實際工作中比這個要復雜很多,比如銷售人員的績效如何評估——應該按照總銷售額,還是可比店的銷售額?是按照所有產(chǎn)品的銷售額?還是新品的銷售額?是按照單店績效?還是單人績效?是按照工作時間內的績效?還是不計工作時間、將加班時間也計算在內的績效?如果是跨國公司,還涉及到用人民幣、還是美元計算?
計量單位的不同、測算范疇的不同,得出的結果也就不同——所以,公司開績效評估大會或者任務指標分配大會,一般就是打數(shù)據(jù)仗,然后你會發(fā)現(xiàn),結局往往不取決于最準確的數(shù)據(jù),而取決于最大的嗓門……
平均數(shù)是一個非常強大的描述性統(tǒng)計數(shù)據(jù),也被廣泛用于各種判斷當中,比如時不時會有新聞說“房價在漲”、“我國平均收入水平上升XXX”,“某某學校的升學率高達90%”……平均數(shù)最大的問題是,忽略了偏離方差的“異常值”——比如馬云的收入就是個異常值。這個時候,就需要再看一看中位數(shù)。
每一次銷售會,我們會看幾個主要數(shù)據(jù),類似“單人產(chǎn)量”“單店產(chǎn)量”“流失率”等等。然而,在對這些數(shù)據(jù)下結論的時候,我們得萬分謹慎,因為一方面,它取決于計量單位和范疇,另一方面,還得均衡的看平均數(shù)和中位數(shù)。如此才能甄別出來,哪些是由于“異常值”造成的偶然現(xiàn)象,而哪些是一直存在的普遍現(xiàn)象,防止看錯問題冤枉人。當然有一種情況是不需要區(qū)分中位數(shù)和平均數(shù)的,比如今年北大古生物專業(yè)的畢業(yè)生就業(yè)率(就一個姑娘)。
每個企業(yè)的績效評估方法可能不一樣,但邏輯應該相似,對所有衡量指標設置不同權重后,進行綜合評估。當然,對于那種只有一個指標(老板心情指標)的公司,統(tǒng)計學表示很無力。
除了績效評估,最常用“權重”的就是生意預測。不同要素對生意結果的影響力不同,且隨時間而變,比如打廣告、公關活動、或者店內促銷,哪個對生意貢獻最大?哪一種具體的廣告形式對生意貢獻最大?是不是贊助《中國好聲音》就一定比投放傳統(tǒng)電視廣告,帶來的銷量更大?只有我們知道不同因素的權重,才會做成更加科學的投資決策。
銷售額下降了,怎么辦?相信大多數(shù)銷售都會抓狂,開始馬不停蹄的琢磨問題解決之道了。但去年我聽到了一句特別灑脫的話:“銷量下降,有時候只是個現(xiàn)象,并不一定是問題。你怎么知道這不是我們有意為之的呢?”呃…好吧,這豁達和深刻,不是我等凡夫俗子能理解的。
數(shù)據(jù)往往只表達一種結果。如果想要知道數(shù)據(jù)背后的動機和原因,還要借助更復雜的統(tǒng)計學手段、或者非數(shù)據(jù)手段。主動為之的“壞數(shù)據(jù)”以及被動承受的“壞數(shù)據(jù)”,兩者之間的動機差異,會造成迥然不同的行為結果。比如有一次銷售會議,某區(qū)域負責人指著自己慘淡的員工流失率指標,輕描淡寫的解釋說:“高流失率是我主動淘汰了一些人,因XXX原因,下個季度新人馬上到崗。”想象一下,如果我們不了解這個動機,可能這位區(qū)域負責人就要蹲小黑屋了。
最經(jīng)典的例子就是收入數(shù)據(jù)。經(jīng)常有報道說:公務員收入其實很低,勸大家不要錯怪公務員。但問題是,工資收入是低,但非工資收入可能不低。當然,這種情況不僅限于公共組織。其實無論任何組織,只要掙的花的不是自己的錢,就都可能出現(xiàn)這種“工資不等于收入”的情況。
在具體業(yè)務中,“精確不等于準確”可能出現(xiàn)在兩種情境中——總結歸納、分析預測。
比如消費者調研,一般都會有定性和定量兩種方法。如果沒有定性分析,定量分析就可能陷入“虛假精確”的陷阱。如果你的調研對象有問題,那么,就算再辛苦的計算和再精確的數(shù)據(jù),其實都沒有意義。又比如廣告測試,精確的測試結果真的有實際意義嗎?
又比如銷量預測,每個人心里都明白,這是無法準確預測的,你只能無限接近,卻不能完全準確,因為“預測未來”本來就是上帝才能搞定的事,所以我們能做的,只能是在保證方向準確的情況下,盡量精確。但也不必過于花費力氣、苛求預測數(shù)據(jù)的精確,因為這不會增加多少實際意義,還不如花多點時間研究其他可操作性強的數(shù)據(jù)
總之,盡量避免追求虛假的準確和錯誤的確定性。
我老板的經(jīng)典口頭禪就是:“你們這些人,總是自說自話、以果推因分析法,錯把相關性當成因果性,把偶然性當成必然性。”這句口頭禪可真是太強大了,因為可應用范圍頗廣,躺槍幾率也頗高,導致我們現(xiàn)在不得不日省三次:“有沒有自說自話?有沒有以果推因?”
以前還聽過一個段子,一個領導手下的兩個部門同時做生意報告。A部門搞不清楚自己生意為啥漲,B部門搞不清楚自己生意為啥降,結果最后的生意報告中,兩個部門不約而同,提到了同一個原因——天氣。只不過,A部門說,因為這段時間按天氣冷導致A產(chǎn)品需求增大;B部門說,因為這段時間天氣熱導致B產(chǎn)品需求減少。我現(xiàn)在覺得吧,多虧這領導不是我老板,否則這兩部門可以一起蹲小黑屋了。
這就是統(tǒng)計學最重要的價值——可以幫助我們排除無關因素,因為這些無關因素太容易讓大家混淆了因果性和相關性的區(qū)別。
有公司做新品上市的消費者調研時,最后需求是:只要超過45%的人喜歡,就決定上市這個新品。其實這壓根不用調研了。如果這個新品和對照組的產(chǎn)品本身差距不明顯的話,且樣本量足夠大,肯定會有50%的人喜歡,這就是大數(shù)定律的基本常識。
初三接近中考時,老師突然要調座位,而且這次不按學號、不按個子、也不按“好幫差”原則,而是直接按成績調座位——成績好的人坐左邊兩組,成績不好的坐右邊兩組。當時我還很懵懂,不明白為啥非要在復習備考的緊張時刻折騰調座位,因為和我關系非常好的小伙伴們都被調到右邊兩組了。
后來我終于懂了。因為接下來的兩周,右邊座位的同學們,一個接一個的被老師叫走談話,然后,又一個接一個的,退學了。我想我這輩子都忘不了,那些同學一聲不吭的低頭收拾完書包,佝僂著腰沉重的走出教室前,回頭望過來的最后一眼。那種悲傷和無奈的眼神,讓我至今想起來都心酸喉梗。然后,當年我校的升學率就非常高。
企業(yè)當中數(shù)據(jù)作弊和偏見也不少見,比如通過壓低頭一年的數(shù)據(jù)、使得第二年增長率更高;比如選擇錯誤的樣本數(shù)據(jù)做市場調研;又比如常見的會計數(shù)據(jù)作弊。
總之,數(shù)據(jù)的把戲大有乾坤。一方面,我們需要數(shù)據(jù)去分析問題、印證結論,沒有數(shù)據(jù)的虛談是沒有意義的,也是很難有定論的。另一方面,數(shù)據(jù)不是全部,我們不能成為“數(shù)據(jù)教”的人。過于追求數(shù)據(jù)的完美精確,容易讓我們忽略那些無法用數(shù)據(jù)表現(xiàn)的關鍵要素,比如人的態(tài)度、動機和精神氣;也容易忽略企業(yè)的最終目標。其實,在不該使用數(shù)據(jù)的使用數(shù)據(jù),可能比在該用數(shù)據(jù)的時候沒有數(shù)據(jù),結果更可怕。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03