
七個必定使數(shù)據(jù)分析失敗的方式
數(shù)據(jù)分析正迅速成為贏得業(yè)務(wù)戰(zhàn)略的關(guān)鍵。但是如果沒有正確的方法、技巧和策略,你的數(shù)據(jù)舉措可能永遠沒有結(jié)果。
數(shù)據(jù)分析已經(jīng)成為企業(yè)最重要的業(yè)務(wù)和技術(shù)的差異化要素之一,數(shù)據(jù)分析使企業(yè)能夠深入了解其運營的方方面面,從而在競爭中獲得優(yōu)勢。
調(diào)研公司Gartner今年早些時候預(yù)測,2017年將是數(shù)據(jù)和分析成為主流的一年,為已經(jīng)為轉(zhuǎn)型做好準備的組織內(nèi)外創(chuàng)造價值。Gartner表示,數(shù)據(jù)分析的方法正在變得更加整體化,涵蓋整個業(yè)務(wù)。
Gartner的研究報告顯示,在主要趨勢中,分析將推動現(xiàn)代業(yè)務(wù)運營,而不僅僅是反映其績效。企業(yè)將創(chuàng)建端到端的架構(gòu),這些架構(gòu)考慮到了組織核心乃至組織邊緣的數(shù)據(jù)管理和分析;高管們將數(shù)據(jù)和分析作為業(yè)務(wù)戰(zhàn)略的一部分,使數(shù)據(jù)和分析專業(yè)人員能夠發(fā)揮新的作用并創(chuàng)造業(yè)務(wù)增長。
公司正在為分析工具投入大量資金。國際數(shù)據(jù)公司(International Data Corp.)在2017年3月的一份報告中預(yù)測,今年全球大數(shù)據(jù)和業(yè)務(wù)分析的收入將達到1508億美元,比2016年增長12%,該公司預(yù)計增長會一直持續(xù)到2020年,屆時收入將超過2100億美元。
然而在數(shù)據(jù)分析被反復(fù)強調(diào)的請況下,很多組織還是陷入了損害或浪費分析的真正價值的陷阱。根據(jù)IT領(lǐng)導(dǎo)者和行業(yè)專家的說法,以下是七個必定使數(shù)據(jù)分析失敗的方式。
1. 急于試水,卻不知道自己在找什么
如果你不知道在數(shù)據(jù)中需要檢查哪些具體的趨勢或信號,你怎么能期望從中獲得真正的價值呢?
德勤分析(Deloitte Analytics)的高級顧問、《逐鹿分析:新的制勝之道》一書的作者Tom Davenport說:“分析過程中最大的問題是你不知道自己在找什么數(shù)據(jù)?!?
Davenport說:“數(shù)據(jù)挖掘讓系統(tǒng)找出數(shù)據(jù)中的有趣之處的理念使很多公司誤入歧途。即便使用機器學(xué)習(xí),從數(shù)據(jù)關(guān)系的角度來了解你正在尋找的東西也是大有裨益的?!?
天氣網(wǎng)站W(wǎng)eather.com的質(zhì)量保證經(jīng)理Todd Eaton說:“Weather.com強調(diào)要找到‘知道如何查詢數(shù)據(jù)并能完整而準確地講述數(shù)據(jù)要傳達的含義的人’?!?
Eaton說:“合適的人員對使用數(shù)據(jù)回答問題充滿激情,然后愿意不斷質(zhì)疑他們的發(fā)現(xiàn),確保數(shù)據(jù)不僅適合敘事,而且能夠解釋我們所看到的事物并有助于預(yù)測未來發(fā)展的目標。重要的是,每個人都知道我們正在試圖發(fā)現(xiàn)數(shù)據(jù)和我們的總體目標,并收集一致的測量結(jié)果和數(shù)據(jù)?!?
啟動分析工作時,缺乏重點肯定會導(dǎo)致失敗。通用電氣公司的首席數(shù)據(jù)官Christina Clark表示:“當數(shù)據(jù)團隊把重點放在優(yōu)先考慮的成果上時,他們將是最成功的。團隊往往會失敗,因為他們希望立即解決很多的業(yè)務(wù)需求,最終由于精力過分分散而沒有產(chǎn)生有意義的影響來保持興趣或維持資金來源?!?
2. 建立(維護)自己的基礎(chǔ)設(shè)施
建立和維護自己的大數(shù)據(jù)基礎(chǔ)設(shè)施可能是一個巨大的誘惑。但這可能會危及你的分析工作的使命。
網(wǎng)絡(luò)安全公司Vectra的首席技術(shù)官Oliver Tavakoli表示:“這往往浪費了數(shù)據(jù)科學(xué)家大量時間,而不是實際開發(fā)更好的分析。”
Tavakoli說:“我們知道我們需要大量的數(shù)據(jù)來進行分析。我們開始做大家都要求做的事情:我們買了一堆有大量磁盤容量的服務(wù)器,我們把它們放在托管設(shè)施里,我們用Apache Spark創(chuàng)建了自己的Hadoop集群,并讓我們的數(shù)據(jù)科學(xué)家編寫Scala代碼與集群進行交互?!?
有時由于硬件故障,集群會中斷,更多的時候是由于軟件故障。軟件包會過時,有時幾小時過去了,集群都處在不可用的狀態(tài)。
Tavakoli說:“我們終于有了足夠的資源并決定將這部分問題外包出去。自打Vectra與外部供應(yīng)商合作之后,它就很少花時間在這些基本問題上,“我們幾乎所有的時間都致力于將數(shù)據(jù)提供給系統(tǒng)并分析其中的數(shù)據(jù)”,他這樣說道。
3. 成為數(shù)據(jù)分割者,而不是數(shù)據(jù)統(tǒng)一者
長期以來,企業(yè)一直在努力解決阻止各部門共享信息的“數(shù)據(jù)孤島”問題,從而使整個機構(gòu)受益。分析也遇到了同樣的挑戰(zhàn)。
客戶生命周期管理營銷公司Zeta Global的首席信息官Jeffry Nimeroff說,統(tǒng)一不同的數(shù)據(jù)就是一個很好的最佳實踐。
Nimeroff表示:“每個數(shù)據(jù)孤島都會在能產(chǎn)生價值相互連接之間形成一個障礙。例如,考慮一個豐富的用戶配置文件連接或斷開網(wǎng)站活動數(shù)據(jù)??梢曰ミB的數(shù)據(jù)越多越好,因為在這些互連里才能找到預(yù)測能力?!?
Nimeroff說,這并不意味著必須將所有數(shù)據(jù)從初始系統(tǒng)移動到一個整體。他說:“相反,我們使用其中一種現(xiàn)代集成技術(shù)來提供統(tǒng)一的數(shù)據(jù)視圖,而這一切都在當前的系統(tǒng)中。”
4. 回避良好的數(shù)據(jù)衛(wèi)生
如果你正在分析的數(shù)據(jù)不準確、不是最新的、且沒有條理,那么分析的價值可能會急劇下降。
Nimeroff說:“錯進錯出(garbage in, garbage out)是原始業(yè)務(wù)數(shù)據(jù)的容量和范圍擴大的問題,最好的數(shù)據(jù)分析團隊要質(zhì)量滲透,因此,建立流程并利用技術(shù)來執(zhí)行質(zhì)量標準是一個必勝的組合?!?
Nimeroff說,在流程方面,確保流程的可重復(fù)性以及對結(jié)果的可審計性是非常重要的。在技術(shù)方面,他說,部署包括分析、元數(shù)據(jù)管理、清理、采購等數(shù)據(jù)質(zhì)量工具有助于確保獲得更好的高質(zhì)量數(shù)據(jù)。
Tavakoli說:組織需要使用工具來“清除碎片”——不完整和破壞的數(shù)據(jù)——并且從不同的來源獲取數(shù)據(jù),以使其兼容且易于理解,并盡可能簡化分析。盡可能使數(shù)據(jù)一目了然,以便團隊的所有成員都了解各種數(shù)據(jù)的意義。”
技術(shù)服務(wù)公司Incedo的首席執(zhí)行官TP Miglani說,高質(zhì)量的數(shù)據(jù)“是產(chǎn)生有用洞察的關(guān)鍵動力”。他說:“你需要建立數(shù)據(jù)倉庫和數(shù)據(jù)湖泊,把結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)匯集在一起。成功的組織會確保他們會用清理、計算缺失值,并準確地標記數(shù)據(jù)來提高數(shù)據(jù)的質(zhì)量?!?
良好的數(shù)據(jù)衛(wèi)生也意味著保持數(shù)據(jù)盡可能是最新的。Nimeroff說,數(shù)據(jù)需要新鮮度,“數(shù)據(jù)宇宙”要不斷膨脹,企業(yè)才能從分析中獲得價值。
Nimeroff說:“數(shù)據(jù)新鮮度要求了解當前數(shù)據(jù)采集過程的時效性。顯然,一個系統(tǒng)越實時,新鮮度就越高。也可以通過使用第三方服務(wù)來支持新鮮度,以加強你現(xiàn)有的技術(shù)和流程。”
5. 放棄分析計劃的高管贊助
與其它類型的重大IT項目一樣,沒有數(shù)據(jù)分析項目的高級管理人員的領(lǐng)導(dǎo)能力可能對成功不利。
Miglani說:“分析團隊的目標是通過將數(shù)據(jù)與公司的戰(zhàn)術(shù)和戰(zhàn)略決策相結(jié)合來產(chǎn)生洞察。一個失敗的例子就是如果一個數(shù)據(jù)科學(xué)團隊做了大量的數(shù)據(jù)分析,開發(fā)出了準確的預(yù)測模型,但是結(jié)果并沒有被實施,因為它需要組織和文化的變革?!?
Clark說,建立數(shù)據(jù)管理基礎(chǔ)需要多年持續(xù)不斷的努力。他說:“數(shù)據(jù)和分析團隊要促進的一些工作不會有立竿見影的效果,這可能與業(yè)務(wù)合作伙伴的預(yù)期不一致。這需要強有力的領(lǐng)導(dǎo)層支持,以及努力教育業(yè)務(wù)合作伙伴,以實現(xiàn)更加趨于數(shù)據(jù)驅(qū)動的未來。”
6. 忽略中層和下層管理者
數(shù)據(jù)科學(xué)家在真空中進行的分析和其他那些沒有從最親近分析需求的業(yè)務(wù)經(jīng)理得到可靠輸入的專家不太可能成功。
服務(wù)管理軟件供應(yīng)商Astea International的首席運營官David Giannetto表示:“如果沒有中低層管理人員的積極參與,分析團隊提供的信息往往不能真正地幫助管理層團隊更好地完成工作。”
Giannetto說:“信息將是定向的,信息會指出更大的流程缺陷或可以改進的地方,但是管理層早晚要著手處理——當他們有時間的時候。而大多數(shù)管理者從來都沒有多余的時間。只有當團隊由真正懂業(yè)務(wù)的人組成,以及業(yè)務(wù)實際上每天都需要訪問信息時,傳遞的信息才足以對業(yè)務(wù)產(chǎn)生積極影響?!?
Giannetto說,如果分析能夠告訴用戶真正的問題在哪里——哪里可能會出現(xiàn)問題——他們有足夠的時間來阻止問題,他們每天都使用這些信息,那么這一舉措將會取得成功。
7. 缺乏支持良好數(shù)據(jù)分析的文化和技能
這對于組織來說是一個普遍的問題,很大程度上是因為數(shù)據(jù)科學(xué)這樣的技術(shù)很難獲取。但是,如果數(shù)據(jù)素養(yǎng)不是公司文化的核心,分析失敗的可能性更大。
Miglani說:“對于不熟悉分析的人來說,數(shù)據(jù)科學(xué)被認為是解決問題的一種神奇的方式。預(yù)測和自學(xué)的概念很難讓人掌握。要說服你的商業(yè)伙伴在不透明的算法上作出決策是很難的。你需要先教育他們?!?
而且組織機構(gòu)在繼續(xù)努力尋找具有分析技能的數(shù)據(jù)科學(xué)家和其他專業(yè)人員。Miglani說:“培養(yǎng)這種能力的最好方法之一是培養(yǎng)這種才能,而不是在組織外物色超級明星。很多項目失敗或者推遲,就是因為公司無法按時聘請或大量流失分析人員。”
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11