
成功數(shù)據(jù)分析所面臨的5項(xiàng)挑戰(zhàn)_數(shù)據(jù)分析師考試
怎樣才能使企業(yè)升級(jí)到一個(gè)新的水平,并開(kāi)始一個(gè)大數(shù)據(jù)發(fā)展戰(zhàn)略的部署呢?本文將介紹企業(yè)成功實(shí)現(xiàn)大數(shù)據(jù)策略所需要克服的5個(gè)關(guān)鍵挑戰(zhàn)問(wèn)題:
大數(shù)據(jù)將增加企業(yè)對(duì)IT部門(mén)的依賴(lài)
在過(guò)去幾年里,IT部門(mén)在企業(yè)中的重要性越發(fā)突顯,而在未來(lái)幾年,我們將看到,隨著物聯(lián)網(wǎng)和工業(yè)網(wǎng)絡(luò)的出現(xiàn),許多目前未連接的設(shè)備將變得數(shù)據(jù)化,并開(kāi)始產(chǎn)生大量數(shù)據(jù)。而對(duì)于那些僅僅只開(kāi)發(fā)線下產(chǎn)品,僅僅利用IT進(jìn)行企業(yè)的網(wǎng)站建設(shè)的企業(yè)來(lái)說(shuō),這將意味著一項(xiàng)重大的變革。在未來(lái)幾年,IT部門(mén)將成為企業(yè)所有業(yè)務(wù)部門(mén)的核心部分。大數(shù)據(jù)將以不同的工作方式滲透和影響到企業(yè)內(nèi)的所有部門(mén)。
所以除了能夠訪問(wèn)數(shù)據(jù),大數(shù)據(jù)項(xiàng)目將成為企業(yè)不同部門(mén)的重要組成部分,因此各個(gè)業(yè)務(wù)部門(mén)也將需要他們自己的IT員工。對(duì)于多數(shù)企業(yè),IT部門(mén)將成為企業(yè)中的一個(gè)更為重要的組成,那些目前仍然只是開(kāi)發(fā)線下產(chǎn)品的公司而言,這無(wú)疑是他們將需要克服的一個(gè)重大轉(zhuǎn)變。
大數(shù)據(jù)的商業(yè)案例難以從一開(kāi)始就確定
幾乎在任何企業(yè),在一個(gè)大數(shù)據(jù)項(xiàng)目開(kāi)始部署之前,先建立一個(gè)商業(yè)案例都是非常重要的。然而,大數(shù)據(jù)項(xiàng)目所面臨的挑戰(zhàn)是確定其投資回報(bào)率(ROI)是相當(dāng)困難的,因?yàn)榇髷?shù)據(jù)項(xiàng)目需要投資新的硬件和軟件,并采用一種新的工作方式。在任何行業(yè)內(nèi)地任何企業(yè),大數(shù)據(jù)帶來(lái)了不同的可能性,其結(jié)果也必然會(huì)不同。為了能夠確定投資回報(bào)率,企業(yè)應(yīng)該啟動(dòng)一個(gè)試點(diǎn)項(xiàng)目,其也可以被當(dāng)作是一次經(jīng)驗(yàn)的學(xué)習(xí),以便能夠在以后的大數(shù)據(jù)項(xiàng)目中提供相關(guān)的ROI遵循見(jiàn)解。
因此,企業(yè)所需要克服的挑戰(zhàn)是,在一個(gè)大數(shù)據(jù)項(xiàng)目完成之前,很難確定其有效的投資回報(bào)率的。但是,沒(méi)有一個(gè)明確的投資回報(bào)率,又會(huì)使得大數(shù)據(jù)項(xiàng)目的執(zhí)行變得相當(dāng)困難。為了克服這一挑戰(zhàn),企業(yè)最好從一個(gè)小的、定義良好的試點(diǎn)項(xiàng)目開(kāi)始著手,將該試點(diǎn)項(xiàng)目視為本身不會(huì)帶來(lái)投資回報(bào)的項(xiàng)目,但您會(huì)從中學(xué)到很多關(guān)于大數(shù)據(jù)對(duì)于您企業(yè)的意義。通過(guò)您企業(yè)在試點(diǎn)項(xiàng)目中所取得的經(jīng)驗(yàn),并吸取相關(guān)的教訓(xùn),進(jìn)而可以用來(lái)更好地確定企業(yè)未來(lái)大數(shù)據(jù)項(xiàng)目的ROI。
企業(yè)內(nèi)的數(shù)據(jù)通常存儲(chǔ)在筒倉(cāng)
為了充分利用大數(shù)據(jù),企業(yè)需要將所有不同的數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并。雖然大數(shù)據(jù)的特性之一便是其龐大的數(shù)據(jù)量,而其正是來(lái)源對(duì)對(duì)海量數(shù)據(jù)進(jìn)行合并的結(jié)果。大數(shù)據(jù)發(fā)展的趨勢(shì)便是成為混合數(shù)據(jù)。然而,問(wèn)題在于,如果一家企業(yè)內(nèi)的不同部門(mén)分別進(jìn)行數(shù)據(jù)收集(畢竟,各部門(mén)單獨(dú)進(jìn)行數(shù)據(jù)收集是最有可能做到的)這會(huì)造成使企業(yè)內(nèi)的數(shù)據(jù)難以共享的局面,盡管很可能并不是故意的。以耐克公司為例,該公司曾經(jīng)在整個(gè)企業(yè)范圍內(nèi)進(jìn)行數(shù)據(jù)儲(chǔ)存,從而限制了可以用數(shù)據(jù)來(lái)完成的工作。然后他們?nèi)サ袅送矀}(cāng)將所有數(shù)據(jù)合并到一個(gè)中央平臺(tái),所有員工均可以基于其職位角色訪問(wèn)。這使耐克保持了創(chuàng)新,進(jìn)而保持了領(lǐng)先于競(jìng)爭(zhēng)對(duì)手的優(yōu)勢(shì)。
除了企業(yè)內(nèi)的數(shù)據(jù)倉(cāng),企業(yè)也應(yīng)該注意外面的世界,并開(kāi)始思考可以使用的新的數(shù)據(jù)集。結(jié)合開(kāi)放的社交媒體數(shù)據(jù)和公共數(shù)據(jù)可以提供很大的啟示和見(jiàn)解。企業(yè)在開(kāi)發(fā)一個(gè)大型數(shù)據(jù)策略時(shí),應(yīng)該開(kāi)始跳出企業(yè)范圍內(nèi)進(jìn)行思考,不要讓并沒(méi)有自己被限制在企業(yè)內(nèi)的數(shù)據(jù)。
保證客戶(hù)的隱私,同時(shí)充分利用現(xiàn)有數(shù)據(jù)
在斯諾登事件之后,隱私泄露的問(wèn)題似乎已經(jīng)是過(guò)去的事了,但如果企業(yè)那個(gè)妥善處理他們的數(shù)據(jù),這其實(shí)也并不構(gòu)成太大的問(wèn)題。隱私權(quán)仍然是消費(fèi)者的一個(gè)非常重要的權(quán)利,而且應(yīng)該得到保護(hù)。企業(yè)應(yīng)努力在尋求利潤(rùn)最大化和客戶(hù)隱私數(shù)據(jù)使用之間的平衡。
為了做到這一點(diǎn),企業(yè)應(yīng)該公開(kāi)透明的告知他們的客戶(hù),他們收集了客戶(hù)哪些方面的數(shù)據(jù),為什么要收集、存儲(chǔ)和分析這些數(shù)據(jù)。另外,企業(yè)應(yīng)該盡可能簡(jiǎn)單的讓客戶(hù)明白:企業(yè)收集和調(diào)整了哪些數(shù)據(jù),以及數(shù)據(jù)是如何被使用的。最后,數(shù)據(jù)的安全性應(yīng)該是企業(yè)的關(guān)鍵,企業(yè)應(yīng)該做些什么才能防止數(shù)據(jù)泄露。在過(guò)去幾年,我們已經(jīng)看到太多的數(shù)據(jù)泄露對(duì)消費(fèi)者的隱私帶來(lái)的負(fù)面影響。
在保護(hù)客戶(hù)數(shù)據(jù)的隱私和獲得收集分析數(shù)據(jù)的回報(bào)之間取得適當(dāng)?shù)钠胶馐抢щy的,但在長(zhǎng)期而言,如果您的企業(yè)成功地保護(hù)客戶(hù)的隱私,收集分析數(shù)據(jù)的回報(bào)肯定是可觀的。
大數(shù)據(jù)項(xiàng)目需要文化的轉(zhuǎn)變
在許多企業(yè)中,有一些不相信數(shù)據(jù)的力量的管理者,這阻礙了企業(yè)向以數(shù)據(jù)驅(qū)動(dòng)的信息為中心的企業(yè)方面的轉(zhuǎn)型。他們不信任大數(shù)據(jù),做決策時(shí)寧愿依靠自己的直覺(jué),因此他們不認(rèn)為企業(yè)有必要轉(zhuǎn)向更加以數(shù)據(jù)為驅(qū)動(dòng)的。事實(shí)上,據(jù)IBM的調(diào)查發(fā)現(xiàn),有三分之一的企業(yè)領(lǐng)導(dǎo)者不信任他們收到的數(shù)據(jù)信息來(lái)做出決策。
因此,數(shù)據(jù)的準(zhǔn)確性是非常重要的。這意味著企業(yè)需要確保實(shí)際收集的數(shù)據(jù)是正確的,以及分析的算法是正確的,以確保從數(shù)據(jù)中得出的信息結(jié)論是正確的。這需要一種企業(yè)文化的轉(zhuǎn)變,其需要能夠說(shuō)服所有的企業(yè)領(lǐng)導(dǎo)者相信大數(shù)據(jù),并在制定大數(shù)據(jù)策略時(shí),積極的面對(duì)派生信息這一個(gè)重大的挑戰(zhàn)。為了克服這一挑戰(zhàn),企業(yè)應(yīng)該花費(fèi)足夠的時(shí)間和精力來(lái)教育員工和經(jīng)理們?nèi)绾翁幚頂?shù)據(jù)和使用數(shù)據(jù),以做出正確的決策。這一工作是相當(dāng)費(fèi)時(shí)的,但卻能逐步建立起企業(yè)對(duì)于大數(shù)據(jù)的信任。
雖然開(kāi)發(fā)一個(gè)大數(shù)據(jù)策略是困難的,但企業(yè)不應(yīng)該止步。企業(yè)應(yīng)該從或大或小的項(xiàng)目中開(kāi)始發(fā)掘出企業(yè)所擁有的數(shù)據(jù)的價(jià)值,并結(jié)合企業(yè)內(nèi)數(shù)據(jù)與其他數(shù)據(jù)集來(lái)分析其中蘊(yùn)含的信息和見(jiàn)解。對(duì)于那些已經(jīng)成功地實(shí)施了大數(shù)據(jù)戰(zhàn)略的企業(yè)而言,其過(guò)程從來(lái)都不是一件容易的事,但其帶來(lái)的結(jié)果絕對(duì)是令人印象深刻的。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11