
揭穿數(shù)據(jù)分析的12個神話
在IT業(yè)界中,炒作越多,誤解就越多,數(shù)據(jù)分析也不例外。作為當(dāng)今IT技術(shù)最熱門的方向之一,數(shù)據(jù)分析可以帶來顯著的業(yè)務(wù)收益,但是帶來的誤解可能也會阻礙順利地、及時地交付可能讓業(yè)務(wù)用戶和最終客戶受益的分析能力。
隨著企業(yè)組織創(chuàng)建或者擴(kuò)展其分析戰(zhàn)略,這里有十幾個需要揭穿的數(shù)據(jù)分析神話需要他們牢記在心。
神話1:數(shù)據(jù)分析需要大量投資
現(xiàn)在來看,幾乎每一項技術(shù)都必須經(jīng)過財務(wù)穩(wěn)健性的過濾。“這項技術(shù)成本多少?”這個問題是IT和業(yè)務(wù)經(jīng)理們在提出啟動新項目或者開發(fā)新工具的時候,會被問到的第一個問題。
有些人認(rèn)為,數(shù)據(jù)分析的本質(zhì)是一項成本高昂的工作,因此僅限于那些有著充足預(yù)算或者大量內(nèi)部資源的企業(yè)組織。但并非所有數(shù)據(jù)分析項目都需要大量投資,移動和在線房地產(chǎn)服務(wù)提供商Trulia副總裁Deep Varma這樣表示。
“現(xiàn)在市場上有這么多的開源工具和其他可用工具,可以幫助你開始展示數(shù)據(jù)分析的價值。你需要很好地了解你的內(nèi)部數(shù)據(jù)存儲和你試圖解決哪些問題。云也讓嘗試用分析來解決業(yè)務(wù)問題變得更輕松。”
現(xiàn)代分析“是基于云系統(tǒng)和大數(shù)據(jù)架構(gòu)的,從定義上看其成本不如傳統(tǒng)數(shù)據(jù)倉庫系統(tǒng)那么高,”咨詢公司EY全球分析負(fù)責(zé)人Beatriz Sanz Saiz表示。
“而且,數(shù)據(jù)和分析通常用于實現(xiàn)三個結(jié)果:改善流程效率、收入增長和主動風(fēng)險管理。總而言之,數(shù)據(jù)和分析的應(yīng)用,給任何公司帶來了重要的成本收益?!?
神話2:你需要大數(shù)據(jù)來執(zhí)行分析
對很多人來說,大數(shù)據(jù)和分析這兩個概念是齊頭并進(jìn)的。這個想法是說,企業(yè)組織需要在執(zhí)行分析之前收集大量數(shù)據(jù),以便產(chǎn)生業(yè)務(wù)洞察,改進(jìn)決策等。
大數(shù)據(jù)分析的某些好處已經(jīng)很明確了,那些擁有資源的企業(yè)確實可以通過利用數(shù)據(jù)存儲作為分析的一部分來獲得顯著的競爭優(yōu)勢。但是,大數(shù)據(jù)是分析必不可少的想法是不正確的。
人力資源公司Allegis Global Solutions商業(yè)智能執(zhí)行總監(jiān)Tim Johnson表示:“人們經(jīng)常試圖獲取盡可能多的數(shù)據(jù),他們聽到大數(shù)據(jù)就會興奮不已。有一個誤解就是,數(shù)據(jù)越多越好,機(jī)器會對所有這些數(shù)據(jù)進(jìn)行篩選。”
但是,分析師們需要的是特定的數(shù)據(jù),而不是更多的數(shù)據(jù)。Johnson表示:“有95%的用戶在尋求與他們工作相關(guān)的信息,來支持決策和改善業(yè)績?!钡瞧髽I(yè)組織必須考慮業(yè)務(wù)用戶來決定他們需要哪些數(shù)據(jù),還有如何呈現(xiàn)這些,他們需要的不是數(shù)據(jù)越多越好。
Johnson說:“要能夠以各種方式訪問每一條信息,這有點不太可能,實際上也會阻礙信息的采用。相反,你要找出對他們最重要的信息、你如何以最簡單的形式向他們呈現(xiàn)這些信息?!?
神話3:分析可以消除人為偏差
自動化系統(tǒng)執(zhí)行的方式不應(yīng)該是有偏見的。但是技術(shù)是由人開發(fā)的,所以消除所有的偏差幾乎是不可能的。有人認(rèn)為,分析和機(jī)器學(xué)習(xí)會消除人為偏差。
“遺憾的是,這根本不是真的。我們使用‘訓(xùn)練數(shù)據(jù)’來優(yōu)化算法和分析,這會重新引發(fā)訓(xùn)練數(shù)據(jù)所具有的特征?!?
在某些情況下,這會給分析結(jié)果帶來偏差;有些情況下,則有更嚴(yán)重的偏差。Mason表示:“算法這么說,并不意味著回答是公平的或者有用的?!?
神話4:最好的算法總是會勝出
事實上,有了足夠的數(shù)據(jù),“有時候算法并不重要,”Mason表示。在他援引的一篇題為“數(shù)據(jù)的不合理有效性”的IEEE文章中,Google工程師認(rèn)為,簡單的統(tǒng)計模型,加上非常大量的數(shù)據(jù),可以比包含了大量特性和總結(jié)的“智能優(yōu)越”模型實現(xiàn)更好的結(jié)果。
“在某些情況下,僅僅處理大量數(shù)據(jù)就能實現(xiàn)最好的結(jié)果,”Mason說。
神話5:算法是安全的
從很大程度上看,人們固有信念中是信任統(tǒng)計模型和算法的,隨著企業(yè)組織建立他們的分析程序,他們越來越多地依賴復(fù)雜模型來支持決策。
“因為人們不了解模型、算法和其他先進(jìn)的數(shù)據(jù)科學(xué)實踐,所以人們信任這些。用戶不覺得自己具有挑戰(zhàn)這些模型的知識,所以他們反過來覺得必須信任建立了這些模型的‘聰明人’?!?
“在過去50到60年中,我們一直聽到有關(guān)于人工智能將在未來20年內(nèi)占主導(dǎo)的說法,我們還會繼續(xù)聽到有人這么說。在我們公然地相信機(jī)器學(xué)習(xí)及其結(jié)果之前,我們還有很多沒有涉足的領(lǐng)域。在那之前,我們需要向那些構(gòu)建了算法和模型的人發(fā)起挑戰(zhàn),解釋這些答案是怎么來的。這并不是說我們不能依靠結(jié)果,而是我們需要透明度讓我們可以信任分析、并對分析進(jìn)行驗證?!?
神話6:數(shù)據(jù)科學(xué)是一種神秘的“黑色藝術(shù)”
數(shù)據(jù)科學(xué)這個學(xué)科近些年來受到了很多關(guān)注,有時候會產(chǎn)生混淆,數(shù)據(jù)科學(xué)究竟是什么?基本上,數(shù)據(jù)科學(xué)涉及到使用算法來發(fā)現(xiàn)數(shù)據(jù)中的模式。
“數(shù)據(jù)科學(xué)似乎很神秘,因為這些算法能夠分析比人腦能理解的更多變量和更大的數(shù)據(jù)集,”數(shù)據(jù)存儲公司Micron首席信息官Trevor Schulze表示。
Schulze說:“近幾年隨著計算能力和內(nèi)存的擴(kuò)大,我們現(xiàn)在能夠快速解決10年前技術(shù)解決不了的問題。數(shù)據(jù)科學(xué)是統(tǒng)計推斷技術(shù)的自然演變。一旦你了解了數(shù)學(xué),數(shù)據(jù)科學(xué)就沒有什么神秘的地方了?!?
神話7:要做更多的數(shù)據(jù)科學(xué),你就需要更多的數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是當(dāng)今所有技術(shù)專業(yè)人員中最迫切的人才類型。如果企業(yè)組織重新定位數(shù)據(jù)科學(xué)家的工作內(nèi)容,那么用更少一點的數(shù)據(jù)科學(xué)家就可以做到同樣的事情。
“有很多數(shù)據(jù)科學(xué)家的時間是花在了非增值活動上,例如尋找數(shù)據(jù)集、把數(shù)據(jù)放在可以處理的地方、轉(zhuǎn)換和清理數(shù)據(jù)。鑒于聘請數(shù)據(jù)科學(xué)家是很困難的一件事,所以你肯定不是想讓數(shù)據(jù)科學(xué)家來做這些低價值的工作吧?!?
“Uber的Michelangelo平臺讓數(shù)據(jù)科學(xué)家可以專注于功能設(shè)計、提取和分析,而不是對數(shù)據(jù)進(jìn)行挖掘,這樣可以大大提高生產(chǎn)力。”
神話8:分析需要的時間太長
現(xiàn)在快速完成工作對于企業(yè)來說是一個巨大的競爭考量因素,不管這個工作是將產(chǎn)品或者服務(wù)推向市場,還是以接近實時的方式響應(yīng)客戶詢問。分析聽起來像是需要花費(fèi)很長時間,這與實現(xiàn)速度和靈活性的目標(biāo)背道而馳。
“分析項目需要花費(fèi)很長時間并且非常復(fù)雜——這個誤解仍然存在。最終,這是關(guān)于人才的問題。通過恰當(dāng)?shù)募寄芙M合和敏捷方法的運(yùn)用,大問題可以在幾天或者幾周內(nèi)得到解決,而不是幾個月的時間。”
神話9:技術(shù)是最難的部分
今天可用的技術(shù)越來越多,選擇部署和集成合適的工具組合來從分析團(tuán)隊那里得到預(yù)期的結(jié)果,這不是像公園里散步這么簡單的事,咨詢公司ISG的IT外包和數(shù)字咨詢服務(wù)總監(jiān)James Burke表示。
真正難的部分是“把組織結(jié)構(gòu)和運(yùn)營模式結(jié)合到一起,把所有從人、流程、技術(shù)角度所需要的東西結(jié)合到一起。而且,你如何在現(xiàn)有企業(yè)組織內(nèi)部或者臨近的地方做這件事情,似乎對企業(yè)來說是最難的部分?!?
不要以為分析工具會完成所有工作,這一點也很重要。咨詢公司W(wǎng)est Monroe的技術(shù)實踐高級總監(jiān)Greg Layok表示:“技術(shù)本身并不會解決任何業(yè)務(wù)問題。如果企業(yè)組織急于創(chuàng)建數(shù)據(jù)湖的話,最終會陷入沼澤,一個其他任何人都無法了解的信息沼澤中?!?
技術(shù)并不解決分析問題,Layok表示?!笆紫?,發(fā)現(xiàn)一個業(yè)務(wù)問題,然后問‘我需要哪些數(shù)據(jù)來解決這個問題?’這將幫助你發(fā)現(xiàn)企業(yè)組織內(nèi)的數(shù)據(jù)鴻溝?!?
神話10:數(shù)據(jù)分析應(yīng)該是一個單獨(dú)的部門
在有些企業(yè)組織內(nèi),數(shù)據(jù)分析是作為一個單獨(dú)的部門運(yùn)作的,還有一些是被嵌入到了一個跨職能部門中,咨詢和數(shù)據(jù)收集公司Delvinia總裁兼首席創(chuàng)新關(guān)Steven Mast這樣說。
“不過,隨著數(shù)據(jù)擴(kuò)展到所有業(yè)務(wù)領(lǐng)域,以及這一變化的快速發(fā)生,部門模式已經(jīng)不起作用了。隨著企業(yè)組織變得更加以客戶為中心,數(shù)據(jù)驅(qū)動的分析專家應(yīng)該成為業(yè)務(wù)部門的核心,而不是作為一個你打電話許尋求支持的部門來運(yùn)作?!?
今天企業(yè)組織面臨的很多復(fù)雜問題都是發(fā)生在業(yè)務(wù)部門的,這些問題的很多解決方案卻隱藏在數(shù)據(jù)中心。Mast表示:“數(shù)據(jù)科學(xué)家和數(shù)據(jù)專家正在與這些部門緊密合作,使用大型數(shù)據(jù)集和人工智能,這將成為培育下一代產(chǎn)品、服務(wù)和客戶體驗的關(guān)鍵?!?
神話11:分析僅限于有博士學(xué)位的人
在分析團(tuán)隊中有很多受過良好教育的人才是很棒的,但并不是成功的要求條件。
Saiz說:“企業(yè)往往認(rèn)為,團(tuán)隊中沒有博士的話他們就無法實現(xiàn)最佳的分析?,F(xiàn)代分析需要融合的技能——那些精通新興技術(shù)和開源軟件的人。用擁有不同技能的人才來打造團(tuán)隊,包括大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)可視化專家,這才能體現(xiàn)差異?!?
神話12:人工智能會毀掉人類的工作、破壞經(jīng)濟(jì)
從歷史上看,新技術(shù)的引入顛覆了就業(yè)和行業(yè),人們擔(dān)心人工智能會消除人類執(zhí)行某些任務(wù)的需求。
“人工智能解決方案在解決特定問題方面要比人類好得多,人工智能讀得更快、記得更多、計算復(fù)雜數(shù)據(jù)關(guān)系比任何人類都好。但是,人工智能不能處理新出現(xiàn)的情況,這是人類擅長的地方?!?
可以肯定的是,人工智能的發(fā)展已經(jīng)讓很多工作消失或者減少,接下來也還會有很多工作如此,“但是,我們?nèi)祟惱斫夂蛻?yīng)對完全不可預(yù)見的環(huán)境方面不會被現(xiàn)有任何已知的人工智能技術(shù)所取代。對于可預(yù)見的未來,最有效的方法就是利用人工智能系統(tǒng)來增強(qiáng)人類能力,讓人工智能執(zhí)行某些‘繁重任務(wù)’,這方面算法的表現(xiàn)是好于人類的。盡管很多工作會因人工智能而妨礙變,但是人類仍然是這個商業(yè)生態(tài)系統(tǒng)中的重要組成部分?!?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03