
阻礙大數(shù)據(jù)成功的常見問題
缺乏熟練的數(shù)據(jù)專業(yè)人員(例如資源和內(nèi)部技術(shù)能力)是很多企業(yè)面臨最大的問題,此外,還缺乏高價(jià)值的商業(yè)案例。如今,為了收集大數(shù)據(jù)狀態(tài)的見解,行業(yè)媒體與來自20家企業(yè)的22位高管進(jìn)行了交流,他們主要從事大數(shù)據(jù)工作,或?yàn)榭蛻籼峁┐髷?shù)據(jù)解決方案。
當(dāng)人們問:“你們認(rèn)為阻止企業(yè)獲得大數(shù)據(jù)的好處的最常見的問題是什么?”以下是這些高管給出的答案:相信如果企業(yè)建立一個(gè)大數(shù)據(jù)湖,其結(jié)果變得明顯。數(shù)據(jù)管理是一個(gè)問題。計(jì)劃預(yù)期成果和企業(yè)想要實(shí)現(xiàn)的見解。思考如何進(jìn)行更多的高級(jí)分析。使用正確的工具作業(yè)。確定要在數(shù)據(jù)倉庫中使用的內(nèi)容。企業(yè)不了解業(yè)務(wù)層面的大數(shù)據(jù)。他們沒有確定他們需要解決的業(yè)務(wù)問題,了解什么是正常工作,以及可以做些什么來增加價(jià)值。
一半的IT項(xiàng)目正在整合應(yīng)用程序。獲取訪問權(quán)限如何清理和應(yīng)用數(shù)據(jù)治理,看到兩個(gè)整合,以及有能力外包的廠商?雖然平臺(tái)的訪問費(fèi)用較低,hadoop和Cassandra的進(jìn)入障礙可能很高。
需要對(duì)不同的格式進(jìn)行歸一化,收集,洞察,標(biāo)記,并采用可搜索的格式。
一個(gè)常見的問題是簡(jiǎn)單地低估了實(shí)現(xiàn)一個(gè)功能齊全的大數(shù)據(jù)系統(tǒng)的難度。還有很多其他的工具也會(huì)讓企業(yè)開始,很多開放源碼是偉大的沙盒,但對(duì)于生產(chǎn)級(jí)大數(shù)據(jù)系統(tǒng)是完全不同的。隨著業(yè)務(wù)需求的變化,保持系統(tǒng)的運(yùn)行和發(fā)展是另一個(gè)重大挑戰(zhàn)。人們一再聽到同樣的故事,他們了解大數(shù)據(jù)解決方案,并說:“感謝這個(gè)想法,我們有一些大數(shù)據(jù)體驗(yàn),我們認(rèn)為自己也可以建立?!蓖ǔ?,這些團(tuán)隊(duì)在幾個(gè)月后將會(huì)表示,這比我們想像的還要難。
能夠動(dòng)態(tài)地連接不同的來源,盡可能地保持工作的進(jìn)程,使他們能夠?qū)W⒂诟邔哟蔚幕顒?dòng)。復(fù)雜性加劇了整合和實(shí)施數(shù)據(jù)所需的技能。嘗試將所有數(shù)據(jù)集中在一起,以便企業(yè)可以更改訪問數(shù)據(jù)的80:20比例,并分析其數(shù)據(jù)。企業(yè)找不到需要查找的數(shù)據(jù),因?yàn)樗刑嗟臄?shù)據(jù)。有些文件名是神秘的,害怕給人們?cè)L問數(shù)據(jù),因?yàn)椴恢罃?shù)據(jù)是什么。企業(yè)需要攝取,編目和查找數(shù)據(jù)。
慣性。沒有開始
由公司的能力而異。對(duì)大數(shù)據(jù)集群的認(rèn)知是10到50個(gè),只有少數(shù)幾個(gè)客戶擁有數(shù)千個(gè)節(jié)點(diǎn)。開始運(yùn)行并及時(shí)了解版本,而工具的標(biāo)準(zhǔn)化成為額外的工作。文化。大公司受益于大數(shù)據(jù)分析,擺脫項(xiàng)目必須成功的假設(shè),允許失敗和學(xué)習(xí),允許迭代和實(shí)驗(yàn)。像西門子和菲利普斯這樣的創(chuàng)新領(lǐng)導(dǎo)者可以向業(yè)務(wù)團(tuán)隊(duì)展示當(dāng)允許失敗時(shí)可以獲得多大的成功。固定特定技術(shù)。確定正在嘗試解決什么問題,并準(zhǔn)備隨著時(shí)間推移。擁有合適的人選。人才問題很大。企業(yè)必須有合格的候選人。數(shù)據(jù)科學(xué)家必須保持技術(shù)前沿,知道哪些工具正在發(fā)展以解決問題。
他們需要指導(dǎo)。生態(tài)系統(tǒng)正在迅速發(fā)展,企業(yè)必須處于不利地位,才能知道問題的最佳解決方案。Spark需要從存儲(chǔ)密集型到計(jì)算密集型的不同架構(gòu)。對(duì)于具有傳統(tǒng)系統(tǒng)的傳統(tǒng)企業(yè)而言更為困難。他們傾向于更加緩慢而有條不紊地采取行動(dòng)。行業(yè)廠商為銀行和保健公司創(chuàng)建了一個(gè)商業(yè)價(jià)值顧問團(tuán)隊(duì)。有客戶設(shè)定具體目標(biāo)(即減少4%的流失)達(dá)到或超過目標(biāo),然后轉(zhuǎn)到下一個(gè)項(xiàng)目。開源的速度對(duì)大多數(shù)人來說是壓倒性的。企業(yè)需要知道接下來會(huì)發(fā)生什么,所以可以相應(yīng)地進(jìn)行規(guī)劃。行業(yè)廠商正在推動(dòng)開放標(biāo)準(zhǔn),使客戶更加靈活,擁有更多技能和便攜性的市場(chǎng)。在云計(jì)算和本地的大數(shù)據(jù)方面保證靈活性。
缺乏資源和內(nèi)部的技術(shù)能力。每個(gè)人都需要了解人們?cè)谧约旱木W(wǎng)站和博客上做了什么。有幾個(gè)好產(chǎn)品可以告訴你這些事情,比如MixPanel和Google Analytics(谷歌分析),而不再需要數(shù)據(jù)科學(xué)家的幫助。存在于孤島的數(shù)據(jù):太難以及時(shí)并入并提取有意義的見解。存儲(chǔ)和忘記大數(shù)據(jù)的方法:沒有明確的分析大數(shù)據(jù)的策略來實(shí)現(xiàn)業(yè)務(wù)收益。技能缺口:大數(shù)據(jù)系統(tǒng)/工具太復(fù)雜,無法用于大多數(shù)員工。收集涉及特定個(gè)人行為的數(shù)據(jù)時(shí),擔(dān)心法律問題。在B2B中,這是一個(gè)真正的關(guān)注點(diǎn)?!皵?shù)據(jù)足夠好”的問題總是發(fā)揮作用。這是一個(gè)有效的關(guān)注,但是沒有做任何事情都沒有回答這個(gè)問題。。如果你失敗了,就會(huì)知道你的數(shù)據(jù)收集應(yīng)該在哪里改善。企業(yè)明白可以應(yīng)用的用例,但它是一種新型的項(xiàng)目,目前還沒有很多系統(tǒng)集成商可以支持它們。
無法界定明確的業(yè)務(wù)目標(biāo)。獲得具有技能的人實(shí)現(xiàn)目標(biāo)。沒有足夠的人擁有提供大型數(shù)據(jù)項(xiàng)目所需的知識(shí)和經(jīng)驗(yàn)。軟件工程師不僅要了解概念和可能性,還要了解如何提供。人們經(jīng)常認(rèn)為他們需要數(shù)據(jù)科學(xué)家,但他們需要產(chǎn)品所有者,數(shù)據(jù)工程團(tuán)隊(duì),數(shù)據(jù)科學(xué)家等等。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03