
大多數(shù)企業(yè)估算稱,他們只對(duì)自身持有的約12%數(shù)據(jù)進(jìn)行了分析,F(xiàn)orrester研究公司在最 近的一項(xiàng)調(diào)查中發(fā)現(xiàn)。這到底是好消息還是壞消息?這個(gè)嘛,被 他們所忽略的88%數(shù)據(jù)當(dāng)中很可能蘊(yùn)藏著足以帶來數(shù)據(jù)驅(qū)動(dòng)結(jié)論的寶貴信息。但從另一個(gè)角度看,他們也許明智地避免了由所謂“煮沸海洋”戰(zhàn)略所帶來的巨大資 源消耗。說起企業(yè)忽略絕大多數(shù)自有數(shù)據(jù)的理由,原因主要有兩點(diǎn):第一是缺乏相關(guān)分析工具與“可控制”數(shù)據(jù)倉(cāng)庫(kù),第二則在于他們很難確切了解哪些信息能夠?qū)? 現(xiàn)價(jià)值、哪些則最好加以忽略,F(xiàn)orrester公司在報(bào)告中指出。
大數(shù)據(jù)掀起的狂潮對(duì)于具備特定技能的從業(yè)人員來說不啻為一大福音。根據(jù) Dice網(wǎng)站(一家專門服務(wù)于技術(shù)及工程專業(yè)人才的求職網(wǎng)站)的統(tǒng)計(jì),目前業(yè)界對(duì)于數(shù)據(jù)專家的需求正持續(xù)激增。與上一年相比,目前針對(duì)NoSQL技術(shù)人員 的招聘崗位數(shù)量增長(zhǎng)了54%,而面向“大數(shù)據(jù)人才”的崗位也上漲了46%,該網(wǎng)站在今年四月的報(bào)告中指出。雖然這樣的提升幅度令人印象深刻,不過與網(wǎng)絡(luò)安 全專家的職位需求相比仍然是小巫見大巫——后者的同比增長(zhǎng)幅度高達(dá)162%
在未來六年當(dāng)中,數(shù)字化領(lǐng)域的數(shù)據(jù)問題將由目前的3.2 ZB(即澤字節(jié))增長(zhǎng)到40 ZB。(1 ZB基本相當(dāng)于10億TB。)“當(dāng)我們審視即將席卷而來的數(shù)據(jù)量時(shí),其龐大的規(guī)模真的很令人興奮,”Hortonworks公司CEO Rob Bearden在今年于加利福尼亞州圣何塞舉辦的2014 Hadoop峰會(huì)上表示。“從現(xiàn)在到2020年,企業(yè)所持有的數(shù)量問題將以每年50倍的速度遞增。我認(rèn)為目前最重要的任務(wù)在于清醒地認(rèn)識(shí)到,其中85%的 數(shù)據(jù)來自新興網(wǎng)絡(luò)數(shù)據(jù)源?!卑ㄒ苿?dòng)、社交媒體以及Web與機(jī)器生成數(shù)據(jù)在內(nèi)的這些新興數(shù)據(jù)源將給全球企業(yè)帶來重大挑戰(zhàn)與不可錯(cuò)過的發(fā)展機(jī) 遇,Bearden指出。
大數(shù)據(jù)相關(guān)崗位的薪酬相當(dāng)突出。根據(jù)Burtch Works公司發(fā)布的2014年4月數(shù)據(jù)科學(xué)家薪酬報(bào)告,2014年數(shù)據(jù)科學(xué)家職位的基礎(chǔ)薪酬為每年12萬美元,相關(guān)管理崗位則為每年16萬美元。這一結(jié) 論以Burtch Works就業(yè)數(shù)據(jù)庫(kù)的分析為基礎(chǔ),涉及超過170位數(shù)據(jù)科學(xué)家在采訪中的意見反饋。對(duì)于范疇更為廣泛的大數(shù)據(jù)相關(guān)專業(yè)人士而言,也就是那些“利用復(fù)雜的 定量分析技術(shù)對(duì)事務(wù)、相互作用或者其它人為因素進(jìn)行數(shù)據(jù)化描述、從而得出結(jié)論及對(duì)應(yīng)方案的從業(yè)者”,其整體薪酬同樣實(shí)現(xiàn)了顯著提升。這類工作人員在 2013年獲得的平均薪酬水平在每年9萬美元左右,而相關(guān)管理崗位則開出了每年14.5萬美元這一令人艷羨的平均工資。
大多數(shù)IT專家表示他們還沒有開始為物聯(lián)網(wǎng)時(shí)代的來臨進(jìn)行準(zhǔn)備。Spiceworks公司今年四 月對(duì)440位IT專業(yè)人士進(jìn)行了調(diào)查,了解他們?nèi)绾慰创锫?lián) 網(wǎng)并有針對(duì)性地推進(jìn)前期準(zhǔn)備工作。其中62%的受訪者來自北美地區(qū),38%則來自EMEA(即歐洲、中東以及非洲)地區(qū)。超過一半(59%)的受訪者指 出,他們還沒有采取具體的步驟來處理未來產(chǎn)生自傳感器、攝像頭以及其它各類物聯(lián)網(wǎng)設(shè)備的海量數(shù)據(jù)。不過調(diào)查還發(fā)現(xiàn),也有相當(dāng)一部分IT專業(yè)人士開始切實(shí)籌 備物聯(lián)網(wǎng)相關(guān)事宜,包括向基礎(chǔ)設(shè)施、安全、應(yīng)用以及分析機(jī)制進(jìn)行投資,并同時(shí)擴(kuò)大數(shù)據(jù)傳輸帶寬。
2012 年10月《哈佛商業(yè)評(píng)論》發(fā)布了一篇抓人眼球的報(bào)道,其中將數(shù)據(jù)科學(xué)相關(guān)工作稱為“二十一世紀(jì)最性感的工作崗位”。這種說法存在一定爭(zhēng)議,不過如果把“性 感”當(dāng)成是需求的代名詞則更容易理解,這是指數(shù)據(jù)科學(xué)家仍然擁有旺盛的市場(chǎng)需求。根據(jù)全球IT職業(yè)介紹服務(wù)供應(yīng)商Modis的統(tǒng)計(jì),目前數(shù)據(jù)科學(xué)家仍然處 于“需求高企但供應(yīng)不足”的階段,換言之與大數(shù)據(jù)相關(guān)的博士學(xué)位持有者年平均薪酬都能超過六位數(shù)。
數(shù)據(jù)倉(cāng)庫(kù)業(yè)界是否該為Hadoop的迅速崛起而感到擔(dān)憂甚至恐慌?抑或是該向其敞開熱情的懷 抱?Cloudera公司的Doug Cutting與Hortonworks公司的Arun Murthy作為Hadoop領(lǐng)域的兩位先驅(qū)者,在本屆Hadoop 2014峰會(huì)的問答環(huán)節(jié)中提出了這樣的問題。盡管很多企業(yè)開始將數(shù)據(jù)倉(cāng)庫(kù)中的工作負(fù)載遷移到Hadoop環(huán)境當(dāng)中,但這種作法仍然沒有成為主流。但未來情 況是否會(huì)有變化?“如果相當(dāng)比例的用戶不再增加數(shù)據(jù)倉(cāng)庫(kù)的規(guī)模,反而由于發(fā)現(xiàn)了Hadoop類系統(tǒng)在處理效率與負(fù)擔(dān)成本方面的優(yōu)勢(shì)而對(duì)數(shù)據(jù)倉(cāng)庫(kù)方案進(jìn)行投 資或者規(guī)??s減處理,那我認(rèn)為這確實(shí)應(yīng)該算作一種威脅,”Cutting解釋道。
對(duì)于隱私與安全漏洞的擔(dān)憂與看似無窮無盡的問題解決道路不可能阻止大數(shù)據(jù)的發(fā)展進(jìn)程?!督?jīng)濟(jì)學(xué) 家》在今年六月的一篇報(bào)道中指出,“沒有證據(jù)表明隱私問題會(huì)給 數(shù)據(jù)的使用以及存儲(chǔ)方式帶來根本性轉(zhuǎn)變?!盙artner公司分析師Carsten Casper在接受該雜志采訪時(shí)表示,IT領(lǐng)域并沒有醞釀一場(chǎng)“隱私大革命”。而且盡管企業(yè)用戶始終在就隱私相關(guān)問題提出更多要求,但其中九成查詢其實(shí)指 向的都是本地?cái)?shù)據(jù)中心,Casper補(bǔ)充稱。
從2013年到2018年,全球軟件市場(chǎng)的年度復(fù)合增長(zhǎng)率將在6%上下浮動(dòng),研究企業(yè)IDC公司預(yù)測(cè)稱。不過大數(shù)據(jù)相關(guān)門類,包括協(xié)作應(yīng)用程序與數(shù)據(jù)訪問、分析與交付解決方案以及結(jié)構(gòu)化數(shù)據(jù)管理軟件,將在未來五年內(nèi)迎來更高的年度復(fù)合增長(zhǎng)水平(約為9%),IDC指出。
對(duì)于社交媒體的進(jìn)一步關(guān)注也將有助于這種增長(zhǎng)趨勢(shì)的持續(xù)?!吧缃幻襟w關(guān)注度與面向大數(shù)據(jù)及分析解 決方案的需求增長(zhǎng)可謂互相依托,二者將幫助企業(yè)理解并切實(shí)推 進(jìn)對(duì)于客戶行為的預(yù)期以及與產(chǎn)品可靠性及維護(hù)相關(guān)的新思路,”IDC公司分析師Herny Morris在一份聲明中表示。
物聯(lián)網(wǎng)將包含眾多千奇百怪但又精妙非常的設(shè)備,其中很多對(duì)于大數(shù)據(jù)領(lǐng)域來說都是前所未見的新鮮事物。有鑒于此,ABI研究公司的分析師們預(yù)計(jì)到2020年,全球無線聯(lián)網(wǎng)設(shè)備總量將超過300億。其中醫(yī)療相關(guān)數(shù)據(jù)收集方案將在物聯(lián)網(wǎng)時(shí)代下扮演重要角色。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10