
大數(shù)據(jù)解決方案的實(shí)施讓很多的IT部門面臨困境。大數(shù)據(jù)應(yīng)用程序并不需要如支持團(tuán)隊(duì)做應(yīng)用程序一樣的基礎(chǔ)架構(gòu)。隨著企業(yè)接受大數(shù)據(jù),管理層會(huì)假設(shè)員工規(guī)模會(huì)減少。
而那些非必要的技術(shù)人員應(yīng)該做什么呢?一個(gè)答案就是:將其轉(zhuǎn)換為技術(shù)顧問,與業(yè)務(wù)部門進(jìn)行協(xié)作。換句話說,就是給予他們面向客戶的角色。
大數(shù)據(jù)之后信息技術(shù)的狀態(tài)
大數(shù)據(jù)革命已然過去,這讓信息技術(shù)(IT)企業(yè)不同程度的采用了新技術(shù)。有些完全接受了大數(shù)據(jù)存儲(chǔ)和復(fù)雜分析的概念,并采用了最佳實(shí)踐和成熟的項(xiàng)目管理方法。結(jié)果是:形成了關(guān)于產(chǎn)品,銷售,訂單及最重要的客戶的分析寶庫。
而其他的用戶則沒有如此幸運(yùn)??赡芩麄兯徺I的特定供應(yīng)商的解決方案并不包含完整的規(guī)劃,或是可能中層管理人員并沒有準(zhǔn)備好為成功的解決方案投入必要的成熟資源。結(jié)果便是:半組織化的信息集合,少數(shù)分析解決方案,并且這種想法會(huì)在某天以某種方式讓其付出代價(jià)。
與此同時(shí),數(shù)據(jù)庫管理員、系統(tǒng)程序員,以及其他技術(shù)專家和主題專家處在一個(gè)后大數(shù)據(jù)時(shí)代。軟硬件安裝及配置已經(jīng)完成,概念驗(yàn)證和試點(diǎn)程序已交付給最先的內(nèi)部客戶。大多數(shù)軟硬件混合大數(shù)據(jù)解決方案都不要求內(nèi)部調(diào)優(yōu):分析查詢執(zhí)行非常快,而且業(yè)務(wù)分析師正對(duì)探索和調(diào)查尋找有用信息翹首以待。還剩下什么留給技術(shù)人員去做呢?
當(dāng)前的基礎(chǔ)架構(gòu)團(tuán)隊(duì)
首先,我們來考慮多面手。新手DBA和系統(tǒng)程序員在這個(gè)類別起步,只是發(fā)展專業(yè)技能并在他們之后的職業(yè)生涯中加深知識(shí)。他們最好的角色往往是明確定義好的,標(biāo)準(zhǔn)化的流程。這些包括:
管理數(shù)據(jù)庫備份和恢復(fù)流程;
監(jiān)視并檢測災(zāi)難恢復(fù)準(zhǔn)備;
實(shí)施自我分析和自我調(diào)優(yōu)流程(有時(shí)稱之為自治);
SQL查詢調(diào)優(yōu),包括Explains和訪問路徑分析;
數(shù)據(jù)庫性能調(diào)優(yōu);
測試生產(chǎn)對(duì)象和數(shù)據(jù)遷移;
監(jiān)視數(shù)據(jù)庫日志以發(fā)現(xiàn)錯(cuò)誤和問題。
在新環(huán)境中,很多這些流程是多余的或不必要的。鑒于大數(shù)據(jù)分析解決方案的速度,SQL查詢調(diào)優(yōu)在大多數(shù)情況下可能是不必要的。對(duì)于數(shù)據(jù)庫性能調(diào)優(yōu)同樣如此,因?yàn)楹芏喙?yīng)商的軟硬件混合解決方案(有時(shí)稱之為設(shè)備)是在沒有任何內(nèi)部性能調(diào)優(yōu)的功能條件下交付的。這就使得輔助人員更加容易的完成工作。
結(jié)果就是:在后大數(shù)據(jù)時(shí)代的IT企業(yè)中不再需要多面手。
接下來,讓我們考慮專家專門負(fù)責(zé)的處理復(fù)雜工作:
系統(tǒng)和網(wǎng)絡(luò)性能調(diào)優(yōu);
軟件安裝和版本遷移;
為關(guān)鍵任務(wù)應(yīng)用程序做首要技術(shù)支持;
協(xié)助和管理數(shù)據(jù)架構(gòu)變更;
對(duì)潛在供應(yīng)商工具執(zhí)行基準(zhǔn)測試。
隨著IT企業(yè)接受大數(shù)據(jù)分析,需要專家做的事會(huì)更少,這意味著專家需求量會(huì)減少。
在后大數(shù)據(jù)時(shí)代的基礎(chǔ)架構(gòu)支持
IT專家和多面手必須將他們的注意力轉(zhuǎn)移到內(nèi)部用戶上來,他們會(huì)面臨許多的技術(shù)問題。以下是他們最為緊迫的一些問題。
大數(shù)據(jù)性能
隨著大數(shù)據(jù)應(yīng)用程序價(jià)值的增長,業(yè)務(wù)分析師對(duì)分析的使用會(huì)劇增。更多的查詢會(huì)產(chǎn)生可操作的結(jié)果,生成常規(guī)報(bào)表。用戶會(huì)要求時(shí)間跨度更大,地理區(qū)域更大的更多數(shù)據(jù)。最終,大量用戶和查詢會(huì)壓垮你的大數(shù)據(jù)應(yīng)用程序。
專家應(yīng)該注意增加內(nèi)部用戶應(yīng)用程序的知識(shí)。他們需要什么數(shù)據(jù),他們什么時(shí)候需要,以及誰會(huì)使用這些結(jié)果?專家會(huì)在一些應(yīng)用程序領(lǐng)域變?yōu)橹黝}專家,作為內(nèi)部顧問,以及會(huì)在諸如查詢效率和類似數(shù)據(jù)集之類的高級(jí)分析方法提供問題咨詢,進(jìn)而提升他們的價(jià)值。
多面手可以在他們的環(huán)境中通過收集性能數(shù)據(jù)和使用統(tǒng)計(jì)信息來提供有價(jià)值的服務(wù)。這些數(shù)據(jù)可能會(huì)用于對(duì)查詢類別進(jìn)行優(yōu)先級(jí)的劃分。例如,當(dāng)資源利用較低時(shí),低優(yōu)先級(jí)查詢會(huì)推遲處理。
企業(yè)數(shù)據(jù)模型
隨著存儲(chǔ)了越來越多的數(shù)據(jù),擁有一個(gè)有組織的數(shù)據(jù)字典和數(shù)據(jù)模型變得尤為重要。試問如果不知道擁有什么樣的數(shù)據(jù),又如何有效的進(jìn)行查詢呢?
專家,特別是數(shù)據(jù)庫管理員,應(yīng)該已經(jīng)意識(shí)到數(shù)據(jù)建模概念并且應(yīng)該擁有多重應(yīng)用程序和系統(tǒng)的知識(shí)?,F(xiàn)在可以利用這些知識(shí)來協(xié)助業(yè)務(wù)分析師進(jìn)行最初的分析定義和查詢構(gòu)建。
多面手可以作為應(yīng)用程序調(diào)查員來提供服務(wù),給出數(shù)據(jù)元素的清單并進(jìn)行分類和確認(rèn)數(shù)據(jù)屬性和來源。
大數(shù)據(jù)技術(shù)
大數(shù)據(jù)并不只是關(guān)于用戶姓名,賬號(hào),以及存款等。雖然這些常見的業(yè)務(wù)數(shù)據(jù)可以包括在大數(shù)據(jù)解決方案中,但是還有更為有趣的數(shù)據(jù)元素和數(shù)據(jù)類型可以探索:
還有諸如大型對(duì)象(LOBs)之類的新型復(fù)雜數(shù)據(jù)類型
諸如可擴(kuò)展標(biāo)記語言(XML)的自我描述型數(shù)據(jù)正變?yōu)閮?nèi)部應(yīng)用程序數(shù)據(jù)傳輸事實(shí)上的標(biāo)準(zhǔn)。很多文檔和數(shù)據(jù)記錄都以XML格式存儲(chǔ),因?yàn)樗鼈兛梢酝ㄟ^多種跨平臺(tái)應(yīng)用程序進(jìn)行讀取。
多重結(jié)構(gòu)數(shù)據(jù)在捕獲用戶網(wǎng)站行為的時(shí)候是很常見的。所謂的點(diǎn)擊流為追蹤網(wǎng)站訪問者做了什么和他們?cè)L問了什么數(shù)據(jù),以及他們的偏好數(shù)據(jù)提供了方法。
這些新數(shù)據(jù)類型中的有些會(huì)讓業(yè)務(wù)分析師感到困惑。專家和多面手都可以為參考和回答問題以及為新數(shù)據(jù)類型的展示和如何對(duì)它們進(jìn)行最佳利用等提供服務(wù)
對(duì)過渡進(jìn)行管理
支持經(jīng)理應(yīng)該找到相對(duì)簡便的方法為他們的員工在過渡上提供幫助。
一些多面手會(huì)在最初服務(wù)于特定的內(nèi)部用戶,以在數(shù)據(jù)需求定義上為他們提供服務(wù)。然后這可以擴(kuò)展到更多的技術(shù)角色上來,包括分析執(zhí)行或是結(jié)果分析等。甚至將多面手轉(zhuǎn)移至業(yè)務(wù)線也是值得考慮的。
很多專家會(huì)繼續(xù)處理技術(shù)相關(guān)的問題,諸如性能和調(diào)優(yōu)。一些會(huì)在高級(jí)分析選項(xiàng),方法和分析新數(shù)據(jù)類型等方面提供內(nèi)部咨詢。管理層必須讓這些專家在工作中保持主動(dòng),否則就要承受他們流失去其他類似企業(yè)的風(fēng)險(xiǎn)。
總結(jié)
基礎(chǔ)架構(gòu)支持團(tuán)隊(duì)成功地經(jīng)受了大數(shù)據(jù)的洗禮,并且最有可能負(fù)責(zé)了許多應(yīng)用程序的成功實(shí)施。但是,這一結(jié)果就導(dǎo)致對(duì)于IT支持人員需求不可避免的減少。
專家和多面手必須通過學(xué)習(xí)內(nèi)部業(yè)務(wù)線和讓他們自己熟悉當(dāng)前的業(yè)務(wù)數(shù)據(jù)需求來擴(kuò)展他們的技能。假設(shè)一個(gè)面向用戶的角色可能是他們僅有的長期職業(yè)生涯選擇。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10