
大數(shù)據(jù)時(shí)代到來(lái) 傳統(tǒng)IT架構(gòu)成掣肘
盡管周圍對(duì)大數(shù)據(jù)的好處仍然描繪得多么天花亂墜,但不得不說,當(dāng)前指導(dǎo)數(shù)據(jù)架構(gòu)的理念體系其實(shí)已經(jīng)過時(shí)了。如今大數(shù)據(jù)的情形已在近期發(fā)生了極大的改變。
在如今科技快速發(fā)展的時(shí)代,較之以往企業(yè)已經(jīng)能夠以更快的速度和更低的成本來(lái)獲取和儲(chǔ)存大量的數(shù)據(jù)。有人甚至認(rèn)為,科技很快就能讓大數(shù)據(jù)分析變得“像使用Excel一樣容易”。在其他如潮水般涌起的革命性數(shù)據(jù)科學(xué)當(dāng)中,最令人感到興奮的莫過于能夠?qū)崟r(shí)掌握消費(fèi)者和物聯(lián)網(wǎng)的動(dòng)態(tài),但是,這恐怕容易使得企業(yè)陷于另一種困境。
日本信息通信技術(shù)(ICT)企業(yè)美國(guó)公司首席信息官尼爾·賈維斯(Neil Jarvis)表示:“企業(yè)已經(jīng)知道他們能夠越來(lái)越容易地獲取和儲(chǔ)存大量自身業(yè)務(wù)和世界范圍內(nèi)產(chǎn)生的數(shù)據(jù)。而所謂公司的麻煩是指,該如何正確利用這些數(shù)據(jù)——判斷出哪些才是相關(guān)的、有用的,哪些是需要過濾掉的。最重要的是,哪些才是有助于推動(dòng)業(yè)務(wù)發(fā)展的。”
因此,思想轉(zhuǎn)變的第一步應(yīng)是觀察數(shù)據(jù)的方式。如今數(shù)據(jù)不再是一種靜態(tài)的可支配資源,其意義不再像以往那樣局限于一種單一的目的,而是或許已經(jīng)成為延伸至多種功能用途的數(shù)據(jù)處理了。作為一種可再生資源,其價(jià)值的衡量不應(yīng)是視其底線而定,而是應(yīng)該將其視為一種不僅能帶來(lái)價(jià)值增長(zhǎng),而且能夠提供價(jià)值增長(zhǎng)的機(jī)會(huì)的資產(chǎn)。數(shù)據(jù)作為商業(yè)的一種原材料也和其他生產(chǎn)的原材料一樣,正是它能夠被應(yīng)用于各種各樣的領(lǐng)域而使得其價(jià)值超越了作為原始產(chǎn)品本身。
以IBM近期對(duì)從美國(guó)本田汽車公司和太平洋電力公司收集而來(lái)的數(shù)據(jù)的應(yīng)用為例,最初,太平洋煤氣電力公司收集數(shù)據(jù)是為了管理其服務(wù)的穩(wěn)定性,而本田收集電動(dòng)汽車的數(shù)據(jù)是為了提高經(jīng)營(yíng)效率,但是,IBM則能夠?qū)烧呓ǔ蓴?shù)據(jù)集并整合成一個(gè)數(shù)據(jù)系統(tǒng),通過這個(gè)系統(tǒng),本田的車主能夠從中掌握何時(shí)何地需要為汽車充電的節(jié)奏,能源供應(yīng)商則能夠?qū)﹄娏ω?fù)荷進(jìn)行相應(yīng)的調(diào)整。
云計(jì)算公司Replicon聯(lián)合創(chuàng)始人兼CEO Raj Narayanaswamy指出:
“今天,每一個(gè)行業(yè)和企業(yè)都面臨著將數(shù)據(jù)轉(zhuǎn)化為明確的成果的艱巨任務(wù)。數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)意味著,每一個(gè)組織都極其有必要去建立合適的體系結(jié)構(gòu)來(lái)使得數(shù)據(jù)的利用達(dá)到最大化。獲得成功的關(guān)鍵是建立一個(gè)全面的數(shù)據(jù)產(chǎn)業(yè)價(jià)值鏈,包括數(shù)據(jù)發(fā)掘、集成和評(píng)估,而不是按照傳統(tǒng)的做法部署以應(yīng)用程序?yàn)橹行牡哪J?。?/span>
對(duì)于一個(gè)企業(yè)來(lái)說,理解數(shù)據(jù)集成的重要性是創(chuàng)造新的價(jià)值的前提。假若對(duì)數(shù)據(jù)的理解仍然維持在單一和特定用途的層面,那么在數(shù)據(jù)開發(fā)過程中容易出現(xiàn)缺乏靈活性、信息不全面的情況,在利用數(shù)據(jù)開發(fā)未來(lái)機(jī)遇方面,組織或?qū)?huì)陷于被動(dòng)的境地。而成功的例子的則要數(shù)亞馬遜和Salesforce了,這兩家公司借助策略性的數(shù)據(jù)管理方式而在短期內(nèi)獲得了規(guī)模式的增長(zhǎng)。
數(shù)據(jù)應(yīng)用的周期或許可以劃分為七個(gè)步驟:發(fā)現(xiàn)、獲取、加工、帥選、集成、分析和揭露。其中每一個(gè)步驟都至關(guān)重要,每一個(gè)有效用的策略也許都是建立在由上述七個(gè)步驟組成的數(shù)據(jù)體系之上的。云計(jì)算公司LiasonTechnologies的首席執(zhí)行官Bob Renner對(duì)此作出了總結(jié)性分析:
“人們大部分的注意力(市場(chǎng)價(jià)值觀)都放在了分析和結(jié)果量化的最后階段——蘊(yùn)藏著商務(wù)決策的階段。這也確實(shí)是數(shù)據(jù)分析在歷經(jīng)萬(wàn)難之后最終的價(jià)值所在。但是,沒有了前面的準(zhǔn)備步驟,我們也不可能一步登天地就能在最后一步獲得想要的結(jié)果。事實(shí)上,在開始使用分析算法來(lái)對(duì)數(shù)據(jù)進(jìn)行解讀之前,數(shù)據(jù)科學(xué)家都要花費(fèi)大量的時(shí)間進(jìn)行數(shù)據(jù)清理,以保證數(shù)據(jù)的質(zhì)量?!?/span>
良好的數(shù)據(jù)科學(xué)離不開高質(zhì)量的數(shù)據(jù)資料和管控?cái)?shù)據(jù)質(zhì)量的必要步驟,尤其是往往遭到忽視的數(shù)據(jù)集成。通常來(lái)說,有價(jià)值的大數(shù)據(jù)都是在這一個(gè)步驟里發(fā)現(xiàn)的。如果組織在一開始就以另一種心態(tài)(非如今固化的理念)來(lái)著手?jǐn)?shù)據(jù)管理,他們就能夠在控制成本和效用上掌握主動(dòng)權(quán)。
大數(shù)據(jù)需要一個(gè)獨(dú)特的基礎(chǔ),正如數(shù)據(jù)分析公司Green House Data的首席技術(shù)官科特妮·湯普森(Cortney Thompson)所言:“大數(shù)據(jù)可能意味著你需要大幅修正自家的IT基礎(chǔ)設(shè)施,傳統(tǒng)IT的配置并不能支持大數(shù)據(jù)?!睋?jù)悉,有些公司會(huì)為了實(shí)現(xiàn)質(zhì)的飛躍而新任命一名數(shù)字業(yè)務(wù)總監(jiān)。而一個(gè)優(yōu)秀的數(shù)字業(yè)務(wù)經(jīng)理需要知道如何確保將那些非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為可操作的信息材料。
那么,我們將如何可以從當(dāng)前宣傳大于實(shí)用的狀況中獲得突破呢?首先,如前文所述,充分理解大數(shù)據(jù)應(yīng)用完整的操作周期,做到不忽視任何一個(gè)步驟的重要性,然后從傳統(tǒng)的以應(yīng)用為中心的傳統(tǒng)思想中解放出來(lái),建立靈活的、可持續(xù)利用的數(shù)據(jù)分析框架。“數(shù)據(jù)驅(qū)動(dòng)的發(fā)現(xiàn)從根本上改變了我們工作和生活的方式,而那些掌握了大數(shù)據(jù)應(yīng)用的人可以說是掌握了一項(xiàng)和同齡人競(jìng)爭(zhēng)的優(yōu)勢(shì)?!保ā洞蠼灰?市場(chǎng)回報(bào)最大化的簡(jiǎn)單策略》 彼得·范)
那些在大數(shù)據(jù)技術(shù)迸發(fā)時(shí)期就獲得了巨大利益價(jià)值的組織,他們不僅關(guān)注那些外界一直在炒作的功能,而且對(duì)想要實(shí)現(xiàn)的營(yíng)收、利潤(rùn)以及其他業(yè)務(wù)成果都投入了認(rèn)真的思考
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10