
大數(shù)據(jù)時代到來:傳統(tǒng)IT架構成掣肘
盡管周圍對大數(shù)據(jù)的好處仍然描繪得多么天花亂墜,但不得不說,當前指導數(shù)據(jù)架構的理念體系其實已經(jīng)過時了。如今大數(shù)據(jù)的情形已在近期發(fā)生了極大的改變。
在如今科技快速發(fā)展的時代,較之以往企業(yè)已經(jīng)能夠以更快的速度和更低的成本來獲取和儲存大量的數(shù)據(jù)。有人甚至認為,科技很快就能讓大數(shù)據(jù)分析變得“像使用Excel一樣容易”。在其他如潮水般涌起的革命性數(shù)據(jù)科學當中,最令人感到興奮的莫過于能夠?qū)崟r掌握消費者和物聯(lián)網(wǎng)的動態(tài),但是,這恐怕容易使得企業(yè)陷于另一種困境。
日本信息通信技術(ICT)企業(yè)美國公司首席信息官尼爾·賈維斯(Neil Jarvis)表示:“企業(yè)已經(jīng)知道他們能夠越來越容易地獲取和儲存大量自身業(yè)務和世界范圍內(nèi)產(chǎn)生的數(shù)據(jù)。而所謂公司的麻煩是指,該如何正確利用這些數(shù)據(jù)——判斷出哪些才是相關的、有用的,哪些是需要過濾掉的。最重要的是,哪些才是有助于推動業(yè)務發(fā)展的?!?/span>
因此,思想轉(zhuǎn)變的第一步應是觀察數(shù)據(jù)的方式。如今數(shù)據(jù)不再是一種靜態(tài)的可支配資源,其意義不再像以往那樣局限于一種單一的目的,而是或許已經(jīng)成為延伸至多種功能用途的數(shù)據(jù)處理了。作為一種可再生資源,其價值的衡量不應是視其底線而定,而是應該將其視為一種不僅能帶來價值增長,而且能夠提供價值增長的機會的資產(chǎn)。數(shù)據(jù)作為商業(yè)的一種原材料也和其他生產(chǎn)的原材料一樣,正是它能夠被應用于各種各樣的領域而使得其價值超越了作為原始產(chǎn)品本身。
以IBM近期對從美國本田汽車公司和太平洋電力公司收集而來的數(shù)據(jù)的應用為例,最初,太平洋煤氣電力公司收集數(shù)據(jù)是為了管理其服務的穩(wěn)定性,而本田收集電動汽車的數(shù)據(jù)是為了提高經(jīng)營效率,但是,IBM則能夠?qū)烧呓ǔ蓴?shù)據(jù)集并整合成一個數(shù)據(jù)系統(tǒng),通過這個系統(tǒng),本田的車主能夠從中掌握何時何地需要為汽車充電的節(jié)奏,能源供應商則能夠?qū)﹄娏ω摵蛇M行相應的調(diào)整。
云計算公司Replicon聯(lián)合創(chuàng)始人兼CEO Raj Narayanaswamy指出:
“今天,每一個行業(yè)和企業(yè)都面臨著將數(shù)據(jù)轉(zhuǎn)化為明確的成果的艱巨任務。數(shù)據(jù)的指數(shù)級增長意味著,每一個組織都極其有必要去建立合適的體系結構來使得數(shù)據(jù)的利用達到最大化。獲得成功的關鍵是建立一個全面的數(shù)據(jù)產(chǎn)業(yè)價值鏈,包括數(shù)據(jù)發(fā)掘、集成和評估,而不是按照傳統(tǒng)的做法部署以應用程序為中心的模式。”
對于一個企業(yè)來說,理解數(shù)據(jù)集成的重要性是創(chuàng)造新的價值的前提。假若對數(shù)據(jù)的理解仍然維持在單一和特定用途的層面,那么在數(shù)據(jù)開發(fā)過程中容易出現(xiàn)缺乏靈活性、信息不全面的情況,在利用數(shù)據(jù)開發(fā)未來機遇方面,組織或?qū)萦诒粍拥木车亍6晒Φ睦拥膭t要數(shù)亞馬遜和Salesforce了,這兩家公司借助策略性的數(shù)據(jù)管理方式而在短期內(nèi)獲得了規(guī)模式的增長。
數(shù)據(jù)應用的周期或許可以劃分為七個步驟:發(fā)現(xiàn)、獲取、加工、帥選、集成、分析和揭露。其中每一個步驟都至關重要,每一個有效用的策略也許都是建立在由上述七個步驟組成的數(shù)據(jù)體系之上的。云計算公司LiasonTechnologies的首席執(zhí)行官Bob Renner對此作出了總結性分析:
“人們大部分的注意力(市場價值觀)都放在了分析和結果量化的最后階段——蘊藏著商務決策的階段。這也確實是數(shù)據(jù)分析在歷經(jīng)萬難之后最終的價值所在。但是,沒有了前面的準備步驟,我們也不可能一步登天地就能在最后一步獲得想要的結果。事實上,在開始使用分析算法來對數(shù)據(jù)進行解讀之前,數(shù)據(jù)科學家都要花費大量的時間進行數(shù)據(jù)清理,以保證數(shù)據(jù)的質(zhì)量。”
良好的數(shù)據(jù)科學離不開高質(zhì)量的數(shù)據(jù)資料和管控數(shù)據(jù)質(zhì)量的必要步驟,尤其是往往遭到忽視的數(shù)據(jù)集成。通常來說,有價值的大數(shù)據(jù)都是在這一個步驟里發(fā)現(xiàn)的。如果組織在一開始就以另一種心態(tài)(非如今固化的理念)來著手數(shù)據(jù)管理,他們就能夠在控制成本和效用上掌握主動權。
大數(shù)據(jù)需要一個獨特的基礎,正如數(shù)據(jù)分析公司Green House Data的首席技術官科特妮·湯普森(Cortney Thompson)所言:“大數(shù)據(jù)可能意味著你需要大幅修正自家的IT基礎設施,傳統(tǒng)IT的配置并不能支持大數(shù)據(jù)。”據(jù)悉,有些公司會為了實現(xiàn)質(zhì)的飛躍而新任命一名數(shù)字業(yè)務總監(jiān)。而一個優(yōu)秀的數(shù)字業(yè)務經(jīng)理需要知道如何確保將那些非結構化的數(shù)據(jù)轉(zhuǎn)化為可操作的信息材料。
那么,我們將如何可以從當前宣傳大于實用的狀況中獲得突破呢?首先,如前文所述,充分理解大數(shù)據(jù)應用完整的操作周期,做到不忽視任何一個步驟的重要性,然后從傳統(tǒng)的以應用為中心的傳統(tǒng)思想中解放出來,建立靈活的、可持續(xù)利用的數(shù)據(jù)分析框架?!皵?shù)據(jù)驅(qū)動的發(fā)現(xiàn)從根本上改變了我們工作和生活的方式,而那些掌握了大數(shù)據(jù)應用的人可以說是掌握了一項和同齡人競爭的優(yōu)勢?!保ā洞蠼灰?市場回報最大化的簡單策略》彼得·范)
那些在大數(shù)據(jù)技術迸發(fā)時期就獲得了巨大利益價值的組織,他們不僅關注那些外界一直在炒作的功能,而且對想要實現(xiàn)的營收、利潤以及其他業(yè)務成果都投入了認真的思考。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10