
傳統(tǒng)IT架構OUT了!大數據時代需新思維(1)
盡管周圍對大數據的好處仍然描繪得多么天花亂墜,但不得不說,當前指導數據架構的理念體系其實已經過時了。如今大數據的情形已在近期發(fā)生了極大的改變。
在如今科技快速發(fā)展的時代,較之以往企業(yè)已經能夠以更快的速度和更低的成本來獲取和儲存大量的數據。有人甚至認為,科技很快就能讓大數據分析變得“像使用Excel一樣容易”。在其他如潮水般涌起的革命性數據科學當中,最令人感到興奮的莫過于能夠實時掌握消費者和物聯網的動態(tài),但是,這恐怕容易使得企業(yè)陷于另一種困境。
日本信息通信技術(ICT)企業(yè)美國公司首席信息官尼爾·賈維斯(Neil Jarvis)表示:“企業(yè)已經知道他們能夠越來越容易地獲取和儲存大量自身業(yè)務和世界范圍內產生的數據。而所謂公司的麻煩是指,該如何正確利用這些數據——判斷出哪些才是相關的、有用的,哪些是需要過濾掉的。最重要的是,哪些才是有助于推動業(yè)務發(fā)展的?!?/span>
因此,思想轉變的第一步應是觀察數據的方式。如今數據不再是一種靜態(tài)的可支配資源,其意義不再像以往那樣局限于一種單一的目的,而是或許已經成為延伸至多種功能用途的數據處理了。作為一種可再生資源,其價值的衡量不應是視其底線而定,而是應該將其視為一種不僅能帶來價值增長,而且能夠提供價值增長的機會的資產。數據作為商業(yè)的一種原材料也和其他生產的原材料一樣,正是它能夠被應用于各種各樣的領域而使得其價值超越了作為原始產品本身。
以IBM近期對從美國本田汽車公司和太平洋電力公司收集而來的數據的應用為例,最初,太平洋煤氣電力公司收集數據是為了管理其服務的穩(wěn)定性,而本田收集電動汽車的數據是為了提高經營效率,但是,IBM則能夠將兩者建成數據集并整合成一個數據系統(tǒng),通過這個系統(tǒng),本田的車主能夠從中掌握何時何地需要為汽車充電的節(jié)奏,能源供應商則能夠對電力負荷進行相應的調整。
云計算公司Replicon聯合創(chuàng)始人兼CEO Raj Narayanaswamy指出:
“今天,每一個行業(yè)和企業(yè)都面臨著將數據轉化為明確的成果的艱巨任務。數據的指數級增長意味著,每一個組織都極其有必要去建立合適的體系結構來使得數據的利用達到最大化。獲得成功的關鍵是建立一個全面的數據產業(yè)價值鏈,包括數據發(fā)掘、集成和評估,而不是按照傳統(tǒng)的做法部署以應用程序為中心的模式?!?/span>
對于一個企業(yè)來說,理解數據集成的重要性是創(chuàng)造新的價值的前提。假若對數據的理解仍然維持在單一和特定用途的層面,那么在數據開發(fā)過程中容易出現缺乏靈活性、信息不全面的情況,在利用數據開發(fā)未來機遇方面,組織或將會陷于被動的境地。而成功的例子的則要數亞馬遜和Salesforce了,這兩家公司借助策略性的數據管理方式而在短期內獲得了規(guī)模式的增長。
數據應用的周期或許可以劃分為七個步驟:發(fā)現、獲取、加工、帥選、集成、分析和揭露。其中每一個步驟都至關重要,每一個有效用的策略也許都是建立在由上述七個步驟組成的數據體系之上的。云計算公司LiasonTechnologies的首席執(zhí)行官Bob Renner對此作出了總結性分析:
“人們大部分的注意力(市場價值觀)都放在了分析和結果量化的最后階段——蘊藏著商務決策的階段。這也確實是數據分析在歷經萬難之后最終的價值所在。但是,沒有了前面的準備步驟,我們也不可能一步登天地就能在最后一步獲得想要的結果。事實上,在開始使用分析算法來對數據進行解讀之前,數據科學家都要花費大量的時間進行數據清理,以保證數據的質量。”
良好的數據科學離不開高質量的數據資料和管控數據質量的必要步驟,尤其是往往遭到忽視的數據集成。通常來說,有價值的大數據都是在這一個步驟里發(fā)現的。如果組織在一開始就以另一種心態(tài)(非如今固化的理念)來著手數據管理,他們就能夠在控制成本和效用上掌握主動權。
大數據需要一個獨特的基礎,正如數據分析公司Green House Data的首席技術官科特妮·湯普森(Cortney Thompson)所言:“大數據可能意味著你需要大幅修正自家的IT基礎設施,傳統(tǒng)IT的配置并不能支持大數據?!睋ぃ行┕緯榱藢崿F質的飛躍而新任命一名數字業(yè)務總監(jiān)。而一個優(yōu)秀的數字業(yè)務經理需要知道如何確保將那些非結構化的數據轉化為可操作的信息材料。
那么,我們將如何可以從當前宣傳大于實用的狀況中獲得突破呢?首先,如前文所述,充分理解大數據應用完整的操作周期,做到不忽視任何一個步驟的重要性,然后從傳統(tǒng)的以應用為中心的傳統(tǒng)思想中解放出來,建立靈活的、可持續(xù)利用的數據分析框架?!皵祿寗拥陌l(fā)現從根本上改變了我們工作和生活的方式,而那些掌握了大數據應用的人可以說是掌握了一項和同齡人競爭的優(yōu)勢?!?/span>
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10