
數(shù)據(jù)資源體系讓大數(shù)據(jù)發(fā)揮大價值
大數(shù)據(jù)的時代已經(jīng)到來,并且大數(shù)據(jù)在未來的時間內(nèi)將影響著政府、企業(yè)以及個人的工作與生活,在此環(huán)境下,數(shù)據(jù)將成為與人財物比肩的資源,面對如此寶貴的財富,如何讓大數(shù)據(jù)發(fā)揮大價值已經(jīng)成為政府、企業(yè)以及信息化廠商急需解決的問題,同方在國內(nèi)率先提出數(shù)據(jù)資源體系的概念,通過數(shù)據(jù)資源體系讓大數(shù)據(jù)發(fā)揮大價值。
如何發(fā)揮數(shù)據(jù)的價值 眾所周知,大數(shù)據(jù)的時代已經(jīng)到來,在大數(shù)據(jù)時代,數(shù)據(jù)的存儲也好、數(shù)據(jù)的整合加工、分析挖掘也罷,都是為了使用數(shù)據(jù),讓數(shù)據(jù)發(fā)揮最大價值,現(xiàn)階段在政府機關及企業(yè)中對數(shù)據(jù)進行挖掘分析讓其發(fā)揮最大價值的方法主要有兩種,一種是信息化程度較高,技術實力較強的政府機關或企業(yè),通過自有的技術讓數(shù)據(jù)發(fā)揮最大的價值,典型的代表如國外的沃爾瑪、亞馬遜、谷歌等公司,國內(nèi)的阿里巴巴、百度等公司,這些公司在數(shù)據(jù)存儲、整合加工、分析挖掘及應用方面有業(yè)內(nèi)較好且領先的技術,但是所具有的技術都是為了滿足自身業(yè)務發(fā)展的需要而開發(fā)設計,不對外公布;另一種是采用市場中主流的一些數(shù)據(jù)挖掘工具、數(shù)據(jù)分析工具、商業(yè)智能工具對已有的數(shù)據(jù)進行相關的挖掘、分析,讓其產(chǎn)生價值,采用此類方法進行數(shù)據(jù)整合加工、分析挖掘的用戶,可以達到初步的數(shù)據(jù)分析要求,但是由于其涉及的數(shù)據(jù)量巨大、數(shù)據(jù)種類眾多、數(shù)據(jù)結構復雜、數(shù)據(jù)之間相互獨立缺少關聯(lián)關系、數(shù)據(jù)覆蓋的業(yè)務面較廣,僅是通過一些數(shù)據(jù)分析挖掘工具很難讓已有數(shù)據(jù)發(fā)揮其最大價值。
因此,讓大數(shù)據(jù)發(fā)揮最大價值,不僅要采用數(shù)據(jù)分析挖掘等相關工具,更重要的是從數(shù)據(jù)的本質(zhì)和數(shù)據(jù)所描述的業(yè)務出發(fā),規(guī)劃和整理數(shù)據(jù),建立起數(shù)據(jù)之間相互的關聯(lián)關系,并體系化對數(shù)據(jù)進行管理,才有可能讓數(shù)據(jù)源源不斷的、最大化的發(fā)揮其價值。 同方在大數(shù)據(jù)領域率先提出了數(shù)據(jù)資源體系的概念,數(shù)據(jù)資源體系的形成是對數(shù)據(jù)進行規(guī)劃設計,圍繞用戶的核心目標,采用頂層設計的方法對核心目標進行層層的分解,形成可落實各層級目標的指標體系,并且以指標體系為基礎,形成可描述業(yè)務、存儲數(shù)據(jù)、描述數(shù)據(jù)的元數(shù)據(jù)體系,并且以元數(shù)據(jù)體系為指導,形成一套即可以滿足用戶各層級的應用需求,又能夠讓數(shù)據(jù)源源不斷、最大化發(fā)揮價值的數(shù)據(jù)資源體系。 數(shù)據(jù)資源體系的形成,首先要對數(shù)據(jù)進行資源化,然后將數(shù)據(jù)資源進行體系化管理,下面將對數(shù)據(jù)資源體系的形成進行詳細分析。
如何讓數(shù)據(jù)“資源化” 首先,數(shù)據(jù)是資源,是可以與人、財、物比肩的資源,更進一步數(shù)據(jù)已形成與石油、煤炭等相當?shù)膽?zhàn)略資源,與其他資源相同,數(shù)據(jù)也需要采用科學的方法進行開采、挖掘才可能發(fā)揮出其應有的價值,與其他資源不同的是,數(shù)據(jù)是可再生、可重復利用的資源,并且只要通過科學的方法和技術對數(shù)據(jù)進行挖掘,就可以讓數(shù)據(jù)源源不斷的發(fā)揮他的價值。中國的信息化產(chǎn)業(yè)經(jīng)過近幾十年的發(fā)展,在各行業(yè)、各領域已經(jīng)積累了大量的數(shù)據(jù),據(jù)有關機構調(diào)查,這些已經(jīng)產(chǎn)生的數(shù)據(jù)中95%以上的數(shù)據(jù)都存放在各自的存儲設備或硬盤中,自產(chǎn)生之后就沒有經(jīng)過任何使用,一直屬于沉睡狀態(tài),因此,這些數(shù)據(jù)也就不產(chǎn)生任何價值,也就不能稱之為資源。對于此類數(shù)據(jù)如不能讓其成為資源,并發(fā)揮價值,對于數(shù)據(jù)的擁有者來說,數(shù)據(jù)的存儲與維護將會無止境的投入,這些無價值的投入將會給數(shù)據(jù)的擁有者帶來巨大的負擔,而這個負擔又不能丟棄,必須由數(shù)據(jù)擁有者來承擔,因為這些數(shù)據(jù)的擁有者始終認為,這些數(shù)據(jù)是其擁有的具有無限價值的資源,如何喚醒這些沉睡中的數(shù)據(jù),并讓其真正意義上成為資源是現(xiàn)階段各行業(yè)、各領域的數(shù)據(jù)擁有者都在思考,并力爭解決的問題。
對于以上問題的解決,首先需要將沉睡的數(shù)據(jù)喚醒,也就是將數(shù)據(jù)進行資源化,讓其真正意義上成為數(shù)據(jù)資源,并將所形成的數(shù)據(jù)資源進行體系化管理,最終形成數(shù)據(jù)資源體系。分析以上問題,數(shù)據(jù)不能形成資源,不能發(fā)揮其價值的原因主要有以下兩點: 第一、已經(jīng)存在的數(shù)據(jù)相互獨立,沒有建立相互的關聯(lián)關系,而數(shù)據(jù)價值的產(chǎn)生往往需要從多維度、多角度分析相關數(shù)據(jù)才可能會挖掘出其價值; 第二、數(shù)據(jù)的存儲與使用缺乏統(tǒng)一的規(guī)劃設計,已有的數(shù)據(jù)大多數(shù)來源于是已經(jīng)建立的各類業(yè)務系統(tǒng),而各業(yè)務系統(tǒng)都是為了滿足各自業(yè)務板塊的需要而建立,缺乏統(tǒng)一的規(guī)劃和設計,因此,對于已有數(shù)據(jù)的存儲和使用以及新生數(shù)據(jù)的存儲和使用缺乏統(tǒng)一的規(guī)劃和設計。
因此,將數(shù)據(jù)形成數(shù)據(jù)資源主要需要解決以上兩個問題,對于數(shù)據(jù)的統(tǒng)一規(guī)劃和設計同方采用頂層設計的方法,從用戶的核心目標出發(fā),站在全局的角度規(guī)劃和設計數(shù)據(jù)采集、存儲、整合加工、分析挖掘及應用等方面的標準和規(guī)則,并通過頂層設計的方法將核心目標自頂向下進行層層分解,分解為一系列具體的工作目標和工作任務,層層貫徹實施,并通過工作部署、跟蹤、監(jiān)測、評價、調(diào)整、反饋等一系列手段和措施,確保各項工作與核心目標保持一致,并且將已經(jīng)產(chǎn)生或以后產(chǎn)生的數(shù)據(jù)規(guī)劃到各層級目標及任務中,在此過程中,將納入到規(guī)劃體系內(nèi)的數(shù)據(jù)通過指標和元數(shù)據(jù)的方法進行描述,將數(shù)據(jù)分解為“細粒度的數(shù)據(jù)元素+相對粗粒度的數(shù)據(jù)集及其組織結構描述”,把數(shù)據(jù)元素(最小的不可再分的信息單元)做為數(shù)據(jù)資源的最小描述與管理單位,基于各種數(shù)據(jù)元素的按需組合形成面向?qū)嶋H業(yè)務、管理、服務需要的數(shù)據(jù)集并對數(shù)據(jù)集的構成形式和組織關系提供統(tǒng)一規(guī)范的描述形式,形成粗粒度的資源管理單元,再把數(shù)據(jù)元素和數(shù)據(jù)集用資源管理的手段和方法組織在一起,實現(xiàn)數(shù)據(jù)的資源化。 如何讓數(shù)據(jù)資源體系化 數(shù)據(jù)要發(fā)揮價值,首先是將數(shù)據(jù)形成資源,對于已經(jīng)形成的數(shù)據(jù)資源只有通過科學的技術和方法進行管理和使用才可以不斷的發(fā)揮數(shù)據(jù)資源的價值,在此過程中對于數(shù)據(jù)資源的不斷使用,需要一個科學合理的管理和保障體系做支撐,才能讓數(shù)據(jù)資源源源不斷的發(fā)揮最大價值,因此需要將已形成的數(shù)據(jù)資源進行體系化管理,從而形成數(shù)據(jù)資源體系。
讓數(shù)據(jù)資源體系化,首先對于體系的規(guī)劃設計也要采用頂層設計的方法,圍繞著組織的核心目標,將已經(jīng)形成的數(shù)據(jù)資源進行規(guī)劃和設計,將已經(jīng)通過指標與元數(shù)據(jù)描述的數(shù)據(jù)資源按照統(tǒng)一的規(guī)劃設計形成指標體系,并以指標體系為基礎形成元數(shù)據(jù)體系,以指標體系、元數(shù)據(jù)體系為指導逐步完成數(shù)據(jù)的采集、整合加工、綜合應用、共享發(fā)布、信息服務與推送等一系列數(shù)據(jù)資源生產(chǎn)的流程,從而將整個過程形成一套完整的體系,即數(shù)據(jù)資源體系。 數(shù)據(jù)資源體系讓數(shù)據(jù)發(fā)揮價值 在形成的數(shù)據(jù)資源體系中,擴展是全方位的,指標可以通過擴充其屬性來不斷完善,并可以通過資源管理手段進行擴充和增加,以此支持數(shù)據(jù)元素級別的資源增長;而數(shù)據(jù)集更是可以隨時按需創(chuàng)建,只要數(shù)據(jù)元素足夠全面,針對每一業(yè)務需要都可以創(chuàng)建一個特定的數(shù)據(jù)集來全面支撐,這樣就可以最大程度的滿足各種不同的數(shù)據(jù)層面需求,從而最大程度發(fā)揮數(shù)據(jù)的價值。
小結 大數(shù)據(jù)時代已經(jīng)來臨,政府機關及企事業(yè)單位對于數(shù)據(jù)價值挖掘的需求也越來越多,發(fā)揮數(shù)據(jù)的價值,不僅僅是使用數(shù)據(jù)分析挖掘工具,更應該從對數(shù)據(jù)的規(guī)劃設計做起,通過數(shù)據(jù)資源體系為數(shù)據(jù)源源不斷發(fā)揮其最大價值打好最結實的基礎,最終讓大數(shù)據(jù)發(fā)揮數(shù)據(jù)的最大價值。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03