
大數(shù)據(jù)時(shí)代,相關(guān)部門(mén)掌握的數(shù)據(jù)越來(lái)越重要
大數(shù)據(jù)活在“云端”,唯有云計(jì)算能讓大數(shù)據(jù)找到自己的軌跡和存在的真正價(jià)值。但是,大數(shù)據(jù)并不全是飄在天上的浮云,它也需要能源源不斷輸送數(shù)據(jù)的“根”。
那么,大數(shù)據(jù)的“根”在哪里?
共享是大數(shù)據(jù)的“根”
大數(shù)據(jù)與云計(jì)算,或許就像一枚神奇的金幣的正反面,讓許多人感覺(jué)“云里霧里”、亦真亦幻,卻又能真切地感受到金幣的光芒。
什么是大數(shù)據(jù)?按照維基百科的定義,大數(shù)據(jù)是指無(wú)法在可承受時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。它的基本特點(diǎn)可以概括為海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流動(dòng)和動(dòng)態(tài)的數(shù)據(jù)體系、多樣的數(shù)據(jù)類型、巨大的數(shù)據(jù)價(jià)值。如果將單個(gè)或局部領(lǐng)域的數(shù)據(jù)及其挖掘處理視為小數(shù)據(jù),那么關(guān)于某一主體的大數(shù)據(jù)就是由成千上萬(wàn)、相互關(guān)聯(lián)、相互交織的小數(shù)據(jù)匯聚而成的。小數(shù)據(jù)的充分融合,就是大數(shù)據(jù)形成的根基。譬如一滴水,唯有與別的水滴融合在一起,才能形成水流,才能匯成江河、海洋,才能發(fā)揮水的價(jià)值。這種融合就是共享。沒(méi)有小數(shù)據(jù)的共享,就沒(méi)有大數(shù)據(jù)生長(zhǎng)的“根”。
要從海量的數(shù)據(jù)中快速地分析、挖掘出有用的信息,單臺(tái)計(jì)算機(jī)已難以勝任,必須采用分布式架構(gòu),依托云計(jì)算的分布式處理、分布式數(shù)據(jù)和云存儲(chǔ)、虛擬化技術(shù),即透過(guò)網(wǎng)絡(luò)將龐大的計(jì)算處理程序自動(dòng)分拆成無(wú)數(shù)個(gè)較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計(jì)算、分析之后將處理結(jié)果回傳給用戶。這就是與大數(shù)據(jù)相依相存的云計(jì)算。顯然,如果沒(méi)有數(shù)據(jù)的共享,云計(jì)算也是“無(wú)米之炊”。
當(dāng)然,數(shù)據(jù)能否共享,涉及到數(shù)據(jù)的開(kāi)放性、法律邊界、數(shù)據(jù)價(jià)值實(shí)現(xiàn)等問(wèn)題,還面臨諸多現(xiàn)實(shí)障礙。
誰(shuí)阻礙了數(shù)據(jù)共享?
當(dāng)我們沉醉于大數(shù)據(jù)的奇妙與魔法無(wú)邊的時(shí)候,現(xiàn)實(shí)世界卻給了我們一記響亮的耳光——大家沮喪地發(fā)現(xiàn),許多政府公共信息仍處于零散、分割、封閉狀態(tài)。
各級(jí)政府部門(mén)在履職過(guò)程中掌握了大量的數(shù)據(jù)信息,其中涉及企業(yè)或個(gè)人的數(shù)據(jù)最為豐富。目前普遍認(rèn)為比較有用的企業(yè)信息大致包括四個(gè)方面,一是反映企業(yè)基本情況的,二是反映企業(yè)真實(shí)經(jīng)營(yíng)狀況的,三是反映企業(yè)及企業(yè)主資信狀況及守法情況的,四是反映企業(yè)融資、財(cái)產(chǎn)抵質(zhì)押、對(duì)外擔(dān)保等情況的。這些涉及企業(yè)的各種信息資源散落在不同的政府管理部門(mén),總體處于彼此分割、孤立、封閉狀態(tài),沒(méi)有實(shí)現(xiàn)數(shù)據(jù)之間的共享、連接和融合,更談不上大數(shù)據(jù)價(jià)值的體現(xiàn)。
盡管近年來(lái),各級(jí)政府都在積極搭建公共信用信息平臺(tái),推動(dòng)社會(huì)征信體系建設(shè),特別是在相關(guān)文件出臺(tái)后,步伐進(jìn)一步加快,各部門(mén)也大多建立了自身的信息管理系統(tǒng),但部門(mén)之間信息不共享或共享不充分仍是常態(tài)。即使有一些全國(guó)性、地區(qū)性的統(tǒng)一信息平臺(tái),所含企業(yè)信息也非常有限,且不完整、不及時(shí)。
這種信息割裂的狀態(tài),不僅不利于大數(shù)據(jù)的發(fā)展,從眼前看,則對(duì)具體運(yùn)用大數(shù)據(jù)的相關(guān)主體的發(fā)展形成阻礙。比如,銀行業(yè)在服務(wù)實(shí)體經(jīng)濟(jì)特別是小微企業(yè)過(guò)程中,面臨的突出瓶頸之一,就是信息瓶頸。銀行業(yè)開(kāi)展小微企業(yè)信貸業(yè)務(wù)面臨的最大困惑是信息不對(duì)稱。信息的不對(duì)稱使銀行在發(fā)放小微企業(yè)貸款時(shí)難免如履薄冰,顧忌甚多。因此,能否切實(shí)掌握和了解反映企業(yè)真實(shí)經(jīng)營(yíng)狀況、企業(yè)及企業(yè)主資信狀況等相關(guān)信息,在很大程度上決定了銀行對(duì)小微企業(yè)放貸的意愿以及介入小微企業(yè)信貸領(lǐng)域的深度。
目前客觀存在的企業(yè)信息共享“難”,根源在于部門(mén)利益。相關(guān)部門(mén)在參與公共信用信息平臺(tái)建設(shè)時(shí),出于種種原因,往往叫得響、做得少。一些部門(mén)出于商業(yè)利益,將自身所擁有的大量公共信息視為“私有財(cái)產(chǎn)”,以有償作為提供信息的條件;或以維護(hù)商業(yè)秘密、涉及部門(mén)機(jī)密為由,不愿將擁有的、本屬于公共資源的企業(yè)信息與其他部門(mén)共享,或者象征性地扔幾根“骨頭”,人為造成了企業(yè)信息的分割、殘缺,也造就了許多“僵尸”信息平臺(tái);有些信息的共享按說(shuō)不應(yīng)存在障礙,只因?yàn)橐恍?shù)據(jù)擁有的部門(mén)感覺(jué)“吃力不討好”,缺乏主動(dòng)提供數(shù)據(jù)的動(dòng)力。
當(dāng)然,也不排除個(gè)別地方政府從局部利益出發(fā),對(duì)可能影響當(dāng)?shù)仄髽I(yè)發(fā)展的行政處罰類負(fù)面、失信信息的公開(kāi)加以阻擾,影響信息數(shù)據(jù)的共享。深層的原因,則是社會(huì)信用體系建設(shè)法制化步伐緩慢,公共信息征集機(jī)制不健全,對(duì)相關(guān)部門(mén)提供、公開(kāi)相關(guān)政務(wù)信息缺乏有效的約束,以及信用信息使用在公開(kāi)與保密之間的法律邊界不清晰。
小數(shù)據(jù)不能共享,大數(shù)據(jù)必是空談。所以,看大勢(shì)、顧大局、破本位,推進(jìn)小數(shù)據(jù)共享,是政府部門(mén)在大數(shù)據(jù)時(shí)代應(yīng)有的思維。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
在AI滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數(shù)據(jù)之戰(zhàn),CDA認(rèn)證已成為決定企業(yè)存續(xù)的生死線!據(jù)麥肯錫全球研究院數(shù)據(jù)顯示,AI驅(qū) ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無(wú)望、技能過(guò)時(shí)……當(dāng)職場(chǎng)中年危機(jī)與數(shù)字化浪潮正面交鋒,你是否發(fā)現(xiàn): 簡(jiǎn)歷投了10 ...
2025-07-20CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫(xiě)入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開(kāi)發(fā)中,開(kāi)發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14