
大數(shù)據(jù)思維下的統(tǒng)計新變革
日前,谷歌宣布其云計算平臺通過大數(shù)據(jù)分析準確地預測了巴西世界杯8強。據(jù)了解,谷歌云計算平臺使用了英國體育數(shù)據(jù)提供商Opta Sports的數(shù)據(jù),評估了全球每個職業(yè)足球聯(lián)盟過去多個賽季的情況,以及巴西世界杯小組賽期間的統(tǒng)計數(shù)據(jù)。于是乎,大數(shù)據(jù)再度成為輿論關注的焦點,對于其應用價值的討論更加熱烈。
然而,我們發(fā)現(xiàn),即使以谷歌強大的技術實力,也不得不從英國體育數(shù)據(jù)提供商Opta Sports那里獲取數(shù)據(jù)。也就是說,數(shù)據(jù)的采集并不是谷歌的優(yōu)勢,大數(shù)據(jù)產(chǎn)業(yè)走向商用和規(guī)?;l(fā)展,更多的要依賴Opta Sports這樣的數(shù)據(jù)采集者。從這個角度看,作為最具共識性和采集能力的統(tǒng)計部門,無疑將是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展壯大的基礎。反過來看,從大數(shù)據(jù)發(fā)展的趨勢看統(tǒng)計行業(yè)的發(fā)展方向,也必然全面應用大數(shù)據(jù)思維。我們注意到,從國家統(tǒng)計局局長馬建堂在2012年年底提出“統(tǒng)計部門要擁抱大數(shù)據(jù)時代”,到不久前國家統(tǒng)計局在廈門建立首個大數(shù)據(jù)基地,可以斷言,統(tǒng)計行業(yè)的大數(shù)據(jù)變革已經(jīng)到來。
2013年11月,國家統(tǒng)計局與百度、阿里巴巴等11家企業(yè)簽訂了大數(shù)據(jù)戰(zhàn)略合作框架協(xié)議。此舉目的在于共同推進大數(shù)據(jù)在政府統(tǒng)計中的應用,不斷增強政府統(tǒng)計的科學性和及時性。馬建堂在協(xié)議簽訂時表示:“現(xiàn)在許多發(fā)達國家紛紛將大數(shù)據(jù)利用提升到國家戰(zhàn)略層面,我們也要適應這一大勢,將大數(shù)據(jù)視為國家戰(zhàn)略資源,主動擁抱大數(shù)據(jù)時代,積極搶抓機遇、應對挑戰(zhàn)?!睌?shù)據(jù)與統(tǒng)計是一對共生詞,而數(shù)據(jù)成為生產(chǎn)要素的前提條件也是有效的梳理與歸類,這恰恰是統(tǒng)計的內(nèi)容。馬建堂說,大數(shù)據(jù)為政府統(tǒng)計提供了總體性、非結構化、豐富真實的原始資料,可以極大地縮短數(shù)據(jù)采集時間,減少報表填報任務,減輕調查對象負擔,提高統(tǒng)計數(shù)據(jù)質量。
一場統(tǒng)計方式和方法的變革正在醞釀。企業(yè)既是大數(shù)據(jù)的主要生產(chǎn)者,也是經(jīng)驗豐富的使用者,還是大數(shù)據(jù)的直接受益者,有數(shù)據(jù)的資源、有應用的技術、有市場的機制。而國家統(tǒng)計局作為組織領導和協(xié)調全國統(tǒng)計工作的主管部門,具有統(tǒng)計制度和標準制定,統(tǒng)計數(shù)據(jù)搜集、發(fā)布、分析等方面的優(yōu)勢。
統(tǒng)計數(shù)據(jù)是各級領導作出科學決策的重要支撐。隨著企業(yè)一套表建設的基本完成,各行各業(yè)的數(shù)據(jù)被采集上來,這只是第一步,用好這些數(shù)據(jù)是關鍵。企業(yè)一套表只是一個業(yè)務系統(tǒng),更重要的是在這套系統(tǒng)上幫助統(tǒng)計部門搭建一套數(shù)據(jù)資源體系,通過這套體系來對數(shù)據(jù)進行規(guī)劃、整理和加工,建設監(jiān)測評價中心、輔助決策中心,這也是統(tǒng)計行業(yè)未來發(fā)展的必然趨勢。
現(xiàn)在一些地方統(tǒng)計局已經(jīng)開始做統(tǒng)計方面的規(guī)劃和使用。例如原來的統(tǒng)計工作主要是查詢,現(xiàn)在希望除了查詢、檢索、展示之外還具備監(jiān)測、評價的功能。監(jiān)測評價需要標準,在政府部門這個標準就是政策。監(jiān)測是對企業(yè)、家庭等對象進行調查,數(shù)據(jù)上傳之后經(jīng)過計算、加工等與初定的指標相比較,并對監(jiān)測結果進行評價,發(fā)現(xiàn)問題及時預警、報警。輔助決策則更需要智能化,當發(fā)現(xiàn)監(jiān)測評價出的結果與初定指標存在較大差異時,就要追本溯源,為領導提供準確的問題分析報告,列出導致問題的主要原因,提出可行性建議,為領導提供輔助決策,為其做出下一個階段的判斷和調整提供幫助。例如,自去年以來,浙江溫州市統(tǒng)計局建立了GDP聯(lián)席會議制度,按季度召集30多個部門進行分析論證部門數(shù)據(jù)與GDP數(shù)據(jù)之間的關系,特別是充分運用電力、銀行、交通、財政、外貿(mào)等部門數(shù)據(jù),以及對GDP數(shù)據(jù)的影響,使GDP數(shù)據(jù)更加科學可靠。今年進一步擴大了GDP聯(lián)席會議職能,把涉及部門的經(jīng)濟、社會、民生等監(jiān)測評價數(shù)據(jù)進行綜合審查分析,進一步提高統(tǒng)計數(shù)據(jù)質量。
與此同時,統(tǒng)計行業(yè)的大數(shù)據(jù)變革,也將為大數(shù)據(jù)產(chǎn)業(yè)的下一步發(fā)展打造堅實的基礎。從企業(yè)一套表到電子終端采集數(shù)據(jù),中國統(tǒng)計的技術和制度改革近兩年不斷深入,而與大數(shù)據(jù)概念的交匯與融合也將助推中國官方數(shù)據(jù)更加真實全面。統(tǒng)計部門在人口、農(nóng)業(yè)、投資、交通等領域,大力研究利用遙感RS、地理信息系統(tǒng)GIS、全球定位系統(tǒng)GPS為代表的空間信息技術和物聯(lián)網(wǎng)技術,既極大提升了統(tǒng)計信息化水平,也為進一步推進大數(shù)據(jù)的統(tǒng)計應用打下了較好的基礎。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11