
大數(shù)據(jù)時代,我們該如何做研究
大數(shù)據(jù)時代已來,這一判斷已成為共識。在談到大數(shù)據(jù)的時候,哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程?!焙翢o疑問,大數(shù)據(jù)概念很熱,甚至有些過時了。但相比大數(shù)據(jù)概念熱,學術領域對大數(shù)據(jù)的直接研究和發(fā)表并不多。雖然以大數(shù)據(jù)為主題的文章非常多,但其中很多都是背景、趨勢、挑戰(zhàn)、教育教學類文章。
例如,“大數(shù)據(jù)時代”出現(xiàn)在論文標題多達10907篇;“大數(shù)據(jù)背景”出現(xiàn)在論文標題中多達3644篇;“大數(shù)據(jù)挑戰(zhàn)”出現(xiàn)在論文標題中有1243篇。這說明各學科都意識到了大數(shù)據(jù)對學科發(fā)展的影響,開始從外圍來探討大數(shù)據(jù)的影響。然而,如果只談大數(shù)據(jù)的影響,是遠遠不夠的。社會科學研究者應走入大數(shù)據(jù)研究的內核,探究如何針對大數(shù)據(jù)本身進行研究,進而理解更加復雜多元的社會行為與社會現(xiàn)象。
隨著互聯(lián)網(wǎng)及智能設備的普及以及大數(shù)據(jù)概念的提出,越來越多的非抽樣調查數(shù)據(jù)開始進入社會科學研究者的視野;對文本、歷史典籍、圖像、音頻等傳統(tǒng)上通過定性方式進行分析的領域也開始越來越多地采用量化分析手段;對地理空間、關系網(wǎng)絡、社會結構、生命歷程等非線性內生因素的量化考量也開始提上日程。這些新的數(shù)據(jù)結構、數(shù)據(jù)規(guī)模以及建模形式一方面對傳統(tǒng)社會科學量化分析手段構成挑戰(zhàn),另一方面也進一步豐富了社會科學研究的范疇。很多從事傳統(tǒng)量化研究的學者驚呼:小數(shù)據(jù)還沒玩好,大數(shù)據(jù)就來了!是的,不是我不明白,是這世界變化快。
第四種研究范式,
大數(shù)據(jù)研究帶來了什么?
大數(shù)據(jù)研究也被學者稱為“第四種研究范式”,對傳統(tǒng)的社會科學定性和量化研究范式提出了挑戰(zhàn),也帶來了融合與交叉。
對定性研究而言,大數(shù)據(jù)分析方法使得原來的定性研究資料可以采用定量研究的方法進行研究,并對定性研究結果進行修正或補充;定量研究重新審視“描述”“敘事”“話語”等在定量分析中的地位,收集的數(shù)據(jù)也得以使用定性研究的分析方法。
對定量研究而言,傳統(tǒng)的社會科學的定量研究,其本質性的缺陷就是“用小數(shù)據(jù)來證明邏輯”,即用簡單的數(shù)量關系來應對復雜的社會問題,用小數(shù)據(jù)、小樣本來外推大數(shù)據(jù)、大樣本的復雜非線性社會問題,由于統(tǒng)計回歸內生性問題和數(shù)據(jù)上無法匹配,導致邏輯上的無法自??;而大數(shù)據(jù)的優(yōu)勢就在于“用數(shù)據(jù)來發(fā)現(xiàn)邏輯”。
大數(shù)據(jù)并不只是和“數(shù)據(jù)”相關,更多的數(shù)據(jù)并不代表更多的洞見,很多時候反而會加大數(shù)據(jù)分析的難度且無益于解決當下的實際問題。如果缺少新的分析方法,大數(shù)據(jù)就難以對社會發(fā)展產(chǎn)生積極影響。因此,數(shù)據(jù)本身并不是大數(shù)據(jù)革命的產(chǎn)物,大數(shù)據(jù)時代的關鍵在于運用科學的方法來分析海量數(shù)據(jù)并從數(shù)據(jù)分析中析出有益于社會發(fā)展和進步的觀點。采用先進方法的大數(shù)據(jù)分析的相關結果可以對以前的發(fā)現(xiàn)給出更好的解釋,加強對現(xiàn)有數(shù)據(jù)、理論和方法的解釋,使有爭議的重大結構性問題和經(jīng)典理論因為使用更加充分和趨于整體化的數(shù)據(jù)得以精細化再檢驗,從而發(fā)展得更加精致。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10