
大數(shù)據(jù)帶來社科研究新變化_數(shù)據(jù)分析師考試
近年來,云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的廣泛應(yīng)用,把人類社會(huì)帶入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)的產(chǎn)生和運(yùn)用,使我們能夠?qū)χ蒙砥渲械纳鐣?huì)進(jìn)行更加廣泛和深入的認(rèn)知、更加客觀和準(zhǔn)確的把握,從而以更精確的語言、更精密的思維加以描述、解釋和界定,以更加科學(xué)、更加有效的方法進(jìn)行治理。
全面真實(shí)展現(xiàn)社會(huì)面貌
大數(shù)據(jù)深刻影響和改變研究社會(huì)問題的方法,使社會(huì)科學(xué)研究領(lǐng)域發(fā)生深刻變化。美國學(xué)者杰弗里·漢考克認(rèn)為,大數(shù)據(jù)對(duì)社會(huì)科學(xué)研究的意義,堪與顯微鏡的誕生對(duì)化學(xué)發(fā)展所起到的促進(jìn)作用媲美。
過去,社會(huì)科學(xué)研究數(shù)據(jù)主要來源于田野調(diào)查和采訪,受調(diào)查成本和可操作性等因素的限制,獲得的數(shù)據(jù)數(shù)量和質(zhì)量都十分有限。計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)興起后,社會(huì)科學(xué)研究除了依賴一手的調(diào)查數(shù)據(jù),還可借助各類專業(yè)數(shù)據(jù)庫,但這些數(shù)據(jù)的準(zhǔn)確性、真實(shí)性和全面性依舊存在不盡如人意之處。
大數(shù)據(jù)能夠?yàn)檠芯空咛峁┣八从械暮A亢透哔|(zhì)量的社會(huì)數(shù)據(jù)、資料和信息。利用這些數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù),研究者能夠深入觀察和分析人類社會(huì)的復(fù)雜行為模式。
“一個(gè)時(shí)代的特征在很大程度上與該時(shí)代的數(shù)學(xué)密切相關(guān)。”(美國學(xué)者莫里斯·克萊因語)網(wǎng)絡(luò)化和數(shù)據(jù)化使社會(huì)環(huán)境更加公開和透明。民眾、企業(yè)和政府都處在互聯(lián)網(wǎng)環(huán)境中,一切行為都會(huì)被記錄、分析和預(yù)測。智能手機(jī)和計(jì)算機(jī)用戶、政府機(jī)構(gòu)、統(tǒng)計(jì)部門及大型企業(yè)、網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)監(jiān)控等,構(gòu)成數(shù)據(jù)增長的重要來源?,F(xiàn)今,全球有約30億人使用互聯(lián)網(wǎng),我國網(wǎng)民規(guī)模達(dá)6.68億,手機(jī)網(wǎng)民規(guī)模達(dá)5.94億。這些人每天收發(fā)的信息,以及與這一收發(fā)過程相關(guān)聯(lián)的信息,都會(huì)變成可揭示人的行為以及人與人之間關(guān)系的數(shù)據(jù)并被存儲(chǔ)。信息技術(shù)與各行業(yè)的深度融合,科技、商業(yè)、教育、醫(yī)療、智能交通、智慧環(huán)保、智能家居、智慧城市建設(shè)等社會(huì)生活的各個(gè)領(lǐng)域,也無時(shí)無刻不在產(chǎn)生大量數(shù)據(jù)。這些開放、流動(dòng)的數(shù)據(jù),成為人們觀察社會(huì)行為的“顯微鏡”,幫助研究者直接利用更加全面、真實(shí)的資料進(jìn)行研究,捕捉以往難以獲取的關(guān)系和知識(shí)。
大數(shù)據(jù)使社科研究更加方便、快捷、全面和深入。研究者坐在屏幕前就可以接入數(shù)百萬的互聯(lián)網(wǎng)用戶資料,這也使他們不再滿足于得到部分信息,而是傾向于收集對(duì)象的全部信息。有別于傳統(tǒng)計(jì)算技術(shù),數(shù)據(jù)挖掘技術(shù)使研究者能夠快速處理海量數(shù)據(jù),信息資源得以高度整合,在最大程度上得到利用。
探索未知世界的新方法
大數(shù)據(jù)的應(yīng)用使社科研究者得以避免主觀臆斷的局限,有效提高研究的客觀性和科學(xué)性。
傳統(tǒng)實(shí)證研究是一種自上而下的決策和驗(yàn)證過程,其特征是研究者在理論分析的基礎(chǔ)上提出假設(shè),之后通過調(diào)查和數(shù)據(jù)分析來驗(yàn)證假設(shè)。其不足或缺陷在于研究者本人的經(jīng)驗(yàn)、見識(shí)、認(rèn)知和判斷決定了研究成果的方向與深度,被調(diào)查者也只能回答訪談和問卷提出的問題,調(diào)查結(jié)果自然局限在研究者的視野之內(nèi)。
大數(shù)據(jù)的應(yīng)用將研究者的視野有效擴(kuò)展到個(gè)人經(jīng)驗(yàn)、見識(shí)甚至想象之外。大數(shù)據(jù)的海量信息在時(shí)空上具有傳統(tǒng)抽樣數(shù)據(jù)無法比擬的廣度和深度,其全樣本的性質(zhì)能夠在最大程度上避免個(gè)人經(jīng)驗(yàn)有限性對(duì)研究過程客觀性的負(fù)面影響。研究者不僅能通過對(duì)大量數(shù)據(jù)實(shí)時(shí)、動(dòng)態(tài)的監(jiān)測與分析來解決社會(huì)問題,更能通過這些海量數(shù)據(jù)來思考、設(shè)計(jì)和實(shí)施研究計(jì)劃;可以通過數(shù)據(jù)的相關(guān)性測量揭示事物的本來面目,發(fā)現(xiàn)規(guī)律和展示規(guī)律,提煉出重要的理論。
數(shù)據(jù)挖掘為研究者提供了深入分析和有效利用大數(shù)據(jù)的手段。數(shù)據(jù)挖掘的特性在于,它不是用于驗(yàn)證某個(gè)假定模型的正確性,而是在數(shù)據(jù)庫中自己尋找模型,本質(zhì)上是一個(gè)歸納的過程,并不需要假設(shè)或期待可能的結(jié)果,從而突破了研究者的視野局限,擴(kuò)展了人類的經(jīng)驗(yàn)范疇。通過數(shù)據(jù)挖掘技術(shù),研究者能夠從海量數(shù)據(jù)中搜索和發(fā)現(xiàn)信息與知識(shí),找出存在于數(shù)據(jù)中的潛在關(guān)聯(lián)和規(guī)則。
以大規(guī)模數(shù)據(jù)分析為特征的研究方法的廣泛應(yīng)用,使社會(huì)科學(xué)的科學(xué)性顯著提升,學(xué)科融合趨勢進(jìn)一步增強(qiáng)。大數(shù)據(jù)的獲取和分析,需要有別于傳統(tǒng)社會(huì)科學(xué)的方法和工具,從而使在計(jì)算機(jī)、人工智能甚至物理、數(shù)學(xué)等領(lǐng)域具有專長的學(xué)者在社科研究領(lǐng)域有了大顯身手的機(jī)會(huì),如小世界網(wǎng)絡(luò)研究者鄧肯·瓦茲原先就是物理學(xué)家。近年來,發(fā)表在英文刊物上的基于谷歌圖書、維基百科等大數(shù)據(jù)的語言學(xué)、經(jīng)濟(jì)學(xué)研究論文,其作者隊(duì)伍不斷有計(jì)算機(jī)領(lǐng)域的研究者和自然科學(xué)家加入。此外,由于大數(shù)據(jù)為社會(huì)科學(xué)提供了全新的分析對(duì)象,學(xué)術(shù)界越來越認(rèn)識(shí)到交叉學(xué)科的重要性?!坝?jì)算社會(huì)科學(xué)”興起,就是一個(gè)生動(dòng)事例。
大數(shù)據(jù)帶來社會(huì)分工形態(tài)的變化,加速了認(rèn)識(shí)世界和改造世界相統(tǒng)一的進(jìn)程。研究者和生產(chǎn)經(jīng)營者、社會(huì)治理者之間的距離不斷縮小,各行各業(yè)越來越依賴大數(shù)據(jù)開展工作,杰出的經(jīng)營與治理越來越依靠杰出的數(shù)據(jù)分析。目前,全球大數(shù)據(jù)應(yīng)用在互聯(lián)網(wǎng)、零售、電信、金融、地理信息科學(xué)、教育、醫(yī)療、交通等諸多行業(yè)創(chuàng)造了巨大的經(jīng)濟(jì)價(jià)值,并且將信息轉(zhuǎn)化為了解世界、市場、人自身的知識(shí)與智慧。由于大數(shù)據(jù)的分析結(jié)果更可靠,在社科研究諸多領(lǐng)域特別是對(duì)策性研究領(lǐng)域,社會(huì)科學(xué)研究者與專業(yè)數(shù)據(jù)公司的合作已經(jīng)成為重要趨勢。
增長新知識(shí)新智慧
西方有人說,“有些事情我們知道我們自己知道,有些事情我們知道我們自己不知道,更有些事情我們不知道我們自己不知道?!贝髷?shù)據(jù)不僅使社科研究者知道以前“不知道”的事情,而且能把研究者帶入一個(gè)“不知道自己不知道”的世界。
隨著大數(shù)據(jù)思維與分析技術(shù)的深入發(fā)展,社會(huì)科學(xué)研究能夠通過片段數(shù)據(jù)、海量數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的采集、梳理與分析,通過碎片重組,深度揭示以往難以處理或無法預(yù)知的難題和關(guān)系。我國警方通過大平臺(tái)、大數(shù)據(jù)和大聯(lián)動(dòng)打擊信息詐騙犯罪,來自各個(gè)領(lǐng)域的聯(lián)盟成員協(xié)同攻關(guān),一起對(duì)大數(shù)據(jù)進(jìn)行挖掘分析,從中觀察到大量之前單靠個(gè)體和單個(gè)數(shù)據(jù)庫難以發(fā)現(xiàn)的聯(lián)系。如確認(rèn)某個(gè)詐騙電話號(hào)碼后,聯(lián)盟中成員馬上就可以根據(jù)這個(gè)號(hào)碼發(fā)現(xiàn)騙子的蹤跡。從前隱藏在各個(gè)數(shù)據(jù)庫中的犯罪片段,在數(shù)據(jù)挖掘技術(shù)的作用下一塊塊地拼接起來,形成比較完整的蹤跡路線圖。據(jù)此,公安部門可以馬上組織精準(zhǔn)偵查,銀行或電商網(wǎng)站可以馬上阻止騙子注冊開戶,運(yùn)營商等可以馬上通知和阻止?jié)撛谑芎τ脩艮D(zhuǎn)款。
基于概率以及可能性的實(shí)證和經(jīng)驗(yàn)研究正在被數(shù)據(jù)分析報(bào)告和專項(xiàng)預(yù)測研究所取代。通過大數(shù)據(jù)和數(shù)據(jù)挖掘,研究者進(jìn)入一個(gè)全新的領(lǐng)域,在那里能夠發(fā)現(xiàn)諸多顛覆直覺和常識(shí)的信息與聯(lián)系,為預(yù)見未來提供更加可靠的依據(jù)。這種預(yù)見是一種自下而上的知識(shí)發(fā)現(xiàn)過程,是在沒有理論假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)、預(yù)知事物發(fā)展的規(guī)律和趨勢,從而更具有科學(xué)性、有效性和實(shí)用性。近年來,研究者在許多社科領(lǐng)域運(yùn)用大數(shù)據(jù)取得了突出成果,如通過海量自然語言表達(dá)觀測公眾的政治參與意識(shí),預(yù)測大選結(jié)果,等等。
大數(shù)據(jù)對(duì)打擊恐怖主義具有重要意義。大數(shù)據(jù)技術(shù)通過對(duì)人臉、聲紋、語音數(shù)據(jù)、資本市場內(nèi)幕交易等信息的分析,綜合利用恐怖分子平時(shí)產(chǎn)生的各種信息,包括通話、交通、電子郵件、聊天記錄、視頻等,能夠使官方對(duì)恐怖行為進(jìn)行事前預(yù)警和事后分析排查。據(jù)報(bào)道,在波士頓馬拉松爆炸案中,美國中情局通過采集移動(dòng)基站的電話通訊記錄,附近商店、加油站、報(bào)攤的監(jiān)控錄像,以及志愿者提供的圖片和影像資料等各種數(shù)據(jù),最終鎖定嫌疑犯并找到炸彈來源。
以大數(shù)據(jù)生產(chǎn)、分享、使用為代表的科技革命,正在使人際關(guān)系、個(gè)人與社會(huì)的關(guān)系、個(gè)人和社會(huì)與政府的關(guān)系以及國家之間的關(guān)系,發(fā)生歷史性變化。以國際關(guān)系為例,大數(shù)據(jù)的出現(xiàn)有助于國家間擺脫傳統(tǒng)思維模式和固有偏見的局限,使一方對(duì)另一方的認(rèn)識(shí)和了解更客觀、全面、準(zhǔn)確、深刻。一方對(duì)另一方能夠進(jìn)行更全面的分析,做出更清晰、準(zhǔn)確的判斷,可以有效減少誤判和安全困境的發(fā)生;通過大數(shù)據(jù)分析對(duì)方的戰(zhàn)略意圖與本國的利益得失,可引領(lǐng)雙方朝著有共同利益的方向加強(qiáng)合作,實(shí)現(xiàn)互利共贏。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10