
經(jīng)濟(jì)學(xué)家為何在大數(shù)據(jù)浪潮面前如此淡定
大數(shù)據(jù)如今被各行業(yè)追捧,但是有個現(xiàn)象還是值得注意的——在經(jīng)濟(jì)學(xué)領(lǐng)域,關(guān)于大數(shù)據(jù)應(yīng)用的文章卻不多。按理說,經(jīng)濟(jì)學(xué)是社會科學(xué)中最“科學(xué)”的一支,又以其“帝國主義”的霸權(quán)思想全方位侵入各個社科領(lǐng)域,為何在大數(shù)據(jù)浪潮面前如此淡定?不沖上去做一個弄潮兒?
小編個人覺得這大概與數(shù)據(jù)的特性有關(guān),經(jīng)濟(jì)學(xué)使用數(shù)據(jù)的重點在于identification,而當(dāng)前的大數(shù)據(jù)因為數(shù)據(jù)生產(chǎn)過程不透明及樣本偏差等,難以做出學(xué)界認(rèn)可的結(jié)果。
不明白的話,我們來看一個研究的例子,來說明為什么是這樣:
之前某公共號推送了一篇文章,講施新政、李宏彬和吳斌珍三位老師合作撰寫的American Economic Review Papers and Proceedings論文“The Retirement Consumption Puzzle in China”,實證考察了中國居民的退休消費(fèi)情況。文章的背景如下:
根據(jù)平滑消費(fèi)理論,人們會調(diào)整一生各階段的消費(fèi)水平使之大致相當(dāng)。然而,大量文獻(xiàn)卻發(fā)現(xiàn)人們的消費(fèi)水平會在退休后發(fā)生大幅度下降,這與平滑消費(fèi)理論發(fā)生了沖突。許多學(xué)者都試圖從不同角度對此進(jìn)行解釋,本文作者也加入了這一行列。
在介紹作者思路之前,先來思考一下,如果我們用“大數(shù)據(jù)”要怎么做?
首先搞消費(fèi)研究那得找萬能的淘寶和京東啊,假設(shè)我們拿到了所有淘寶、京東的數(shù)據(jù),知道大家都買買買了什么。然而這里有個問題,要研究的是消費(fèi)水平是否會在退休后大幅度下降,退休的人都用這兩個平臺嗎?!這里面臨了大數(shù)據(jù)的問題一:所有的企業(yè)的用戶數(shù)據(jù)和真實的人口都存在偏差,而且往往偏差很大。就拿相對最全的銀行數(shù)據(jù)來說(金融方面),覆蓋的也往往是本行的用戶數(shù),選擇某一銀行的人可能本身就有樣本偏差,而且還不一定能覆蓋其它如股票、信托等金融方式。
那么我們假設(shè)所有中國人都用淘寶和京東,這樣是不是就可以了呢?
也不行。
因為你不是所有東西都在這上面買,我買個包子、買根蔥,總不至于也上京東吧?
那我們假設(shè)全國菜市場也都聯(lián)網(wǎng)了,我知道你都買了多少菜,多少魚,總行了吧?
可能還是不行。
因為我如果根本就不去買,退休后在家里自己種菜呢?自己蒸饅頭呢?而且這種現(xiàn)象恐怕不稀少吧?這都會造成數(shù)據(jù)的系統(tǒng)性偏差。
讓我們來看看作者們是怎么分析數(shù)據(jù)中消費(fèi)品類型的影響的:
在本文作者看來,現(xiàn)有研究的實證分析尚存在一些不足:首先,現(xiàn)有研究對消費(fèi)的定義并不完善。消費(fèi)中有一部分是與工作相關(guān)或者可以被家庭內(nèi)部生產(chǎn)所替代。在考察退休前后消費(fèi)是否滿足平滑消費(fèi)理論時,應(yīng)該先將這一部分剔除。然而,大多數(shù)現(xiàn)有研究由于數(shù)據(jù)的局限而未能這么做。其次,現(xiàn)有研究面臨內(nèi)生性問題。退休與否是一個高度內(nèi)生的決策變量,不考慮退休內(nèi)生性的實證考察結(jié)果很有可能存在偏誤,進(jìn)而也無法明確得到退休與消費(fèi)之間的因果聯(lián)系。
作者們在處理這一研究問題的時候還是采用了“傳統(tǒng)數(shù)據(jù)”,中國城市家庭調(diào)查數(shù)據(jù)(China's Urban Household Survey, UHS),對消費(fèi)內(nèi)容進(jìn)行了細(xì)致的分解,分出了工作相關(guān)消費(fèi)、可被家庭生產(chǎn)替代的消費(fèi)及其他消費(fèi)。
對于內(nèi)生性的問題:本文利用中國的強(qiáng)制退休政策,借助斷點回歸策略(RD)有效處理了內(nèi)生性問題。中國的很多單位都實行強(qiáng)制退休政策(主要是政府、公共部門、國有企業(yè)、集體企業(yè),男性60歲、女性55歲),作者基于此比較考察了退休前后年齡段人群所在家庭的消費(fèi)變化情況。
作者們得出的結(jié)論是:
退休確實會使家庭的非耐用品消費(fèi)顯著下降21個百分點。不過這一下降主要是由工作相關(guān)開支減少、食品消費(fèi)由在外進(jìn)行轉(zhuǎn)變?yōu)樵诩疫M(jìn)行所造成的。其中后者主要是由于家庭內(nèi)部食品消費(fèi)價格更加低廉,而且退休群體有充足的時間在家準(zhǔn)備食品。在剔除了這兩項之后,作者發(fā)現(xiàn)退休并未對其他非耐用品消費(fèi)造成顯著影響,即平滑消費(fèi)理論針對其他非耐用消費(fèi)品仍然成立。
當(dāng)然,要知道UHS的數(shù)據(jù)可不是想拿就能拿到的,現(xiàn)在經(jīng)濟(jì)學(xué)研究高質(zhì)量數(shù)據(jù)變得非常非常重要,而且只要數(shù)據(jù)質(zhì)量夠好,根本不需要復(fù)雜的模型。有研究表明,經(jīng)濟(jì)學(xué)主流期刊上面OLS仍然是使用最多的回歸方式,而不是什么DID,RD,GMM。
結(jié)論
其實經(jīng)濟(jì)學(xué)家對數(shù)據(jù)是非常敏銳的,早已經(jīng)不局限在傳統(tǒng)的統(tǒng)計年鑒、普查數(shù)據(jù),他們扒地方志及歷史文獻(xiàn),用氣象數(shù)據(jù)、遙感數(shù)據(jù),現(xiàn)在也有非常多的研究開始寫爬蟲抓互聯(lián)網(wǎng)數(shù)據(jù)。所以經(jīng)濟(jì)學(xué)家不是不用數(shù)據(jù),也不是不用大量的數(shù)據(jù),而是對“大數(shù)據(jù)”的使用持審慎的態(tài)度。
本文舉的例子主要是想說明數(shù)據(jù)的選擇與研究問題的需求密不可分,這一點不論數(shù)據(jù)"大小"。很多時候,研究人員并不能很好地了解拿到的大數(shù)據(jù)的產(chǎn)生方式,及可能存在的偏差,導(dǎo)致使用起來會比較盲目。特別地,互聯(lián)網(wǎng)公司的業(yè)務(wù)變化速度非常快,算法腳本經(jīng)常更新,用戶結(jié)構(gòu)性的變化也不小,這些對于外部研究者都是很難了解的。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03