
來自經(jīng)管之家
入駐人大經(jīng)濟(jì)論壇也有一段時(shí)間了。起初是抱著學(xué)習(xí)的心態(tài),希望論壇里的大神能幫忙解決很多計(jì)量技術(shù)上的問題??纱袅艘欢螘r(shí)間后發(fā)現(xiàn),自己想解決的問題一般沒得到解決,還反而幫很多人解決了一些基礎(chǔ)的問題。
作為一個(gè)非計(jì)量非經(jīng)濟(jì)學(xué)專業(yè)出身的人(雖學(xué)過一些統(tǒng)計(jì),SPSS和stata基本操作也會(huì)),想著梳理下自己學(xué)習(xí)計(jì)量這一路的歷程,或許對(duì)于初入計(jì)量之門/像我一樣非計(jì)量專業(yè)出身但有想很好的利用計(jì)量工具的人有一些幫助和啟示。
第一階段:計(jì)量就是統(tǒng)計(jì)——很難很高深
大學(xué)我算是農(nóng)林經(jīng)濟(jì)管理出身,學(xué)過簡(jiǎn)單的spss(那時(shí)教我SPSS的老師是搞大豆種植的,故而傳授的是t檢驗(yàn),方差分析,簡(jiǎn)單的回歸分析,數(shù)據(jù)的描述性統(tǒng)計(jì)分析等內(nèi)容)。由于大學(xué)期間不用發(fā)文章,畢業(yè)論文也是做的生態(tài)方面的東西,加之大學(xué)老師只將操作,不講原理,所以大學(xué)學(xué)的SPSS基本算是還給老師了。那個(gè)時(shí)候一度覺得SPSS是很高級(jí)的東西(因?yàn)椴恢儡浖僮鞅澈笤?,也不知道怎么解讀結(jié)果)。
后來有幸保送到中科院系統(tǒng)一個(gè)研究所開始研究生階段的學(xué)習(xí)。中科院系統(tǒng)的學(xué)生有一個(gè)好處就是會(huì)在北京研究生院集中學(xué)習(xí)一年。由于專業(yè)研究的需要(跟著導(dǎo)師做農(nóng)戶微觀實(shí)證研究)以及自己特別感興趣(想一窺統(tǒng)計(jì)的神秘面紗),故而在北京學(xué)習(xí)期間選了6門關(guān)于統(tǒng)計(jì)的課(如《心理多元統(tǒng)計(jì)》、《統(tǒng)計(jì)分析與SAS》實(shí)現(xiàn)等)。其中有些課老師講得很好(如胡良平老師講的SAS,通俗易懂),但可能限于學(xué)時(shí),老師沒有鋪開講。加之那時(shí)還有其它專業(yè)課比較繁瑣,故而除了課堂聽講,完成作業(yè)和課程報(bào)告外,沒有過多的時(shí)間去進(jìn)一步看書,消化。經(jīng)過這么一個(gè)過程下來,一些具體的軟件實(shí)現(xiàn)大概知道了,為什么這樣做也知道一點(diǎn)(但理解的不透),結(jié)果解讀似乎也知道那么一些。那時(shí)的我的統(tǒng)計(jì)知識(shí)體系算是比較凌亂,不系統(tǒng)。也一度以為統(tǒng)計(jì)就是計(jì)量,以為解開了它的神秘面紗了。然而事實(shí)卻并非如此。
第二階段:學(xué)習(xí)統(tǒng)計(jì)/計(jì)量還得從實(shí)踐中來
正如我在論壇上發(fā)的一個(gè)個(gè)人投稿經(jīng)驗(yàn)交流貼中所述一樣。我和大多數(shù)在人大經(jīng)濟(jì)論壇上尋求幫助的人一樣,都想快速的學(xué)習(xí)到我想要的某種計(jì)量/統(tǒng)計(jì)方法,然后能夠利用手里的數(shù)據(jù)寫文章(雖然那時(shí)多少有些功利心作祟,有點(diǎn)為寫而寫——可能大多數(shù)人也會(huì)經(jīng)歷這個(gè)階段)。
然而問題來了,雖然我學(xué)了那么多門統(tǒng)計(jì)課,然而由于教授我統(tǒng)計(jì)課老師的專業(yè)背景不一樣(有2個(gè)是數(shù)學(xué)專業(yè)出身),而且有的更多的是將背后的數(shù)學(xué)公式推導(dǎo),重在實(shí)現(xiàn)背后的講解,軟件實(shí)現(xiàn)涉及的相對(duì)較少。同時(shí),在上機(jī)課講解軟件實(shí)現(xiàn)的時(shí)候,只說了怎么勾選一些選項(xiàng),怎么解讀結(jié)果,而為什么不勾選另一些選項(xiàng)等問題則可能因?yàn)闀r(shí)間關(guān)系沒有鋪開講。
此外,加之缺乏文章寫作基本經(jīng)驗(yàn),(那時(shí)不知道做計(jì)量模型前要先提出研究假設(shè),然后去證實(shí)/證偽研究假設(shè),更不知道要對(duì)數(shù)據(jù)做基本的處理,如處理極端異常值,對(duì)一些變量進(jìn)行描述性統(tǒng)計(jì)分析,做散點(diǎn)圖看趨勢(shì)等等,只知道將自變量和因變量分別統(tǒng)計(jì)出來,然后就建模了----(這樣做會(huì)出現(xiàn)很多問題,現(xiàn)在想想還有點(diǎn)后怕。
這或許也是現(xiàn)在很多初學(xué)計(jì)量的人最容易犯的毛?。?,就這么一股腦的做下去了??赡苡捎谥R(shí)的不系統(tǒng),故而經(jīng)常做模型時(shí)前一秒做是一個(gè)結(jié)果,后一秒做又是另一個(gè)結(jié)果。到處尋求無果(我班上的同學(xué)不搞這個(gè),沒法交流。還好當(dāng)時(shí)有機(jī)會(huì)下課后給老師請(qǐng)教,學(xué)到不少東西),迫使我去買專業(yè)的書籍,系統(tǒng)的學(xué)習(xí)相關(guān)知識(shí)。
第三階段:查缺補(bǔ)漏——計(jì)量似乎也不是想象中的那么難
由于本科學(xué)了一點(diǎn)SPSS,加之這個(gè)軟件交互式的操作頁面,故而首選這款計(jì)量軟件(SAS我在北京研究生院期間學(xué)了四門課,但沒門都零散的將一點(diǎn),不系統(tǒng),加之軟件破解版都有9G,太大了,所以慢慢的就把它棄了。然而后面因?yàn)樾枰韺W(xué)了stata,但這是后話了)。國內(nèi)SPSS教材也算比較多的了,如何選成了一個(gè)問題。當(dāng)時(shí)也沒想那么多,就在老師推薦的基礎(chǔ)上買了本張文彤老師寫的SPSS高級(jí)教程。通過教程我明白了很多細(xì)節(jié)的東西(如做回歸分析時(shí)要勾選的框分別對(duì)應(yīng)的是什么),也在這本書的指導(dǎo)下寫了生平第一篇關(guān)于計(jì)量的文章。
在學(xué)習(xí)SPSS的同時(shí),我在北京也經(jīng)常去圖書館看書,也在網(wǎng)上買了些和我將來專業(yè)可能相關(guān)的一些專著。慢慢的發(fā)現(xiàn)專著中出現(xiàn)的很多新名稱我買的張文彤老師的SPSS高級(jí)教程沒有了(如結(jié)構(gòu)方程模型,異方差,WLS,2SLS,工具變量法,面板回歸等),有的SPSS軟件也操作不了或者不好操作(如異方差檢驗(yàn),用stata命令BP就可判定,而SPSS可能就要依照BP計(jì)算原理一步步去做了)。
那時(shí)也不知道該在哪里去找相關(guān)的資料,系統(tǒng)的學(xué)習(xí)一下。在網(wǎng)上搜索一些關(guān)鍵詞,也只是零散的一點(diǎn)介紹,沒有系統(tǒng)的。那時(shí)可能想著自己現(xiàn)在也不用這些方法,加之也比較忙,故而就擱置在那了。但還是乘機(jī)會(huì)買了萬卷方法系列的幾本好書,如《問卷統(tǒng)計(jì)分析實(shí)務(wù)--SPSS操作與應(yīng)用》、《量化研究與統(tǒng)計(jì)分析——SPSS(PASW)數(shù)據(jù)分析范例解析》、《結(jié)構(gòu)方程模型——AMOS的操作與應(yīng)用》等。
系統(tǒng)的學(xué)習(xí)了SPSS和AMOS軟件,至此,SPSS基本操作算是入門。但異方差性,WLS,GLS,F(xiàn)GLS這些計(jì)量方法那時(shí)還是不知道怎么解決,因?yàn)橘I的這些書中基本都沒有這些方法的介紹。有的只是一些基本的數(shù)據(jù)處理,簡(jiǎn)單的回歸分析(OLS),因子分析,聚類分析等。
第四階段:躲不過了,硬著頭皮也要上
前面3個(gè)階段需學(xué)了一些SPSS的知識(shí),但似乎也只是建立在自己看書學(xué)習(xí)的基礎(chǔ)上?,F(xiàn)在是研究生了,不像本科時(shí)間那么充裕,有很多事纏身(如導(dǎo)師的項(xiàng)目,自己寫文章,日常的交際等)。這樣就導(dǎo)致很多知識(shí)在看的時(shí)候理解了,但過一段時(shí)間沒用就忘了。加之看的時(shí)候有時(shí)也沒有具體軟件操作,所以后面要用的時(shí)候有時(shí)都不知道要到哪里去找一個(gè)具體的小知識(shí)點(diǎn)了。
在這時(shí),有幸從一個(gè)師兄那里得到了張文彤老師SPSS內(nèi)部培訓(xùn)視頻(初級(jí)和高級(jí)),通過密集的視頻學(xué)習(xí)掌握了以前很多都沒掌握牢固的技巧,進(jìn)而使得SPSS運(yùn)用更加熟練和得心應(yīng)手。在此基礎(chǔ)上買了張文彤老師《IBM SPSS數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例精粹(配光盤)》這本書和相應(yīng)的視頻,進(jìn)一步在實(shí)戰(zhàn)中學(xué)習(xí)。至此,SPSS基本操作對(duì)于我來說應(yīng)該沒什么問題了。但還是存在第3階段那個(gè)問題——FGLS,2SLS這些是什么我都不清楚。
經(jīng)過一段時(shí)間看文獻(xiàn),有一天我找到一個(gè)idea,去和導(dǎo)師商量后,覺得可行,打算寫一篇好文章??梢獙戇@篇文章需要用分位數(shù)回歸。這個(gè)SPSS解決不了,STATA,EVIEWS,SAS,R這些能解決。除了SAS外,我對(duì)其它幾門軟件一竅不通。在此情況下,我打算除了SPSS外,另學(xué)一門計(jì)量軟件。于是百度比較,看哪個(gè)軟件好學(xué)一些。很多人推薦stata,從此走上stata學(xué)習(xí)之路。
由于stata沒有基礎(chǔ),怎么快速的學(xué)習(xí)它呢?有前面SPSS視頻學(xué)習(xí)經(jīng)驗(yàn),果斷去網(wǎng)上購買了連玉君老師stata培訓(xùn)視頻,至此努力學(xué)習(xí)。初級(jí)教程視頻看了一遍,沒多大問題。到高級(jí)教程里面介紹OLS時(shí)也沒多大問題,但到后面介紹GLS,時(shí)間序列分析時(shí),感覺聽不懂了。其實(shí)也不是聽不懂,是不懂這背后的機(jī)理,為什么要這么做。于是,擱置一段時(shí)間,直到那天——兩本書的出現(xiàn)。
以前有個(gè)師姐打算考中科院農(nóng)業(yè)政策研究中心張林秀老師博士,考試要考計(jì)量經(jīng)濟(jì)學(xué),買了兩本伍德里奇寫的《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論(第三版)》,后來因?yàn)橛⒄Z差1分沒上,直接出去工作了,這兩本大塊頭書就遺留在辦公室的柜子里。由于相對(duì)于經(jīng)濟(jì)學(xué)來說,我們是跨專業(yè),加之平時(shí)比較忙,故而辦公室的其他人對(duì)這兩本書都是望而卻步,將其束之高閣。有一天忙完事休息,我去翻柜子,突然發(fā)現(xiàn)這兩本書,拿下來一看目錄,竟然有2SLS,異方差處理等介紹,那時(shí)真是喜出望外。這時(shí)也快要放寒假了,就想著寒假扛回家好好看看。
同時(shí),由于也在學(xué)習(xí)stata,想著看看有沒有stata的工具書。通過人大經(jīng)濟(jì)論壇,找到了陳強(qiáng)老師寫的《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及stata應(yīng)用》以及另一個(gè)壇友說的郭志剛老師翻譯的一本國外介紹stata的經(jīng)典書籍《應(yīng)用stata做統(tǒng)計(jì)分析》。下載了電子版,回家用手機(jī)慢慢看。
第五階段:計(jì)量也不是想象中的那么難
可能是受長(zhǎng)期中國教育模式的熏陶,我一直都比較急功近利。雖然寒假我將伍德里奇的書扛回家了(對(duì)于農(nóng)村出身的我來說,轉(zhuǎn)幾次車拖一個(gè)箱子,箱子里轉(zhuǎn)著這么兩本大塊頭的書也是聽不容易),然而我最開始也不是去看它,而是看我下載到手機(jī)的兩本stata工具書。看了兩本工具書后,我想要解決的問題(分位數(shù)回歸)至少在軟件實(shí)現(xiàn)上我沒什么問題了。但或許也是機(jī)緣巧合,也或許是農(nóng)村過年無聊(很多我小時(shí)候的玩伴都出去打工了,沒回來,就有一個(gè)人還在讀博,走上了一條“不歸路”)。我拿起了這兩本好不容易扛回家的大塊頭。
才看沒多少頁,就有點(diǎn)看不下去了。雖然我大學(xué)學(xué)了《微積分》、《概率論與數(shù)理統(tǒng)計(jì)》以及《線性代數(shù)》,自認(rèn)為也還學(xué)得不錯(cuò)。但時(shí)隔已經(jīng)6-7年了,早就忘得差不多了。故而一看書中最開始推到OLS的高斯—馬爾科夫假定就有點(diǎn)頭大,但實(shí)在是因?yàn)闊o聊,硬著頭皮把它看下來了。至此,我的學(xué)術(shù)生涯可能走向另一條不同的路了。
慢慢的,我越看越有勁??粗锩娴暮芏喟咐?,看著里面寫的很多話真的是忍不住拍案叫絕,為什么寫得這么經(jīng)典,這么好。可能以前我也有一些底子,故而我看這兩本論壇上大家公認(rèn)的中級(jí)教程(初級(jí)是古扎拉蒂寫的《計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)》,高級(jí)是格林的《計(jì)量經(jīng)濟(jì)分析》)也沒費(fèi)多大力就理解了。一些長(zhǎng)久困擾我的疑惑,如自變量因變量取對(duì)數(shù)后模型怎么解釋,2期數(shù)據(jù)的面板回歸怎么做等也慢慢的得到了解決。
經(jīng)過這一系列過程,再回過頭來看我這個(gè)外行的計(jì)量之路,似乎以前走的有點(diǎn)偏。以前是重實(shí)用,為模型而模型。現(xiàn)在更想做的是多探究為什么要用這個(gè)模型的機(jī)理,我想這可能才是一條長(zhǎng)久之路。慢慢的現(xiàn)在也意識(shí)到了計(jì)量與統(tǒng)計(jì)的可能不同,計(jì)量的博大精深。同時(shí),也發(fā)現(xiàn)計(jì)量也不是想象中的那么難了。在國內(nèi)大家覺得難可能真的是因?yàn)閲鴥?nèi)沒有出像伍德里奇寫的這么好的教材了(PS:以前在北京通過六維空間下載了西南財(cái)大龐皓老師講的計(jì)量經(jīng)濟(jì)學(xué)視頻,也買了他寫的書,但感覺太重理論推導(dǎo)了,沒學(xué)多久一點(diǎn)時(shí)間就放棄了)。
自此,自己也將懷著一顆虔誠的敬畏的心好好學(xué)習(xí)計(jì)量,用好計(jì)量。爭(zhēng)取做一個(gè)地理學(xué)中的計(jì)量怪咖(我現(xiàn)在專業(yè)是人文地理學(xué),搞農(nóng)村聚落地理方面的研究)。
PS:?jiǎn)獑锣掠謱懥诉@么多,希望對(duì)想學(xué)計(jì)量但又苦于不知道怎么學(xué)的朋友有一點(diǎn)啟示意義吧。也希望能與計(jì)量已入門,計(jì)量的大牛們多多交流學(xué)習(xí)。有機(jī)會(huì)一起合作文章也可。
論壇從答疑上線到后面的改版,專門確定經(jīng)管答疑版塊到目前為止已有兩個(gè)半月左右,有幸接受論壇的邀請(qǐng),參與到論壇的答疑中來。答疑兩個(gè)半月,前前后后答了幾百個(gè)問題,嘗試著總結(jié)一點(diǎn)提問者共性的東西,結(jié)合這段時(shí)間我這個(gè)外行計(jì)量學(xué)習(xí)的心路歷程變化,寫了這個(gè)帖子,與大家討論學(xué)習(xí)一下。不當(dāng)之處歡迎批評(píng)指正。
我真正意義上入駐論壇的時(shí)間不長(zhǎng)。注冊(cè)時(shí)間是2013年,真正意義上活躍在論壇是從去年年前左右開始。當(dāng)時(shí)入駐的目的可能和現(xiàn)在大多數(shù)壇友相同:就是遇到計(jì)量/統(tǒng)計(jì)上的難題了,迫切想論壇的大神們幫忙解答下,要是能手把手的幫忙指導(dǎo)(遠(yuǎn)程輔導(dǎo)),甚至幫忙做一下數(shù)據(jù)分析更好。然而正如我在“一個(gè)外行的計(jì)量經(jīng)濟(jì)學(xué)學(xué)習(xí)之路(http://bbs.pinggu.org/thread-3596375-1-1.html)”中說的一樣,入駐一段時(shí)間,發(fā)現(xiàn)自己想解決的問題沒得到有效解決,反而在這個(gè)熱心的過程中順手幫許多壇友解決了問題(雖然由于自己的水平有限,很多問題都是初級(jí)的問題)。所以慢慢的我知道:求人不如求己,很多東西是需要自己去琢磨的。要想取得成果,非下苦工不可。
后來機(jī)緣巧合之下,發(fā)現(xiàn)了伍德里奇的《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論(第三版)》(我在“一個(gè)外行的計(jì)量經(jīng)濟(jì)學(xué)學(xué)習(xí)之路(http://bbs.pinggu.org/thread-3596375-1-1.html)”此貼中有詳細(xì)論述這個(gè)過程),整個(gè)寒假的時(shí)間沉浸在這兩本書里面,前前后后看了三遍(第一遍是硬著頭皮來的),慢慢的開始上路了。后來又有幸在論壇“藍(lán)色”版主回一個(gè)壇友的帖子中發(fā)現(xiàn)了謝宇老師的《回歸分析》一書,通過此書發(fā)現(xiàn)謝宇老師的另外兩本好書:《社會(huì)學(xué)方法與定量研究》和《分類數(shù)據(jù)分析的統(tǒng)計(jì)方法》;再到后面課題組有個(gè)師姐寫論文要用到HLM軟件處理分層線性模型,接觸到張雷老師的《多層線性模型應(yīng)用》,郭志剛老師翻譯的《分層線性模型:應(yīng)用與數(shù)據(jù)分析方法》等書。我算是如獲至寶,第一時(shí)間利用各種渠道買到紙質(zhì)版(個(gè)人習(xí)慣,喜歡看紙質(zhì)版的書,看書時(shí)可以做一些筆記在上面),網(wǎng)上沒有紙質(zhì)版賣的直接找電子版,然后到打印店打印出來看。
拿到書后,集中時(shí)間和精力,快速的先將書系統(tǒng)的過一遍,覺得好的地方再進(jìn)一步細(xì)看。同時(shí),看的過程中不忘寫點(diǎn)文章練手。其中,用到了分層線性模型、分位數(shù)回歸等以前沒有用過的方法,近期打算用面板回歸處理一篇文章。(PS:上面忘了提陳強(qiáng)老師的《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,這本書真心寫得好,我前后看了4遍,但由于這本書語句比較精煉,沒有一點(diǎn)基礎(chǔ)去看可能會(huì)很艱難。即使有了一定的基礎(chǔ),有很多地方可能還是需要時(shí)間才能很好的理解)。
我時(shí)常在想,我一個(gè)計(jì)量/統(tǒng)計(jì)外行,通過自學(xué)出道慢慢的入門了,要是換一個(gè)人來,如果走我相似的路(如看這些書),是否會(huì)一樣呢?
前幾天,和我論壇的導(dǎo)師(現(xiàn)實(shí)生活中的師弟)“我的素質(zhì)低”以及和論壇編輯(現(xiàn)實(shí)生活中的師姐)“chenyi112982”聊天。我說我是個(gè)計(jì)量外行,自學(xué)出道。大概有個(gè)重軟件實(shí)現(xiàn)輕背后理論——惡補(bǔ)理論——理論與軟件實(shí)現(xiàn)并重的這么一個(gè)心路歷程(這里之所以把理論放在軟件實(shí)現(xiàn)前面,是因?yàn)楝F(xiàn)階段的我認(rèn)為計(jì)量理論是根本,是“道”;軟件實(shí)現(xiàn)是工具,是“術(shù)”。唯有兩者并重,可能才能走得長(zhǎng)遠(yuǎn)。不過話又說回來,計(jì)量理論掌握好了,一通百通。軟件的實(shí)現(xiàn)慢慢就會(huì)變?yōu)槠浯瘟恕?/strong>就像我自身學(xué)習(xí)stata半年多時(shí)間,發(fā)現(xiàn)stata的計(jì)量模型實(shí)現(xiàn)過程和結(jié)果解讀,很多可以遷移到Eviews上去,所以現(xiàn)在如果讓我去學(xué)Eviews,我想應(yīng)該會(huì)很快上手)。同時(shí),和師姐聊到現(xiàn)在博士階段,作為導(dǎo)師身邊的主力,比較忙,不會(huì)再像去年寒假時(shí)有那么多時(shí)間集中的再來學(xué)習(xí)計(jì)量了,只能零散的學(xué)習(xí)。師姐提到了一個(gè)觀點(diǎn),我個(gè)人比較認(rèn)同,可能適用于現(xiàn)在大多數(shù)來論壇計(jì)量版塊提問的壇友們。
師姐的觀點(diǎn)大致如下:“計(jì)量的學(xué)習(xí)是個(gè)系統(tǒng)長(zhǎng)期的過程,如果只是用零散的時(shí)間去學(xué),可能掌握的知識(shí)點(diǎn)也是零散的,不系統(tǒng)的??赡苁遣焕陂L(zhǎng)期發(fā)展的·······”。
我個(gè)人的經(jīng)歷大概也是這樣。就像我上段話中描述的一樣,我看伍德里奇的《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論》是利用寒假的時(shí)間集中看的(第一遍是真心辛苦,尤其是這么多年沒碰《線性代數(shù)》、《概率論與數(shù)理統(tǒng)計(jì)》和《微積分》,所以看到高斯馬爾科夫假定,看到OLS系數(shù)推導(dǎo)等地方時(shí),真心覺得有點(diǎn)看不下去的感覺,還好實(shí)在閑得無聊堅(jiān)持了下來),我看陳強(qiáng)老師《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,看謝宇老師的幾本書,看分層線性模型方面的書都是集中時(shí)間看的,長(zhǎng)的10天左右。短的可能就2-3天第一遍就完了。前后一鼓作氣的看有利于集中精力,且前后相對(duì)連貫。同時(shí),持續(xù)一段時(shí)間的集中看書學(xué)習(xí),容易找到一種看書的狀態(tài)。這種狀態(tài)找到了,可以幫助持續(xù)的沉下心來看下去。
現(xiàn)在忙了,好不容易找點(diǎn)空閑的時(shí)間看看書,卻不一定進(jìn)得了狀態(tài);好不容易進(jìn)了狀態(tài),結(jié)果又通知有事要做,導(dǎo)致好不容易找到的狀態(tài)瞬間沒了。等有時(shí)間了卻不一定有看書的那個(gè)狀態(tài)了(即真正靜下心來潛心的系統(tǒng)學(xué)習(xí)研究)。所以,我個(gè)人的經(jīng)歷能給后來人的啟示可能就是:找好適合自己的資料,找到看書學(xué)習(xí)的一個(gè)狀態(tài),集中精力的來系統(tǒng)學(xué)習(xí)。
何為適合?在我看來,就是拿著一本公認(rèn)的經(jīng)典書籍,看看自己現(xiàn)在的基礎(chǔ)能否看得懂,在多大程度上能理解。就像看計(jì)量的書籍一樣,零計(jì)量學(xué)習(xí)經(jīng)歷但有一定的數(shù)理基礎(chǔ)的可能看古扎拉蒂的《計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)》較為合適,有一定的計(jì)量基礎(chǔ)的可能看伍德里奇的《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論》較為合適,基礎(chǔ)深厚的可能看格林的《計(jì)量經(jīng)濟(jì)分析》較為合適。不同的基礎(chǔ)對(duì)應(yīng)不同的書籍。找準(zhǔn)找對(duì)書籍對(duì)后面的學(xué)習(xí)很重要。
可能沒基礎(chǔ)的人看書會(huì)看著頭大,看著吃力且看不進(jìn)去。這時(shí),有一定的感性認(rèn)識(shí)可能會(huì)好一些。
如果是這樣的話,經(jīng)濟(jì)條件好的建議報(bào)論壇的計(jì)量/統(tǒng)計(jì)軟件培訓(xùn)班。張文彤老師的SPSS培訓(xùn)和連玉君老師的stata培訓(xùn)視頻我都看過,系統(tǒng)的學(xué)習(xí)過,真心比較好。參加培訓(xùn)班的好處是即使培訓(xùn)后對(duì)計(jì)量/統(tǒng)計(jì)理論還是一知半解,但會(huì)多一層感性認(rèn)識(shí)。
舉個(gè)例子,SPSS統(tǒng)計(jì)教程書上的前幾章內(nèi)容(如軟件功能介紹,數(shù)據(jù)導(dǎo)入等基礎(chǔ)知識(shí))對(duì)于沒接觸過SPSS軟件,無計(jì)量/統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)但又想自學(xué)的人可能會(huì)看著就頭大,搞半天搞不出個(gè)所以然來。但如果參加培訓(xùn),看幾天都沒明白的東西可能經(jīng)過1個(gè)多小時(shí)的培訓(xùn)課程就明白了。如果是邊參加培訓(xùn)邊實(shí)踐操作,那認(rèn)識(shí)自然會(huì)更加深刻。有了這層基礎(chǔ),再回過頭來看經(jīng)典教材,可能就相對(duì)容易得多了。我想,我之所以看一些計(jì)量/統(tǒng)計(jì)教程速度會(huì)那么快,與看過以上兩位老師的視頻教程是有莫大關(guān)聯(lián)的。
經(jīng)濟(jì)條件差的建議在論壇找找以上我說的書的電子版(“一個(gè)外行的計(jì)量經(jīng)濟(jì)學(xué)學(xué)習(xí)之路http://bbs.pinggu.org/thread-3596375-1-1.html,這個(gè)帖子中也有很多書),然后找準(zhǔn)適合自己基礎(chǔ)的書,看電子版或買一本來系統(tǒng)的學(xué)習(xí)。同時(shí),現(xiàn)在網(wǎng)上也有很多分享計(jì)量/統(tǒng)計(jì)學(xué)習(xí)的視頻,也可找一些免費(fèi)的來看看,學(xué)習(xí)。
然而,可能需要注意的是,不是買了視頻或者參加了培訓(xùn)就會(huì)變得很厲害,就算計(jì)量/統(tǒng)計(jì)入門了。畢竟培訓(xùn)老師講的再細(xì)再好,那也是老師的知識(shí)。要系統(tǒng)的轉(zhuǎn)化為自己的東西才好。師傅領(lǐng)進(jìn)門,修行靠個(gè)人的。這里其實(shí)又涉及到一個(gè)集中學(xué)習(xí)的過程了。我個(gè)人的經(jīng)驗(yàn)是:看視頻尤其是第一遍視頻,即使看不懂也盡量耐著性子硬著頭皮看下來,不懂的地方看第二遍第三遍;看的同時(shí),跟著老師的思路走,邊聽邊自己操作。同時(shí),視頻系統(tǒng)學(xué)習(xí)后回過頭來集中學(xué)習(xí)軟件實(shí)現(xiàn)背后的理論知識(shí)。
我個(gè)人的親身經(jīng)歷是在看連玉君老師stata視頻高級(jí)部分時(shí),那個(gè)時(shí)候計(jì)量理論知識(shí)比較缺乏,而連老師又講得很精煉,所以當(dāng)時(shí)的感覺是聽著很吃力,有點(diǎn)像是聽懂又像是沒聽懂的感覺。說聽懂了,是老師講的通俗易懂,貌似是那么回事;說不懂呢,是因?yàn)槔蠋熤v的都是高度濃縮的知識(shí)點(diǎn),如果不去看書,沒法將這些知識(shí)點(diǎn)很好的串聯(lián)在一起,所以就感覺比較吃力。
當(dāng)時(shí)遇到的具體情況是,看初級(jí)部分視頻沒問題,看高級(jí)部分視頻的OLS回歸部分沒問題,但一到時(shí)間序列部分,面板分析部分,我就有點(diǎn)頭大了,不得已只好放棄。后來系統(tǒng)的學(xué)了下伍德里奇《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論》,陳強(qiáng)老師《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,慢慢的對(duì)計(jì)量理論的理解更深刻一些,再回過來了看視頻就沒那么吃力了。同時(shí),反而高度概括的視頻講解對(duì)相對(duì)繁瑣的書籍理論介紹進(jìn)行了提煉,使得自身理解更上了一層樓。
據(jù)我了解,即使伍德里奇的《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論》現(xiàn)在網(wǎng)上也有培訓(xùn)視頻賣,不可謂不是廣大計(jì)量求知愛好者的福音??偨Y(jié)而言,軟件培訓(xùn)更多的是幫助我們?cè)黾訉?duì)軟件及軟件操作的認(rèn)識(shí),當(dāng)然對(duì)計(jì)量理論的學(xué)習(xí),也有一定的感性認(rèn)識(shí)上的幫助,然而具體深入的計(jì)量理論學(xué)習(xí)可能還得靠自己私底下靜下心來扎扎實(shí)實(shí)的看,不斷的操作實(shí)踐,進(jìn)而不斷的進(jìn)步。
后來,我又在想,即使計(jì)量理論掌握的比較扎實(shí)了,基本的軟件操作也會(huì)了(會(huì)用軟件快速的實(shí)現(xiàn)各種所謂的計(jì)量模型),那么就一定能在實(shí)戰(zhàn)中所向披靡么?可能未必??赡苁且?yàn)闀畬懽髡鹿?jié)安排以及軟件培訓(xùn)分塊相對(duì)系統(tǒng)的原因,即使是經(jīng)典的計(jì)量/統(tǒng)計(jì)書籍,很好的軟件培訓(xùn),知識(shí)點(diǎn)也只是相對(duì)集中的,對(duì)于建立一個(gè)解決實(shí)際問題的模型而言(如寫畢業(yè)論文,發(fā)文章),可能就是零散的了。
舉個(gè)具體的例子:我們要構(gòu)建一個(gè)常見的橫截面數(shù)據(jù)的OLS回歸模型(即多元線性回歸模型),經(jīng)典的計(jì)量/統(tǒng)計(jì)書籍及軟件培訓(xùn)可能會(huì)相對(duì)集中的分版塊(章節(jié))告訴我們要構(gòu)建這么一個(gè)模型,需要的數(shù)據(jù)類型是什么樣的(如因變量是連續(xù)性變量,自變量如果是類別變量需要處理為啞變量),有一些什么樣的基本假定(如高斯馬爾科夫假定),結(jié)果怎么解讀等。即構(gòu)建這么一個(gè)模型的所有細(xì)節(jié)的東西可能分版塊(章節(jié))講解了,但沒有集中起來。然而我們?cè)趯?shí)際寫文章/畢業(yè)論文的過程中,是需要一個(gè)系統(tǒng)的思維過程,是需要把這些零散的知識(shí)點(diǎn)整合起來的。
比如現(xiàn)在如果要我構(gòu)建一個(gè)橫截面數(shù)據(jù)的OLS回歸模型,我可能會(huì)考慮以下的東西:
一是構(gòu)建模型的指標(biāo)怎么來。在稍微好點(diǎn)的國內(nèi)外期刊中,模型指標(biāo)的選取是基于理論/文獻(xiàn)/有理有據(jù)的常識(shí)來的,并會(huì)在構(gòu)建模型前做嚴(yán)格的研究假設(shè)。
二是構(gòu)建模型前數(shù)據(jù)的預(yù)處理。如做描述性統(tǒng)計(jì)分析看看數(shù)據(jù)是否存在極端異常值;數(shù)據(jù)是否基本符合正態(tài)分布,如果不符合怎么處理(如對(duì)于含0較少的右偏態(tài)分布數(shù)據(jù)取對(duì)數(shù);對(duì)于含0較多的右偏態(tài)分布數(shù)據(jù)將連續(xù)性變量處理為類別變量);是否將類別變量處理為啞變量;對(duì)數(shù)據(jù)變量間是否存在多重共線性進(jìn)行診斷等(曾經(jīng)嘗試寫了這么一個(gè)帖子,是關(guān)于極端異常值診斷的。描述性統(tǒng)計(jì)分析在實(shí)證研究中的作用及具體軟件實(shí)現(xiàn)——以SPSS為例:http://bbs.pinggu.org/thread-3651449-1-1.html)。
三是對(duì)數(shù)據(jù)進(jìn)行建模,然后對(duì)模型進(jìn)行合理的解釋。建模時(shí)考慮結(jié)果是否穩(wěn)健,是否存在內(nèi)生性變量等。
之所以會(huì)舉這個(gè)例子是因?yàn)槲以诖鹨蛇^程中發(fā)現(xiàn):很多壇友都是拿到數(shù)據(jù)直接就到第三步的建模過程了,淡化了第一步指標(biāo)的選取過程和第二步數(shù)據(jù)的預(yù)處理過程。這是非常可怕的一種后果。然后我又結(jié)合來提問的壇友的可能特征想了想,至于為什么這樣的原因就了然了。經(jīng)過我個(gè)人的觀察,來提問的壇友可能大多具有以下特征:
一是大多是本科生或者碩士生,未學(xué)過計(jì)量/統(tǒng)計(jì)會(huì)懂一點(diǎn)“皮毛”的居多。真正計(jì)量功底深厚的人大多潛水了,自己有問題基本自己就解決了。這部分人即使有問題,也知道通過何種渠道去找資料,能快速的找到相應(yīng)的資料解決問題;還有一種是介于以上二者之間的,恰如我。懂一些計(jì)量,能解決一些基礎(chǔ)問題,且正好又比較熱心,所以被論壇HR挖掘過來當(dāng)版主,幫助大家答疑解惑了。
二是對(duì)一些計(jì)量/統(tǒng)計(jì)理論的理解都不深刻,問的問題確是相當(dāng)高深復(fù)雜的模型。這部分人層次跳躍很大。舉個(gè)我答疑中的例子,有個(gè)壇友不知道z統(tǒng)計(jì)量是什么東西,問的問題確是面板Logit模型。著實(shí)嚇了我一跳。
三是構(gòu)建的模型多是模仿著文獻(xiàn)中的來,自己找同樣的指標(biāo)構(gòu)建同樣的模型卻得不到一樣的結(jié)果。我在第二點(diǎn)中舉的例子的壇友可能就在此列。
四是有一腔熱血想快速的學(xué)好計(jì)量。這類壇友經(jīng)常問的問題是如何學(xué)好計(jì)量/統(tǒng)計(jì)/某門軟件操作,要多少時(shí)間才能學(xué)好之類的問題。
我時(shí)常在想,對(duì)于來論壇提問的大部分壇友,他/她們中可能只有很少一部分人會(huì)繼續(xù)深造,或者出去工作后會(huì)用計(jì)量/統(tǒng)計(jì)相對(duì)較多。更多的壇友可能只是面臨寫文章/畢業(yè)論文的壓力,而迫切的需要用到計(jì)量/統(tǒng)計(jì)軟件。他/她們中的大多數(shù)可能把論文寫完了就出去工作了,不會(huì)再接觸這些所謂的計(jì)量模型了。
同時(shí),很多壇友基礎(chǔ)知識(shí)都沒掌握好,一來就問很高深的計(jì)量模型,這使得我們這些所謂的答疑“專家”或者熱心答疑的壇友很尷尬。他/她們的模型構(gòu)建大多模仿著文獻(xiàn)來,軟件操作仿著書來。由于缺乏一定的基礎(chǔ),我們即使回答了他/她們的問題他/她們也不一定看得懂(因?yàn)楹芏鄷r(shí)候計(jì)量模型的建構(gòu)是個(gè)系統(tǒng)的過程,難免會(huì)涉及到一些專有名詞,即使是一些很基礎(chǔ)的專有名詞。
我記得我的答疑中有用復(fù)雜的計(jì)量模型卻不知道多重共線性是怎么一回事的)。更有甚至,有的壇友想當(dāng)然的,“天馬行空”式去構(gòu)建計(jì)量模型,指標(biāo)的選取脫離了理論/文獻(xiàn)/基本常識(shí)。這使得我們答也不好,不答也不好,很尷尬。對(duì)我個(gè)人而言,我是本著一顆熱情的心,只要我會(huì)的還是盡可能的幫助,并會(huì)在回答中提到要注意指標(biāo)的選取和數(shù)據(jù)的預(yù)處理。
我系統(tǒng)的梳理了下我的幾百個(gè)答疑,發(fā)現(xiàn)只要是涉及到回歸方面的問題大多是沒有進(jìn)行我上面舉的例子中提到的第二步。故而常見的問題是模型的回歸系數(shù)方向與參考的文獻(xiàn)相反/與自己預(yù)計(jì)的方向相反/與自己做散點(diǎn)圖發(fā)現(xiàn)變量間的方向相反。這些問題多是極端異常值/變量間的多重共線性引起的。很多壇友經(jīng)我一說后,馬上去診斷一下,很多就得到自己想要的結(jié)果了。
我一直在不斷的反思自己這一路的計(jì)量自學(xué)過程,以前寫文章到處碰壁的過程。深感計(jì)量理論的學(xué)習(xí),軟件實(shí)現(xiàn),文章的寫作,投稿修稿到最終稿件見刊的這一系列過程是一個(gè)系統(tǒng)的過程。任何一個(gè)環(huán)節(jié)弱了可能都會(huì)使得文章經(jīng)歷一些坎坷后才能見刊。
在這反思的背后又對(duì)前面提到的部分壇友的情況感到擔(dān)憂:文獻(xiàn)沒讀幾篇,缺乏一定的鑒別能力就匆忙的找篇范文模仿著選取指標(biāo)了(可能參考的文獻(xiàn)模型建構(gòu)的都是有問題的);指標(biāo)的選取沒有基于一定的理論/文獻(xiàn)/客觀有力的常識(shí),而是“天馬行空”想當(dāng)然的就選取了,且在選取時(shí)貪多求全,忽略了模型的簡(jiǎn)潔性;指標(biāo)選取后沒做嚴(yán)格的理論假設(shè),沒對(duì)數(shù)據(jù)做基本的預(yù)處理就模仿著文獻(xiàn)和軟件實(shí)現(xiàn)書籍倉促的建模了;有的“更可恨”的是明明是建模過程中出現(xiàn)了問題卻為了迎合主觀常識(shí),人為的篡改了模型數(shù)據(jù)(這樣的結(jié)果可能行家一眼就看出來了)······
擔(dān)憂歸擔(dān)憂,但我也知道所有事物的轉(zhuǎn)變總有一個(gè)過程(我自己前期寫的中文文章也存在這樣或那樣的不足)。對(duì)于前面提到的只是暫時(shí)需要幫助,事后工作后與計(jì)量接觸不多的這部分壇友我也表示理解(正因?yàn)槔斫?,所以看到有壇友提問,只要我能答的,也?huì)盡可能的給予解答)。寫此貼的目的一是在于再次回顧自己計(jì)量學(xué)習(xí)的一點(diǎn)心路歷程,希望給想學(xué)好計(jì)量卻又苦于不知道如何學(xué)的壇友一點(diǎn)啟示(我的心路歷程大致都在發(fā)表的這幾個(gè)帖子中了);二是簡(jiǎn)單的歸納總結(jié)了下答疑兩個(gè)半月以來的一點(diǎn)心得和一點(diǎn)擔(dān)憂,希望看到這個(gè)帖子的壇友(尤其是基礎(chǔ)不那么好的壇友)在以后構(gòu)建模型時(shí)多想想我舉的例子的第一步和第二步(有時(shí)間我再開一貼對(duì)這一系列過程做個(gè)系統(tǒng)的論述)。前期準(zhǔn)備的越充分,后期才不會(huì)有那么多不確定,那么多煩惱。
想說的話還有很多,但一看這篇幅,想想還是算了。留待以后吧。需要說明的是,此貼更多的只是在心路歷程上和一些“假大空”的實(shí)現(xiàn)上進(jìn)行了一些梳理,具體的計(jì)量理論和軟件實(shí)現(xiàn)過程還是得靠自己私底下辛勤的付出才行。
越努力,越幸運(yùn)。與君共勉。
xddlovejiao1314
2015年9月2日于蓉城
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03