JTRAIN2.RAW 中的數(shù)據(jù),來自 1976-1977 年對(duì)低收入男性進(jìn)行的一項(xiàng)工作培訓(xùn)實(shí)驗(yàn);參見
Lalonde(1986)。
(1) 利用指標(biāo)變量 train 來確定得到工作培訓(xùn)的男性比例。
(2)變量 re78 是 1978 年得到的工資,以 1982 年的美元度量。針對(duì)得到工作培訓(xùn)的男性樣本
和未得到工作培訓(xùn)的男性樣本,分別計(jì)算 re78 的平均值。二者在經(jīng)濟(jì)上的差別大嗎?
(3)變量 unem78 是表示一個(gè)男人在 1978 年是否失業(yè)的指標(biāo)變量。得到工作培訓(xùn)者的失業(yè)比
例是多少?沒有得到工作培訓(xùn)者呢?評(píng)論兩者之間的差異。
(4)根據(jù)第(1)部分和第(2)部分,工作培訓(xùn)項(xiàng)目看來有效嗎?如何使我們的結(jié)論更有說
服力?
準(zhǔn)備:
在 RStudio 中導(dǎo)入 JTRAIN2
attach(JTRAIN2) #綁定數(shù)據(jù)集 JRTAIN2
library(mice) #載入檢查缺失值的包 mice。
md.pattern(JTRAIN2) #檢查一下是否有缺失值。結(jié)果是沒有。
(1)利用指標(biāo)變量 train 來確定得到工作培訓(xùn)的男性比例。
sum(train)/length(train) #確定得到工作的男性的比例,結(jié)果為 0.4157303。
(2)變量 re78 是 1978 年得到的工資,以 1982 年的美元度量。針對(duì)得到工作培訓(xùn)的男性樣本
和未得到工作培訓(xùn)的男性樣本,分別計(jì)算 re78 的平均值。二者在經(jīng)濟(jì)上的差別大嗎?
a<-aggregate(JTRAIN2["re78"],by=list(train),FUN=mean,na.rm=TRUE) #用 aggregate 命令(《R 語
言實(shí)戰(zhàn)》第 101 頁)針對(duì)得到工作培訓(xùn)的男性樣本和未得到工作培訓(xùn)的男性樣本,分別計(jì)算
re78 的平均值,結(jié)果保存在 a 中。
a #展示結(jié)果。可以發(fā)現(xiàn)有培訓(xùn)的男性的工資是 6.35,沒有培訓(xùn)的男性的工資是 4.55。在經(jīng)濟(jì)
上差別較大。
Group.1 re78
1 0 4.554802
2 1 6.349145
(3)變量 unem78 是表示一個(gè)男人在 1978 年是否失業(yè)的指標(biāo)變量。得到工作培訓(xùn)者的失業(yè)比
例是多少?沒有得到工作培訓(xùn)者呢?評(píng)論兩者之間的差異。
b<-aggregate(JTRAIN2["unem78"],by=list(train),FUN=mean,na.rm=TRUE) #用 aggregate 命令(《R
語言實(shí)戰(zhàn)》第 101 頁)針對(duì)得到工作培訓(xùn)的男性樣本和未得到工作培訓(xùn)的男性樣本,分別計(jì)
算 unem78 的平均值(由于 unem78 在某個(gè)體失業(yè)時(shí)為 1,沒有失業(yè)為 0,其平均值就是失業(yè)
者的占比),結(jié)果保存在 b 中。
b #展示結(jié)果。可以發(fā)現(xiàn)有培訓(xùn)的男性的失業(yè)者比例是 0.24,沒有培訓(xùn)的男性的失業(yè)者的比例
是 0.35。在經(jīng)濟(jì)上差別較大。
Group.1 unem78
1 0 0.3538462
2 1 0.2432432
(4)根據(jù)第(1)部分和第(2)部分,工作培訓(xùn)項(xiàng)目看來有效嗎?如何使我們的結(jié)論更有說
服力?
第(1)部分和第(2)部分的比較都是基于經(jīng)濟(jì)學(xué)的比較,沒有基于統(tǒng)計(jì)學(xué)的比較。如果要有
信服力的話需要做統(tǒng)計(jì)學(xué)上的顯著性檢驗(yàn)。
t.test(re78~train) #對(duì) re78 做 T 檢驗(yàn),結(jié)果 p-value = 0.007893,我們可以拒絕認(rèn)為得到工作培
訓(xùn)者的工資均值和沒有得到工作培訓(xùn)者的工資均值相同。 (《R 語言實(shí)戰(zhàn)》第 151 頁)
t.test(unem78~train) #對(duì) unem78 做 T 檢驗(yàn),結(jié)果 p-value = 0.01117,我們可以拒絕認(rèn)為得到工
作培訓(xùn)者的失業(yè)比例均值和沒有得到工作培訓(xùn)者的失業(yè)比例均值相同。(《R 語言實(shí)戰(zhàn)》第
151 頁)
detach(JTRAIN2) #解除綁定數(shù)據(jù)集 JTRAIN2








暫無數(shù)據(jù)