当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.2 DID estimation 1
所以大家看对于
父亲
父亲在高中阶段去世的人群
因为每一届都会有新的一学生
所以它是一直有这样的一个人群
我们在这里为了数学的方便
红色的 t是81年
那么把81年之后定为t0
因为这个时候实际上是没有政策了
一般都是说
先没有政策 然后再有政策
但这个例子正好是反过来是
本来是有政策
然后政策又取消了
所以说我们
倒过来来去记录
红色的t之前81
年之前我们定为t1
因为这是有政策的 offer
的这样的一个
政策
那么
这个Y1是在81年之前
学生上大学的
父亲去世
父亲在高中阶段去世的这群学生
他们上大学的这样的一个比例
Y0是81年之后
这群同样资质的学生
上大学的比例
那么Y1-Y0的差值
看上去就是一个政策的效应
是不是,我们叫它D1
Y1-Y0联看上去很像
那么是不是这个是
我们后面再讨论
那么这个叫first
difference
第一重差分,把它写成数学
数学等式的形式也是可以的
以及我们也可以用一个
回归方程
大家看到这个地方其实我们是用两种模式
这个就是
main difference
两组人的均值比较
那么下面这个显然我们就
用了一个一元回归方程
那么我们就很熟悉了
一元回归方程offer是一个
dummy variable
它的系数γ是不是正好等于上面
main difference
是一样的
那么这个是第一层的差分
那么在课本上也给出了第一
重差分的值0.208
不论是 main
difference还是跑回归
结果是一样的
那么这个里面我们重点要讨论
的就是dId的假设
因为我们之所以能做这件事情
是取决于几个重要假设是不是成立的
我听同学们在讨论的时候也
都在重点讨论这个问题
第一个假设就是我们刚才提到的
policy shock
或者它是个disaster等等
它一定是一个外生的时点
我们要确认
这个并不是总是很显然
像刚才那个
看上去很显然
但是当我们再去进一步讨论
如果大家想一下
如果不同的州
如果每一个州都有这个政策
但是有一年某一个州率先取消了政策
而其它州没有取消
那么再过几年又有一些州取消了政策
看上去政策的取消
是外生的
并不是每一个个体能够去控制的
但是大家想一想
为什么有的州会率先取消呢
是不是它的比如说政府财力不足了
它的财政税收不够了
所以它取消了资助政策
是吧
财政税收减少
是因为什么
可能是因为宏观经济形势
是吧
宏观经济形势它影响的可能
不仅仅是政府的税收
还有
就业工资等等
那么它会带来一系列的影响
也就是说我们看上去
政策的取消
它可能也是一个系统内的变量
它是受到
其它因素影响的
宏观政治经济形势等等都有可能
所以这个时候
treatments就不见得是
那么外生当我们放在这样的一个
背景下的时候 所以说
你要去认真的去argue
如果你觉得这是一个外生的政策的时候
要去阿哥 它为什么是外甥的
这个是
没有办法去用数学去检验的
这是第一点
这个很重要
我听到同学们有讨论这个问题
那么第二个就是
在这个政策发生的同时
应该没有其它的政策发生
这样的话
因为不同的政策它引起人的行为的变化
它是
有的时候是一致的
有的时候是不一致的
是很复杂的
当我们想去评估一个政策的影响
或者说这个政策它带来了一个非常
显著的行为的变化的时候
我们要
保证没有其它的政策也在同时发生在干扰
否则的话我们就很难剥离掉
其它因素
是不是
比如说
我们刚才说的政策它取消了
对特定人群
的资助
如果特定人群它同时还接受另外一个资助
也在同一年取消了
这个时候是不是
我们刚才看到的第一重差分的结果
只是
它是一个混合的效应
它是两个政策叠加的效应
对不对
而另外一个它可能如果不是资助
它可能是别的是不是
别的性质的这样的一个影响
所以说要没有其它的 policy
shock
就要通过文献的调研政策文献的调研
要确保没有其它的政策
如果被别人举出反例来了
你这个就很难成立
这个也是很重要的
那么第三个在我们的计量估算里面
当然是
最重要的就是 common
time trend
也就是说我们可以发现
我们的treatment group
是
父亲在高中阶段去世的学生人群
那么它是treatment
其它的学生就是control group
这两个group我们有一个重要的假定
就是说虽然两这两个人群
它们的在t0时刻的outcome
并不一定是相等的
相等是谁的假设
是RCT的假设 但是在
在 natural
experiment里面我们不
要求它相等
但是我们要求说
它们从第t0期到第t1期
如果没有政策的变化
它们的 outcome的变化趋势
这个时间趋势是一致的
是相等的 可以这样讲
这样的话
就能够帮助我们完成后面的估算
Common time
trend是
非常重要的一个假设
我们来看
那么为什么这个很重要
因为即便没有这一个政策
其它的因素也会影响到
学生上大学的决策
比如说宏观形势
等等
这个都是有可能或者是
上大学的成本提高了
那么他们可能整体上都不太想
上大学了
这是有可能的
那么事实上在1981
年还有一个资助政策
它也
废止了这个就是MISAA当然这个政策
好在它是对所有学生都有影响
它不是只对高中阶段父亲
去世的学生有影响
因此
但是它就构成了什么
它就构成了一个time trend
就是说没有刚才 SSSB政策
这一个program的取消也会造成
所有人群的一个college
enrollment的这样的一个
比例的变化
导致了它们出现的原因
但是好在所有人都受影响
不论treatment还是control
都受影响
那么它这个还好
如果是只影响了treatment
就很麻烦了
或者只影响了control都很麻烦
所以我们来用difference
in
differences
DID
ok
那么大家都做了预习作业了
还是
比较熟的
对
这个变化斜率要相等
变化斜率不相等都不行
刚才叫什么来着
弹幕
问的问题就是说
它不光是变化的方向一致
比如都增加或者都减少
它必须整个斜率是相等的
变化和减少的值绝对值是要相等的
待会我们看估算
那么这张图可能大家来看
左边这个是control
右边这个是treatment group
那么左边这个它是没有受到政策影响的
因为它不符合政策的资助的条件
但是即便没有它不受到
SSSB政策的影响
大家可以看到说
从1981年之前到1981年之后
它的上大学的这样的一个比例是不是
也是有一个缓慢下降的趋势
那么这个趋势就可以被我们估算出来
对吧 做一个差值就可以了
我们叫做D2
这个就是一个time trend
那么这个是刚才我们估算的D1
也就是说对于 treatment
group
它在这两期的差值
那么大家想因为我们给
出一个非常强的假设
也就是说这两组人虽然它们的起点不一样
这个点
不一样
当然这个点在这里被算是终点
这个点也不一样 对不对
在t0期它们的值也不一样
没有关系
我只要求它们的变化趋势一样
也就是说
如果都不受政策的影响
都没有这个政策的话
time trend是一样,time trend是谁
那显然就是D2对不对
D2就只有time trend
所以说我其实是用D2
样本
ok用control group
样本来估算的
D2
把D2也当作treatment
group的 time trend
那么我把它们是减掉
剩下的就是政策带来的影响
DID
那么我们当然可以画一张更加漂亮的图
那么这张图
跟刚才那个图的含义是一样的
只不过它
用
用一个更精确的方法
t1当然是1981年
那么其实这个政策
一发生变化
它当年
treatment group
的学生
就不能够再去接受
就接受不到这样的一个资助了
所以说它其实是一个gap
是一个垂直下落的 gap
之后继续有一个time trend
大家可以看到整体 time
trend它是一个
向下的一个趋势
整体是一个下降的
这地方是有个gap
那么当我们这么画的时候
你会更清晰地看到是不是我们在明确的
假设treatment group
跟control group它们
之间的它们存在的斜率是一样的
是两两个平行线
只不过
我们在这一点上
在红色的gap这个地方
我们其实是没有观测数据的
正好发生在这一期
有什么观测数据呢
我们有t1期的贯穿数据
和t0期的观测数据
那么
做差才得到了
双重差分才得到了 treatment
effect
这么话把平行的time trend画得更清晰一点
好 大家有问题随时提
那么当然这些坐标轴上对应
的这些值就很重要了
就是我们刚才
说到的这几个值
我们把它画到一张图上去了
Yc0就是control group
在第0期的
outcome
Yc1是
它在第1期的outcome
那么同样Yt0
是treatment group
在第0期的outcome, Yt1
是它在
第1期的有政策的时候的outcome值
所以说这个地方又明确的给出了
Dc
就是control group的两期的差值
它就是time trend
那么Dt
是我们的一重差分
那么我们再用
Dt减去Dc把time trend减掉
剩下的就是 causal
effect
unbiased causal
effect
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM