当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.4 Assumptions of DID 1
那么
这还是刚才那张图
只不过这张图上我们把什么给标上了
我们把所有的待估参数把它标上了
大家回去可以自己去对应去看
这个应该问题不大
跟刚才那张图是一样的
那么这个就是
我们跑出来的回归系数的表格
作者把第一重差分
和第二重差分分别都
把它给标在这里了
这个也没有什么问题
我们来看
这个是我们刚才提到的
DID的
几个重要的假设
前两个假设
我们是
第一个假设我们只能去argue
我们就是argue说它为什么是一个外生的
第二个我们可以穷尽
这一段时间
发生的所有政策的变化
这个是我们可以去穷尽的
因为政策它都是公开透明的
都有文件发布
那么第三个是我们这里要讨论的重点
它是可以通过统计的方法
进行一些检验的
time trend大家可以看到
我们前面所有的估算都
依赖于非常强的假设
是不是成立呢
就不清楚
我们如果不能对它做出一定的检验的话
这个就很难确保我们的
估算是一个无偏估计
那么如果 time trend
它并不是一致的
会给我们造成什么样的偏误我们来看
还是刚才这个图
只不过我们换了一种情况
我们把它这个时间顺序写正了
然后
教科书式的这么一张图
它是一个上升的这样的趋势
那么其实我们的假设是什么
我们假设是 treatment
group
跟control group它有同样的时间趋势
那么treatment group
的时间趋势我们是看不到的
因为它是这条虚线
加上了叠加了
policy的 effect
变成了这条红线
红线是我们能观测的
蓝色的虚线是我们观测不到的
所以我们用蓝色的实线
来去估算蓝色的虚线
从而得出
我们要的这一块
这个是刚才我们
提到的这些
但
但是
如果这两组的time trend本来就不一致
因为它们这两组
它们的宏观的这样的一个形式
或它们本质就不一样
这个是我们
待估的δ
但是如果实际上
treatment group
的 time
trend实际上是黑色的虚线
黑色的虚线显然跟蓝色的实线是不平行的
也就是说
treatment group跟control group
如果都没有这个政策
出现
它们的time trend本来就不一样
这个时候
大家想一下
实际的
policy effect应该是
红色的这一段是不是就是红色的虚线
Sorry
用红色的实线减去
黑色的虚线
这个才是真正的 treatment
effect
但是我们错误的用
蓝色的虚线
来代表 time trend
那么我们是不是就产生了一段偏误
bias显然就是这一块
对不对
这一块就是两组
两种人
time trend的差值
bias
那么如果出现这种情况
我们之前的dId的估算它就是有偏的
这
不能用了
因此我们要来去检验
time trend
常用的检验common time
trend的假设的方法
有三种
第一个是画图
第二个是 placebo DID
on outcome
variable
第三个就是placebo的DID
on key covariates
我们一个一个来看一下
第一个就是画图 就是我们肉眼看
比如说我们有多期的数据
虽然我们的感兴趣的点
假设是95年到97年
但是我们有多期数据
我们有一个
我们就可以画图
如果看肉眼看这张图
这两组人它们整体的宏观的时间趋势
是比较一致的
比如说在波动中都有下降等等这样子
我们就会相对来说比较放心
这个是
第一种方法
但是它并不严谨
但它就是比较可视化
第二种是一个placebo
DID大家来看这张图
这张图它
跟我们刚才那张图相比是不一样的
这个地方我们又引入了三期的概念
也就是说
t等于0是
政策没有发生的时候
那么t等于-1
我们定义为政策发生以后
那么政策发生在什么时间段呢
政策发生在0跟-1之间的某一个时间点
那么我们观测到的数据是t等于
0跟t等于-1的时刻
那么
显然我们在这一段数据里面
我们来跑DID
那么其实我们是在做这样的一个
treatment effect
这样的一个识别
这个是没有问题的
但是我们并不知道我们的
假设也就是绿色的虚线
它是不是真的跟绿色的实线是平行的
这两组人的time trend是不是一致
我们不知道
那么我们可以做一个什么事情呢
假设我们还有
t等于就是在政策发生之前一期的数据
如果我们也有的话
这个叫t+1
为什么这样来叫
因为在英语里面
在政策发生之前的这一期我们叫lead
那么
这个政策发生之后叫lag
那么所以说lag听上去
就跟负号是有关系的,lead
就跟正好是更加的
有连接的
所以我们在表示上就会这样来表示
大家想一下
从
我把它都打出来
从
t+1期
到t0期
那么这一期实际上没有政策发生
对不对
政策是发生在 t0
和 t等于-1这两期之间的
所以从t+1期到t0期之间
它们这个变化趋势就只有什么
就只有 common
只有 time trend
只有time trend是吧
那么也就是说这
这一期之间的红色的这条线跟绿色这条线
它们的变化就应该都是它们
那么我们是不是
可以假装就在这一期上
如果有这个政策发生或者说
time trend不一致的话
我们其实也是可以跑一个
DID的这个式子就在这
这个式子
大家想
说到底事实上
交互项的系数δ
它其实就是这两种人
在控制了
初期的差异β之后
time trend的差异
comment一项被γ
所刻画了
初始的这两组人之间的差异
是被它刻画了
所以δ刻画的是什么呢
它其实就是在
在控制这两个差异之后
如果它们处理的还有差异
其实就是被δ刻画出来了
是不是
当然我们在之前的假设情况下
我们就认为δ它就是
treatment effect
那么在
t
正1期到0期之间
如果
δ
估算值
没有显著的区别于0
我们是不是就可以认为
它们的时间趋势是一致的
因为它们共同的时间趋势在γ这里
δ
刻画的是时间趋势的差值
说白了是吧
那么如果它不显著地
区别于0的话
那么我们就认为
这两组人
他在
t等于正1期到t等于0
这一期之间它们的time trend是一致的
那么如果δ正1这个
参数它显著的区别于0
那么就说明这两组人在这两期之间
的他们time trend是不一致的
不一致的这一部分
就是被δ正1
参数
给刻画出来了
对不对
所以说这个就是一个placebo
DID那么我们在这两期
来跑
来去检验政策发生之前的一期这
两组人的time trend是不是一致
这个是完全可以检验的
只要有数据就可以了
那么大家想一下
如果在政策发生之前的一期
这两组人的time trend是一致的
是不是我们就有更强的信心
认为
在政策发生的当期从t0
到从t=0到t=-1
这一期
time trend
也更可能一致
其实我们做了这样的一个
推测
但是从逻辑上讲大家想一下
如果我们只知道
前一期的time trend一致
我们能不能严格的推导出
它在政策发生的这一期
time trend也是一致
能推导出来吗
****也问了这个问题
是不是
我们其实是推导不出来的 是不是
对
也就是说前面一期一致
那是前一期的事
当期是不是一致
我们不能用前期的数据来去证明
当期的政策发生当期的time trend
所以说这种方法只是什么
只是一个佐证
前期一致是不是更加增强了我们的一些
信心或者是argument的
证据
来说当期更可能是一致是吧
它只能是一个佐证 同学们
但是即便是佐证它也是有意义的
因为它确实稍微增强了一些我们的信心
Ok那么
这个图就是在
有多期数据的情况下
我们来看
那么它的这样的一个就是政策
发生之前的这样的一个变化
红线是0
这个曲线是它的
差值
就是我们所谓的δ
那么这个竖线当然就是95%
的置信区间是吧
只要0
这条红线落在它的置信区间里面
是不是就认为差值并没有显著的区别点
我们就用这种方式来去看
就是它
政策发生之前的多期
如果它的trend
的差值
都没有显著的区别于0
那么我们就
有一个更强的信心说
它在政策发生当期以及以后
我们估算那段DID
time trend也更可能是
一致的
这个是这样的一个方法
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM