当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.5 Assumptions of DID 2
那么第三种方法跟第二种很类似
唯一的区别
我们是不是对y
做一个placebo的
一个DID
而是对谁
对
控制变量协变量x大家可以
看到在回归方程里面
方程的右边跟DID是完全一样的
左边把 y换成了x
x是什么
x是对y outcome
有显著影响的
在理论上有重要影响的这些自变量
它并不是我们的感兴趣的变量
我们感兴趣的是谁
我们感性的是
D,t以及D和t的交叉项
这是我们感兴趣的
但是
除去除此之外
肯定有很多的协变量
对y都有影响
那么大家想在政策发生的
这两期从第0期
到
政策发生之后的一期
那么在此之间
如果这些协变量
它们的变化趋势
是一致的
就是control group跟
treatment group
在这些协变量上的变化趋势是一致的
而这些协变量
又都显著的影响着y
那么是不是我们就更有可能去推测说
y的 time trend
也是一致的
对不对
因为这个政策影响的是谁
政策只是直接影响y
这个政策它并不去影响这些协变量
比如说如果y是GDP的话
影响GDP的因素有很多是吧
投资
人口等等各方面的这种因素
都会影响我们的GDP
那么这些因素
它并不会受我们的政策变迁的影响
假设
那么这个时候如果这些x
它在这两期之间的time trend是一致的
那么是不是我们就可以
有信心更有信心的去说
如果没有政策的变迁
那么可以treatment跟
control group
它们的y的变化趋势也是一致的
这也是一种佐证一种推断
是不是
但是它也给了我们更强的信心
那么大家看到右边这张图
这个表
做了这样一组分析
把每一个x
分别跑一个placebo DID
用的就是政策发生前和后的数据
跟我们DID用的时间的
时间的 period
区间的数据是一样的
它不是用前一期的数据
而是用这个政策发生当期
前后两这两期的数据
但是分别就跑多个回归
对每一个x
都跑一个回归
然后来看它的系数δ
是不是显著的区别于0
当然我们希望它不显著的话
就说明这些x在政策发生
前后
它的 time trend是一致的
我们就来看
那么整体来看它确实是不显著的
小括号里的是标准误
那么我们一看它 t检验都不可能通过
这个是不是就给我们更强的一个信心说
它们真的是一致的
这个就是第三种方法检验
所以说大家如果自己要去拿到
数据来跑一个DID的话
你这三种方法都要去使用一下
报出来结果都是非常
令人满意的
这个时候就没有人能够再去反驳你了
有没有问题
好 没有问题的话
我们后面就开始讲多期了
多期
这一块是
很重要的
并且预习的时候没有让大家去涉及
所以说我们后面开始讲重点了
我们为什么要考虑多期模型
我们先说两组人
它有多期数据
那么多期模型是有很多好处的
首先我们有政策发生
假设我们以政策发生这期为0的话
那么政策发生之前我们有多期的话
大家可以看到我们是不是可以做
common time trend的检验
那么政策发生之后
如果我们也有多期的话
我们是不是就可以
来去检验这一个政策它的长期效应
是吧
比如说它对第一期是
是什么。这个期是什么决定的呢
其实我们采集数据的周期做决定的
如果我们每一年采一次数据
每一期就是一年是吧
如果我们是每个月采一次数据
这个期就是一个月
这个是我们的
常规的数据采集周期决定的
那么
当我们这个政策它可能产生短期影响
也可能产生长期影响的时候
我们有多期数据就可以把
这种长期的影响把它给
刻画出来
好好
我们有同学问前面的问题
**是说
这三种方法
是先用
还是后用
用的
但是我们在讲课的时候先讲
主要的模型的set up
然后再来补充说这些trend
这些检验
都要用
包括大家如果写论文的话
论文的布局也是说先报告主要的结果
然后再把这些assumption
的 check的结果一个
的在后面补充报告出来
**问这三种检验方法的
结果有没有可能不一致
有可能不一致
如果不一致就非常的
尴尬
我们希望结果是一致的
如果这个不一致的话
真的有可能它就
就是说假设是违背的
这个时候我们就不能用DID了
这是一个致命的
致命的一个问题
只有一种通过
这个问题很复杂
就是说大家想你要做DID的时候
最重要的假设
那三个假设都很重要
你要去穷举它
但是我们的作者
经常没有穷举它
这个问题是非常严重的
如果你没有穷举的话
我之前
看到过一篇文章
它是做什么 它是做国内
说
我想想是改革开放前后可能是有一个
有一个新的什么教育政策
那么这些教育政策率先在某些省实施了
在某些省没有实施
那么它就认为这是一个DID
那么就采集的各个省的数据来去看
发现确实实施政策之后
比如说是跟高等教育相关的一个政策
实施这个政策之后
当地的经济发展水平确实提高了
因此它想说什么
就是说教育是能够促进当地
区域的经济发展的
它做了这样的一个自然实验
听上去非常的漂亮
但是
显然它忽略了另外一个政策
就是改革开放正好
高等教育的政策的实施
跟改革开放的年份
是基本重合的
都是在78年79年左右
因为那个时候正好是改革开放
所以说其实是一股脑的很多政策都实施了
而改革开放
显然是在东部沿海地区率先开展
而且效果非常好
那么它这个政策的结论也是说
在这些东部沿海的省份
那么
它的
政策的效果就非常好
高等教育的改革的政策的效果就非常好
那么在一些中部地区
或者是偏西部一点的地区
它教高等教育政策的效果
就不好
因此它就说这是高等教育
带来了
这样的一个经济的发展
但显然这个里面它就是直接忽略了
改革开放本身最大的宏观政策
它也是率先在东部沿海开始的
所以
当
没有把当期所有的政策都排查
没有去排查穷尽这些政策的时候
这个结论直接
不存在的
但是它就讲出这样的一个故事
所以
如果我们非常严谨的去拿
比如说GDP
以及相关的这些变量
包括自变量
不过投资肯定也是东部沿海
它的投资要高于内地是吧
如果拿这些去检验
它们肯定是不通过的
对不对
所以说你如果真的发现不通过的时候
它往往真的是有问题
虽然我们刚才讲它不是一个证明的关系
只是一个支持的关系
有一个证据支持的某种结论
是一个推断
但是
往往它还真的是有问题
好 我们休息5分钟
假设在 DID里面是最重要的
DID
它其实特别的好用
RCT的话
我们作为一个独立的单个的研究者
想做个RCT真的很多时候是不容易的
你得去
设计
还得去找到这样的组织和机构愿意配合你
还要花很多的人力和财力
还要等待
但是
作为 natural
experiment
它是自然发生的
而且我们很多时候是在回溯历史,历史上
发生了什么事情
比如说刚才举的例子改革开放的时候
或者说是
比如说
我们研究一些教师教育,教师证
它可能在比如说过去有师专对不对
后来就有变化 包括最近
这些教育改革对吧
促进教育公平的一些改革等等
这些政策的变迁它是非常多的
那么它就给我们提供了一个天然的实验的
机会
这是第一点
第二点数据很好获得
因为这个都是宏观政策
这个数据从年鉴里面就可以拿
第三个有什么好处
就是中国呢
往往是在某一个区域先进行试点改革
有一些区域没改
这个时候就天然的形成了
treatment跟control
group
而且我们只要拿到这个区域的这些年鉴
比如说县志
我看最近很多国外学者跟国内学者合作
就去拿县志,到各个地各个县里面
把它的县志里面的年鉴数据扒出来
就能够把
把政策变迁前后的数据都找到
然后就可以
就可以来做分析
这个是大家你们
做个研究生其实都可以去尝试
但是这里面最重要的问题是什么
它是不是符合假设
我们那三条假设都很重要
而且大家想如果是前两个假设不满足的话
第三个假设是一定不满足的
它们出现的肯定就不是一个相等的
所以这些都是大家要谨慎的
你会看到近5年里面拿中国的政策变迁和
宏观数据做的英文论文是越来越多了
大家可以去搜一下
好 我们接着讲课
用来检验的covariance
会用来进行DID的回归吗
可以的
但是你只能放入就是第零期的covariates
因为这些covariates这些协变量
它是不是也有第一期的协变量
第零期的协变量跟第一期的协变量
第一期就是跟outcome的这个y1
它是同一期的了 我们不能用
我们只能用
第0期的协变量
x0是可以放进去的
但是x1是不能放进去的
因为x1它是跟outcome是同一期
前后因果倒置了
这是**的问题
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM