当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.8 DDD
这个是再简单的总结一下
那么这个是
多期多组
DID
这样的一个一般形式
我们刚才
具体剖析了D的定义
因为这个D是我们最感兴趣的变量
就是我们定义好的
它其实是一个交互项
它的系数的含义我们刚才进行探讨
相信有些同学并没有
完全想清楚
那么我们希望大家在后面的小组讨论里面
包括答疑
我们继续探讨
*的问题
我们待会再讨论
如果有时间的话
那么这个也是咱们书上的这样的一个例子
它把
在多期多组的情况下
每一期 year of
adoption就τ等于0的这
一期了
那么每一期
δ的系数以及它的95%置信区间
都会刻画出来
那么
黄色的方框里面它就是例子
好 它的例子
政策发生之前的
它两组人的差值,treatment跟control 的差值
这个绿色就是lags
政策发生之后
那么
treatment跟
control的差值
这个定义是没有问题的
这里面很有意思的一个问题是什么呢
大家可以看到紫色的虚线
它是从政策发生之前一期
两组的差值是0
到政策发生的当期
两组的差值它其实已经不是0了
虽然它
95%的置信区间
还是囊括了0的值本身不显着的区别于0
但是它本身它就提高了
被我们解读 为什么呢
在这个政策研究里面
我们把它解读为这个就是溢出
也就是说
虽然是在第零期要立法
但是立法的消息
虽然我们假设它是
不应该被提前预测到的
但是可能因为前立法之前有一些舆论
有一些讨论
等等
那么可能在立法的当期之前
一期
已经开始有人预测到会有这样的一个立法
那么它们的行为就会根据它的预测
开始发生一些变化
那么这个叫在这个情况叫
spillover
政策期望
对
是一个意思
很好
好 这个就是一个事例
所以多期的模型
第一个刚才我们讲过了
它可以帮我们来检查
政策发生之前shock
之前的 time
trend
它可以让我们看到长期效应
那么包括检验 spillover
effect
都是可以的
这个是多期模型
那么这个是我们关于多期模型的讨论
后面有问题大家再问
接下来我们讨论的情况也很重要
就是说
如果我们 common
time trend的假设不满足怎么办
这张图呢
它们出现的不满足的情况
大家可以看到control
group的
这条曲线
跟treatment group
它所暗含的time trend
它有一个夹角
它不再平行了
这种情况下
我们做DID就是有偏的估计
我们应该怎么去解决这个问题
那么我们先说DDD
三重差分
三重差分
它提的问题就是 time trend
不再一致的这样的一个
是如果我们能够把tiem trend的不一致
的这一部分也能估算出来
我们叫它小DID
我们
其实就可以
来去怎么样,来去做差
之前大的DID它包括两部分
一部分是time trend不一致的那一部分
还有一部分是真正的policy
effect
如果我们用小DID估算出了
time trned不一致的那一部分
我们把它减掉
那么这个就是我们的一个无偏的估计
因为是做了三重差分
我们就是DDD
那么怎么样能够把小的DID估算出来呢
我们要找的是 unaffected
sector
不受政策影响的 sector
那么我们来看这个例子
看这个例子
那么这个例子跟刚才很类似
这个例子再说
这个也是保护劳动者的权益
那么就是说
妇女在怀孕生产期间
它的工资包括它的供应状态
不能改变
那么这个是一个法案
那么这个法案
也是在某一些州
率先执行
有些中
它一直没有执行
那么大家想一下受法案影响的
是哪样的人群
基本上可以被定义为
年龄在20~40岁的已婚妇女人群
它会受到法案的影响
显然比如说男性就不受法案的影响
是不是
或者是未婚或者是40岁以上
基本上也不受法案的影响
因为它受影响人群是这一个
那么我们
有三个州
是treatment 它们
率先实行了法案
它附近的5个州被认为经济宏观经济形势
差不多
产业结构可能也差不多
被选为 control group
这个是一个
一个 set up
所以写1和2就写清楚了
treatment state跟
control state分别是
什么
受影响的人群就是年龄在20
到40岁之间的已婚女性
40岁以上的女性和
它用的是single
男性单身男性
24~40之间的这两个人群
都是unaffected
它不受政策的影响
那么这个政策发生的年份是76年的话
before
它选了两年 用两年的数据
这样样本量大一点
这个after是77 78年
那么大家来看这是一个示意图
红色的是受政策影响的人群
treatment跟control
两组人在before after
它的 outcome的变化
那么蓝色是unaffected
group
它 treatment
跟control
treatment指的是州
不是指人群
人群是affected和
anaffected来定义的
那么它的变化
那么
我们可以看到
确实
1和2之间的差值跟3和4之间的差值
它不是相等的
蓝色的虚线
其实是三四之间的平行平行的这条线段
也就说要有个差值在这里
那么这个就构成小的DID
也就是说对于没有受政策影响的人群
那么在treatment州跟control州
它们在这个政策发生前后
time trend也不一致
这个不一致我们可以跑一个DID
就把差值给跑出来了
这个差值并不是政策的效应
因为
这个人群根本不受政策的影响
而是这两组州,treatemnt州跟
control州这两组州
它们的
time trend整体的不一致的
这一部分叫小的DID
那么当然同样我们可以对红色的这4个点
也跑一个DID这是大的DID
你大的DID里面就包括政策的效应
还有就是这两组粥
它的
time trend不一致的那一部分
刚才都说过了这个理念了
那么用大的DID减去小的DID呢
就是我们的三重差分DDD
它就是对我们的政策产生效应的一个
无偏估计
这个有没有问题大家
没有问题
好
那么我们当然就可以用这样的一张图
用这样的一个表来去解释
那么这个里面
相当于
我们加了一个 affected
group
和I affected group
是这么来加的
这个是treatment州
1减0就是第一期减去第零期
这已经是做了一重查分了
这是others
1减0
那么这个是不受影响的人群
我们也可以做DID
就是在treatment这些州
里面不受影响的人群
第一期跟第零期的差值
是什么
这个是
控制州1减0差值是什么
这已经是一重差分了
然后我们可以得出两二重差分DD
那么不论是横着减还是竖减都能得出来
它的含义当然是不一样的
但是都可以解释
然后我们用
横着竖着都可以
用大的DID减去小的DID就是DDD
但你这么减也行
你大的DID减去小的DID
也是DDD
就跟刚才那个表
是一样的一个逻辑
有没有问题
好 没有问题的话
我们来看
这是刚才说的这4个differences,4个一重差分
最初的那4个空格里面的
值刚才已经解释过了
这是4个一重差分
每两个一重差分做差
双重差分
那么
大的DID跟小的DID
这个
均值比较
t检验就可以来做这个事情
那么这两个两重差分再做差
就是三重差分
你跟刚才是一样的
所以我们刚才分别用
用这个图表的形式和用均值比较的形式
分别给大家
解释了一遍
那么这个是回归结果
这是
这个论文里面
两重差分
跟三重差分的值分别是多少
这个
我们可以用均值比较来计算的
同样我们来看回归方程
这个里面我们就多引入了一个dummy
除了我们的
这里换了一下形式
这个z
是州,treatment州还是control州
t还是时间
这个是t等于1跟t等于0
我们加了一个人群就是affected
affect=1就是受政策影响的人群
affected=0就是
不受政策影响的人群
现在我们的回归方程里面就有三个
哑变量
那么作为三重差分
大家可以看到
在回归里面我们要先放入这三个哑变量
然后
放入这三个哑变量的两两交互相
两两交互项
一共三个
然后再放入这三个哑变量
连乘的项
那么这个
就是三重差分的回归方程
它的dummy的
搭配的组合是什么样子的
好
那么
同样我们现在做一个练习
请大家
在刚才解释的表格里面
对照
我们的回归方程
分别把
一共9个空格
它的参数的线性组合分别是什么吗
写出来
你就能够发现
我们要的 DDD就是之前的均
值比较的 DDD三重差分
在回归方程里面对应的是
哪个参数
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM