当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.7 DID with multiple periods 2
那么我们来问一个问题
δτ,τ从+2到-2
δτ的含义是什么
数据的结构打开了
都解释清楚了,δτ的含义是什么
有同学愿意回答一下吗 你可以
打个弹幕
在聊天区里面都可以说
δτ的含义是什么
是不是δτ的τ
δτ的含义就是在第τ期
treatment group
跟control group的
差值
而且是控制了什么
控制了两个州的差异
控制了 common time trend之后
这两个州的
公司的这些数据的均值之差
对不对
也就是说是我们的 treatment
group
在τ这一期
跟control group
的差值
而且是控制了state effect
和 year effect
对不对
这个地方很微妙
因为我们只有两个州
只有两个 group
那么 year effect
这个年份跟τ的对应关系是完全一致的
因为我们只有一个州
有立法
的变化
那么而且就定义在92年
所以说τ的取值就只有一种
那么 year effect
其实就刻画了这两个州
在每一期之间的
time trend
所以说
前面这两个变量βs跟γt呢
就分别对等了
我们之前说的州的差异和timetrend
的共同趋势
那么这个时候
后面多期
每一期的系数恰好就等于在这一期
注意期不是年份
期就是τ
在这一期
treatment group
所有control group
样本的均值之差
*问了个问题
它是不是处理效应
它根据定义 根据刚才我们解释半天
它是不是就是处理效应
它确实处理效应 是不是
这是处理效应
这是两两两组多期模型里面
δ
的含义它就是在那一期的处理效应
大家想
因为
在例子里面它还没有政策发生
对不对
其实是帮我们来干什么
来去检验我们刚才说的 placebo
DID对不对
来去检验这个time trend
δ-1 跟δ-2是什么
它就是每一期的差值
是不是它就可以让我们来
看这个政策变化之后
它的短期跟长期
影响分别是不是一样的
它是影响不断扩大
还是在不断的缩小
对不对
就是多期模型带给我们的
这样的一个很好的分析
那么这就是一张形象的图
这个形象图在τ等于0这一期
它作为一个区分
那么我们来看后面的
这个是个原始数据
大家想如果我们控制的就是
这个差值是被谁控制的
这个差值是被β控制的
那么两组的 time
trend的差值
比如说我们在这一组
我们在做一个time trend的差值
大概是这样子的
那么这个差值
common time trend是被
year fix effect控制的
所以说δ
正好就是这一块
就是控制掉
两组的基线的差值
和 year fix effect之后
它们剩下的均值之差
τ的系数的
Dsτ的系数
有没有问题
有问题一定要提
后面比这个更复杂
没有问题
好
行
同学们我们现在来看什么
来看多组多期DID
刚才是什么
刚才只有两组还两个州
现在我们有多个州
比如说我们有10个州
这10个州
立法的时间是不一样的
比如说有的州是
90年立法
有的州是91年立法
有的州是92年立法
它们纷纷陆续的
发生了政策变迁
作为研究者
我们是不是希望把这些数据
都囊括到我们的分析里面
这样的话第一个样本量会变大
第二个我们的结论
它的外部效度会怎么样
外部效果就会很
很大 对不对
它就不是局限在两个州的范围内做推广了
做
结论的推广
我们所有囊括的州
它都可以推广
它就可以从两个州变成推广全国
所以说我们这就是为什么我们对多组模型
感兴趣的原因
那么
因为每个州它实行政策变迁的年份不一样
我们怎么样
对它进行统一的分析
这个还是要用到刚才说的
中心化的概念就是说
不论它政策是在哪一年发生的
我们把它做成中心化
我们以它政策发生当年
为τ等于0的这一期
那么这张图就非常形象的
刻画了这个也是某一年
我们同学画的这张图
年份太久
找不到源头了
大家来看一下
这个图就是红色三角是标出了政策发生的
那一年你看不同的州在不同的年份发生
绿色就是例子政策发生之前的
数据
黑色的圆点 lags
就政策发生之后的数据
好
那么这个是做中心化之前
我们的数据结构长成这个样子的
它的横轴是year
大家注意是年份
那么我们要做中心化
就是说我们根据每一个州实行政策的年份
我们把它重新画到这个τ等于0
如果你看比如说第一个州
第一个州是90年执行的政策
那么对于第一个州来讲
它的τ0就定义为90年
但是对于第三个州
它执行政策的年份是92年
所以对于第三个州的所有数据
我们把92年定义为τ0
这就是中心化
动画做错了
那么
中心化之后就变成这张图了
大家看一下
这张图是不是就
相当于坐标轴做了一个
做了一个转换
使得我们把每一个州
实行政策的当年好等于0那一年
我们把它给定义出来了
这个就非常好
那么
这个数据就变成这个样子了
当然这就会产生在某些年份
它有些数据是没有的
因为我们整个的数据库
里面只有5年的数据
当我们中心化为τ这个系统之后
就是期这个系统之后
有一些年份是没有的 没有关系
我们这还可以
来去综合使用
这就是中心化
中心化之后大家可以看到
是不是有的州它如果执行政策执行的早
比如说第一个州
那么
τ0我们有的一第一年的数据
它的 lags它就会有到τ-4
是吧
那么对于有些州比如说
第5个州
它是94年才执行的政策
那么它前面4年数据都是我们的例子
它的数据可以到τ几?到τ4
那么这就中心化之后的数据结构
我们来看一下具体的
还是我们把它放到这个表格里面来看
我们这些D
的定义是什么样子的
还是
这个时候 s
它就不是只有1和2了
还是可以有很多个
取值 比如说到10
那就是有10个州
那么这些州
至少要有的州它要
没有数
它要没有发生政策变迁才行
要有control group在里面
我们来看一下
ok这个数据结构就比之前要复杂一点
大家来看到复杂在哪
其实主要是β
βs就是s的取值可以更丰富
它除了可以取1和2之外
它可以取345678都可以
它有很多个州
它是陆续发生了政策的变迁
那么我们对应的 y值
我们也可以看到它是
这个也会更加的丰富
在 s的趋势上
但是
Dsτ的定义没有变化
Dsτ的定义就是说首先州
它所在的州是发生了政策变迁的
而且正好是在它
对应的τ的那一期
那么它在
值为1
其它情况赋值为0
刚才我们展示过了这个是一样的
因为
第三个州
它确实第三个州它也是在
92年发生了政策变迁
那么它的
D的赋值就是这样子
我们来给出这样的一个组合
4个州,大家看假设第4个州是93年发生政策
你看
第三个州是92年发展政策
所以它们对应的τ等于0
的这一期是不一样的
year跟τ的概念就不一样了
大家可以看到
year是自然年份
τ是政策发生
的
当期发生的某一期
它做了中心化 这就不一样了
这个没有问题吧
好
这个显然它是有一个对角线的这样的一个
一个结构的
那么我们的问题
就是说
还是δ0的含义是什么
不是δ0,δτ的含义是什么
大家注意这个时候δτ的含义
确实还是
在控制了
β
这个就是什么
就是州固定效应
控制了γ
是年份固定效应
之后
treatment group
跟control group
在τ等于某一个数值的这一期
它们的均值之差
这个没有问题
但是这里面的跟刚才的两组
多期模型的区别是什么
两组多期的模型
因为只有两组它 year fix
effect
τ的定义跟year定义是完全一致的
所以说 year fix effect就可以
来替代什么 common
time trend
但是大家想一下
在多组里面
因为每一个州实行政策的年份是不一样的
year fix effect
年份固定效应
是不是还能够
替代我们说的common time trend的估算
是不是不能了
对 是不能了
因为年份固定效应
它们中心化的中心点不一样
所以年份固定效应并不是τ等于0
跟τ等于1
之间的它们存在的
共同部分了
对不对
因为它中心化的点不一样
两个州之间
它只是一个宏观的
年份固定效应而已
所以这个时候
δ的含义
确实还是控制了年份固定效应
跟州固定效应之后
treatment跟control
groups
的均值之差
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM