当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.3 DID estimation 2
**说高考延迟对高考成绩的影响
这个问题可以想
这个是很好的一个例子
政策的变迁等等
给我们很多政策可以带来影响
那么高考延迟本身它影响了什么
具体的一些我们感兴趣的变量
你要把这个要再总结出来
要提炼出来 提炼出一个学术问题
而不是简单说这个政策
政策
它是影响了学生的被资助的额度
是不是
你说高考延迟影响的是什么
T'到T0这一段两条线需要平行吗
这个是需要平行的
大家注意到
我再解释一下T'
它
是不可
在这一点我们是没有观测数据的
因为这个政策发生
我们假设它是突然发生的
那么
在数轴上就被理解成是什么样
在数轴上被理解成它是一个点
这个点
在这个点上
我们没有先见之明
我们没有在这一个点上去采数据
比如说像断点这个位置的数据
跟这个位置的数据
我们是没有采这个数据的
没有先见之明
但是好在我们有什么
我们有年鉴
年度的统计数据
这个是我们
周期性的
按部就班的采集的数据
所以我们才会有T1
和T0
所以说在政策发生的瞬间
我们把它抽象为一个瞬间
在这个点上我们是没有数据的
我们只有T1和T0的数据
我们为什么会有T1和T0
不是因为我们对政策的变化有先见之明
而是因为我们在
routinely collect data
比如说大家都知道教育年鉴对吧
还有一些其它的年届
或者是一些普查数据
其实是这种性质的数据
那么使得在政策发生之后
我们回溯
然后这些数据
来做了分析
所以这个common time trend
它只能通过T0期和T1期
的数据估算出来
它没有
T'这个数据
**我不知道回答清楚没有
所以说显然
我们当然要假设
T'到T0它是需要平行的
因为
我们要求它是整体
平均上是平行的
而不是它是某一个小阶段是平行的
它某个条件的平行我们也估算不出来
没有那个数据
老师我觉得T'到T0
这一段它可以不平行
就是说它如果不平行的话
我
那么我们也能观测到数据
是能观测到数据
但是你想如果是
你的麦克不要关
你这问题很好
假设不平行 咱们来画一条线
我们来
换个颜色
假设
T'到T0
就是这个数据变成这个样子好不好
不是老师
我是觉得 Dt和Dc
它可能老师我画一条线
我觉得它可能是这样一个状态
你来画
我换一个颜色
我觉得它可能这个样子也是可以的
我们也能算出来的
就是说我觉得对这个题来说
这个政策可能它会造成
一个跃迁跳跃的影响
然后比如说广告一些
别的政策
它可能是一个连续的变化的过程
就是说不一定这点是断的
我是这么想的
你是说效应它的发生的过程是多长是吧
也不是多长
差不多这个意思
但是我的意思就是觉得在T'这个点上
在对实验组来说
它可能不是这样一个跳跃的过程
它可能也是这样连着
但是它的程度会慢慢降低
比如说一说是广告政策影响
它不会说这个广告政策一下停止实行
它马上销量就会减少
它会有一个慢慢的过程
然后我觉得这个过程就可能
跟这条线就不是平行的
对你说的这个是有道理的
就是你说的这种就是说效应
它是take time
它需要一段时间才能够
充分的发挥出效应的大小
那么这个线你画一个不平行的可以
但是假设就是说如果没有这样的一个政策
的影响
那么treatment跟control这
两组人他们time trend是不是一致
它们还是要一致的
好的 谢谢老师
就是说红色的虚线这个图
里面本来有红色的虚线
变化的时候
这两组人它们处理的还是要平行的
还是要一样的
这一点的假设是不会变的
当然你讨论的问题是说这个政策
到底是瞬间发生了效应
还是花了一段时间才能够充分发挥出效应
这个都是可以的
这也不是我纠结的点
在T'到T0这段我是
觉得是可以不平行的
如果这个点连的话
如果它们是在没有跃迁的话
那么它是可以不平行的
对
它是可以不平行
就是它不平行
它不平行
就是说政策的效应到底是怎么发生的
是瞬间的一个跃迁发生的
还是说它是慢慢的像你说的广告
它有一个时间段然后发生的
是不是这个样子
还是政策的变化之后
它的效应到底是一种什么样
的时间机制来发生的
是不是
是
对 这个是可以的
取决于具体的政策
它确实是这个样子的
但是假设是不变的
就是我们要的平行
其实是说的这个是它的
跟control group
的时间趋势
是一样的
就是说如果没有政策的变化
比如说这个广告它一直存在没有撤销
那么这两组人它
的比如说消费的情况
它整体的时间趋势是一样的
它都受宏观的比如说经济的影响是吧
这个时间趋势还是不能变的
你说的是政策发生的需要
的时间长短的问题
这个都是ok
各种图都可以来画
好的 我明白了
谢谢老师
这个回答清楚了吗
清楚了
清楚了 好好这个问题很好
对
因为我们举的这个例子
正好它政策发生是很
这个是立竿见影就会有一个效应
但是方青问的就是另外一种情况
这是ok的 没有问题
好 这个问题很好
好
那么这张表相信大家也都比较熟悉了
我们就是把刚才的分析用一个
表格的形式来展现出来
大家可以注意到
我们对DID的估算用了三种方法
一个是图示法
第二个是表格
表格就是说做这种简单的均值比较
第三种当然是回归
所以这三种方法你要能够
非常好的去有一个对应
和熟练的一个切换和使用
这个也是跟刚才是一样的
那么我们两重差分
第一重差分我们
分别用Δty
和ΔYt和ΔYc来去表示
那么ΔYc当然是 time
trend
那么做第二重差分
ΔYt减去ΔYc
我们的 DID它就是我们
要的这样的一个
treatment effect
好
我们来看一下 DID的回归的形式
那么这个也就是下面这个
回归方程里面写的
一个是我们历史的情况
包括这几个重要变量
第一个就是父亲是否去世
这个其实是我们的什么变量
来定义了我们的treatment group
显然
父亲去世这个哑变量
如果它等于1的话
是我们的treatment group
它符合接受资助的条件
如果它等于0的话就是control
group
因为它不符合接受资助的条件
offer是一个时间变量
offer就是说是不是
提供了这样的一个资助的政策
offer=1就是
刚才我们定义的T1
第一期
offer=0
T0期,没有这个政策
那么以及这两个变量的交叉相乘
我们把它写成一个一般的形式
下面括号里面这种形式
这种形式
那么D来定义treatment
group跟control
group
小t它就是时间变量
t等于1和t等于0
那么t跟D相乘是交叉项
那么这里面就产生了4个待估参数
α β
γ
δ
那么当然还有残差
这个就是这样的一个回归形式
当然了我们写成回归形式
我们可以看到说这4个待估
参数系数跟前面的
双重差分里面所产生的
几种均值之差
它们是有一个对应关系的
我们带我们来看
这个regression本身它当然
还有一个优势就是可以加入什么
加入控制变量协变量
那么使得我们的残差可以进一步减小
增加我们的什么
增加我的power
statistic power
当然这些协变量
它必须是哪一期的
它必须是
更早的就是说在时间顺序上它
是最早的这样的一些变量
它不能是
政策变化之后的这样的一些变量
那么我们在这里就不讨论
控制变量的问题了
好
那么
我们来发送这道题
这个题很简单
在这个表格里面填入
每一个空格 我们剩下3个空
4个,5个空格
在这5个空格里面来填入
对应的αβγ和
δ的值分别是什么
就是说剩下的
5个空格
它其实都对应了什么
都对应了这4个参数的线性组合
请大家
把
因为E
T t 0 T t 1
Yc0和Yc1的值
它的期望值其实都可以带入
上述的回归公式
把
这几个自变量它的取值就是
0和1,共4种情况组合
那么分别带入上面这个公式
把
4个条4个期望值
把它给写出来
写出来之后把它的一重差分和二中差分
分别再写出来
填到这个表里面
就是这道题
那么这个
跟刚才**写的是一样的
把ε去掉就可以了
那么
这里最重点的是什么
就是大家要熟练的知道α
βγ和δ
这4个参数的它的实际的含义
那么我们很快的过一下这个α是什么
α在这儿对不对
它其实是
control group
第0期的期望值均值
这个就是α
那么
β是什么
β在这儿是不是
β大家看到是 Yt0减去Yc0
也就是在第0期
在第0期treatment
group跟control
group的差值
是不是它们这两组
人平均的差异是什么
β来去刻画的
正好β大家可以看到就是D的系数
那么D就是来去标识treatment
跟control
group的这样的一个
哑变量
δ
Sorry γ
γ是什么
γ就是我们刚才说的 time
trend是不是
它
control group
第1期跟第0期的
期望的差值它是time trend
δ
δ正好就是我们的 DID
I双重差分的结果
那么它就是
两个dummy
交叉项的系数
所以说这个对应关系大家
要特别熟练的掌握
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM