当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.12 ATE and LATE
ATE跟 LATE的问题
local average treatment effec
大家都知道了
整个population上面 treatment
它的平均处理效应是多大
这个我们本来是想关注的想去求解的这样的一个目标
那么工具变量法给我们的估算结果虽然是无偏的
但是它并不是我们之前想要的ATE
而是局部的平均处理效应
我们叫LATE
为什么
大家来看一下
你们这个图这时候就不太形象了
我们来讨论刚才那个例子
Angrist
他用了美国的法律和学生的出生的生日的季度
这两个构成工具变量来去估算schooling对于
未来工资的影响
这个例子大家想一下
是不是所有的学生第一
是不是所有的学生都想在高中阶段辍学
第二
这么讲吧
就是说是不是所有的学生他辍学的决定都受到他出生季度
的影响
这么问刚才就不要管了
是不是所有的学生他们的辍学的决定
或者他决定什么时候结束它的教育经历开始工作
他这个决定是不是所有的学生都受到出生季度的影响不是
对不对
大家都有这个反应
你看在美国什么样的孩子
它辍学的决定会受到法律的影响
肯定是说他迫不及待的在高中1~16岁周岁过了生日
他想辍学的这种人
是不是
但是还有很多孩子他可能早就树立的目标是要上大学的
上了大学还要读研究生
对不对
对于那样的学生
是不是他过不过16岁周岁生日
对于他辍学这个决定
或者对他结束他的受教育经历这个决定是没有影响的
我们再看哪样的孩子会迫迫不及待的在16岁一过周岁
生日一过就要辍学
是不是往往是在美国来讲是属于
disadvantaged student
弱势群体往往是什么样的学生
比如说在大城市里面
就属于urban school这种城市
学校里面
往往可能是一些黑人西班牙裔
那么从小父母不管
然后整天玩打架
吸毒
就是这样的人
迫不及待的想到16周岁一过就要辍学
其实往往是这样的人
那么可见就是这个工具变量z大家可以看到这张图
z对x的解释也并不是z并不能解释所有的x
variation
就像我们刚才说的这个工具变量它只能去解释
比如说disadvantaged student
他的辍学的决定
对不对
那么它对于那些教育期望更高的
或者本身家庭条件更好的
那么他们本来就想去读完高中
甚至是读一个大学才去工作的
这样的学生来讲
z是解释不了那些人的variation的
是不是
也就是说当我们用z估算出来的x hat再去解释y的
时候
是不是我们得到的这样的一个 schooling
对于工资的影响是针对disadvantaged
student
也就是x能受到z影响的这一部分人
那么他的schooling的年限长短
对于他未来工资的影响
我说清楚了吧
有没有问题
所以这个时候我们得出的β虽然是一个无偏估计
渐进无偏估计
但是它的含义变了
它并不是说多上一年学
尤其是在高中阶段多上一年学
它对于所有人来讲
包括未来会上大学的这些人来讲
它的工资的影响
而是专门针对disadvantaged
student
是不是
当然讲了LATE跟ATE它相不相等
这个问题是不是就很像刚才我问大家的ATT跟ATE是不是相等的
问题
是不是
因为它可以相等
它也可以不相等
它取决于不同的人群
就受影响的人群
那么它在面临同样这一treatment的时候
它的收益 benefit到底是不是一样的问题
这个要现实来决定的
是不是
那么可能对于假设对于能力比较差的学生
或者是家庭比较弱势的学生
可能多上一年学
对于他们未来工资的影响可能是更大的
那么对于本来成绩就很好
或者是家庭条件也比较好的学生
那么可能高中阶段上课时间学
那么他直接去工作影响可能会小
假设咱也可能反过来
也就是说这两个人群的特质
决定了他们面对同样的treatment
他们的benfit的可能是不一样的
但也可能是一样
对
如果你有这个变量的话
你是可以加进去的
但是disadvantaged是不是只是其中一个因素
还有其它因素
我们不知道,在这样的一个模型 setup里面
我们解拿这个例子来解解释就是说工具变量z它一定不
可能解释所有的 x的variation
这点是肯定的
因为只有黄色阴影面积才是z可以解释的
是不是
那么也就是说这就是local的意思
就是局部的意思
好
总有z解释不了的东西
那么这些东西它就没有办法在我们第二步的回归估计里面
用上所以说在我们的最后的结果里面
β的含义它就不是一个ATE的概念
不是对于整个population所有的人来讲
x对于y的影响
而是对于局部的这样的一个概念
只对因为出生季度不一样
对
这个算是一个暗含条件
但是你也可以反过来讲就是说这个工具变量它确实只能
解释这些东西
它解释不了其它的
包括我们之前说的 distance也是一样的
你看哪些学生他上大学的决定会受他家庭离它最近的大学
的距离的影响
肯定是motivation比较弱的人
对不对
像我们中国的孩子
大学在另外一个城市飞也飞过去了
我也要上大学
是不是
但在美国就不是这样
他们爱上不上
那么离得近方便了再上一上
所以说但是美国也有这种孩子
他也是会有很强的教育期望和教育的
motivation
那么非常ambitious
他也会到其它的州去上大学
是不是也有这样的人
所以distance这个工具变量也不可能解释所有的
decision
那么就是这个意思
它不是暗含的假定
而是说工具变量是有限的
它能解释的 variation是有限的
我们要清楚的知道它的有限性在哪里
这样的话我们对于我们估算出来的渐进无偏的工具变量的
估计
它的含义到底是什么
我们要很清楚
这个我讲我们做定量模型
一定要清楚我们最后回归出来的东西是个啥
你要能解释清楚
它其实不是ATE它是一个local的局部的平均处理
效应
我的point在这儿
同学们
你要是有想讨论的
你可以打开麦克说
我不知道*跟*你们俩的问题我回答清楚没有
我想问一下是不是不同的工具变量就有不同的local那种
感觉
你说的非常对
*
你学明白了
当然了不同的工具变量它解释的x的variation
的侧重点不一样
当然它的local 的性质就不一样了
你要能解释清楚每一种local到底local在哪
它是局部在哪
也就是说这个工具变量能够解释x哪一部分
variation
是不是
对这个很形象的
我们其实都是一种很形象的方法
但你是抠不出来这个人的
你抠不出来这个样本
它只是从variation的角度来解释
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM