当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.4 Idea of IV 1
我们看怎么解决这个问题
那么这个时候我们就开始讨论工具变量的问题
好
什么是工具变量
这是之前的问题放在这儿
大家想我们感兴趣的比如说schooling
schooling
这个连续变量受教育年限
我们特别感兴趣
多上一年学
到底对于未来工资有没有影响
假设我们关心的就是固定变量
但是固定这个变量显然又跟残差是相关的
因为刚才解释了ability不可观测,在残差里面
那么这个时候我们怎么办
我们是要放弃对这个问题的研究吗
如果不想放弃的话
我们应该怎么去解决它
我们显然也不太可能做RCT因为我们不可能去控制操纵
别人的教育经历
这时候这时候一个非常直觉的问题是什么
就是说如果大家想 x的 variation是蓝色的
这一个椭圆它红色阴影面积的部分跟浅蓝的这一块儿的
residual也是y的variation
它是相关的
红色阴影面积
我们把它比喻成是一块烂掉的面包
因为它不好性质
蓝色的整个椭圆除掉阴影面积之外
它其实剩下这一部分它还是一块比较好的面包
它还是可以用的
它这部分variation对不对
因为这部分variation它跟 residual
就是不相关的
那么如果我能够想一个办法
把跟 residual不相关的这部分
variation给它抠出来
然后接着用
是不是是一个可能的解决方案
是吧
非常机械直白
也就是说如果我能找到一个工具变量
这个工具变量它就像个模子一样
它在 x上一扣
它就把健康的这块面包给扣出来了
然后我们再用健康的这一块面包
继续解释我们的y的 variation
这个问题就可以解决了
是不是
非常简单
机械
但是也很清楚
那么听上去还是可以去探讨的
那么这个时候我们就提出关于IV工具变量
它要满足什么性质
就能够在这样的一个思路下帮助我们解决这个问题
第一个就是相关性
也就是说显然就是工具变量z它要跟x是相关的
是不是
它能够去解释x的一部分最好是一大部分
variation
这样的话它就可以把 x的一部分variation
通过 x的拟合值的方式表达出来
第二个工具变量就有外生性
也就是说工具变量绝对不能再跟残差相关的
我们在这张图里面画了residual的面积
跟前面那个图的意思是一样的
那么这个residual显然它跟x它是有一部分重叠
的相关的
但是我们的z是坚决不能再跟residual相关了
因为我们本来就想用z来抠出一部分跟residual不相关的x的
variation
对不对
那么这个z它是一定要不能再跟residual相关
那么这个就叫工具边的外生性
所以工具变量两部分
一部分这是很形象的说法
显然 variation它不是这么能够抠得出来的
形象的说法
也就是说一部分是内生的
第一部分这一部分它跟residual是相关的有重叠
一部分是外生的
么z可以把外生的 variation的一部分抠出来
它也不见得能全抠出来
大家能抠出一部分来
那么如果能够有这样的一个工具变量
帮我们抠出一部分外生的 x的variation的话
我们就有望解决这个问题
那么用工具变量来去解决 y对x的回归方程
我们能够得到一个渐进无偏的估计
这里我们不去解释什么叫渐进无偏的
大家感兴趣的话
可以去翻阅教材
或者是其它的这些计量经济学的书都可以
或者来找我讨论也可以
我们没有这么多足够的时间来讨论这个问题
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM