当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.14 Extension 2
Ok我们来讨论下一个问题
刚才我们讨论全是一元的情况
对不对
我们只有一个x只有一个z我们现在考试考虑考试多元的
情况
考虑多元的情况
那么如果我们有更多的协变量
所谓协变量全都是指的是原方程里面的协变量
就是x2 x3这样子
那么我们要不要加上这些协别量
我们把这个说完
O k那么就是这种情况是不是
这个是我们之前只有一个协边量x1 还是一个内生的
情况下
我们用工具变量来解决它
这个时候我们因为手里还有别的变量
刚才同学们也提了对不对
disadvantage是不是可以做一个变量放进去等等
那么这个时候如果我们有这些变量要不要加进去
当然要加进去
是不是
只要这些变量是外生的
我们当然要把它加进去
那么为什么第一个搞不好这里面变量有一些它是跟红色
阴影面积是重叠的
这样的话如果把它放在了协变量里面
是不是 x跟原来 residual重叠的部分就会
减少
它内生性就会稍微弱一些
当然如果正好是内生性的延全的话
比如说之前说的ability
那就把内生性给解决了
x就不是内生变量了
是不是
这是第一点
当然如果我们没有这么lucky
没有把这一项的变量全都可以找出来
我们加一些其它的变量
像图中画的这种也是非常好的
为什么
是不是我们整个模型的解释力度更强了
是不是我们加入更多的协变量
我们解释了更多的y的variation
使得残差就变得更小
是吧
那么残差更小的话
大家想我们会有什么好处
因为残差的方差是我们用来估算所有参数的标准误的
对吧
我们刚才说了那个方程
一个很重要的一部分
所以当残差变小的时候
我们所有系数的标准误会怎么样
会减小
标准误减小
刚才我们讨论了标准误减小
我们的 power会怎么样
Power会增大
是不是
这是一件非常好的事情
所以有控制变量
性质良好的控制变量
那么我们要把它放进来
好
首先我们看果然我们是应该加入covariance
但是接下来就有一个问题是什么呢
就是说大家可以看到在这个方程里面我们现在有x1
x2
x3
x1是内生解释变量
那么我的问题是当我们跑一个两阶段最小二乘法的时候
不是矩估计,直接跑两阶段最小二乘法
那么在第一阶段里面
x一的方程里面除了z之外
工具变量之外
我们要不要把x2和x3也放进去呢
要还是不要
因为x2和x3它第一个是外生的
第二它是解释外的
那么只有x是内生的
那么z是用来解释x的
这是我们找好的工具变量
那么在第一阶段的方程里面
我们之前只有z但是现在因为原方程里面多了x2和x3
我们要不要把z放进去,呃
除了z之外要把要不要把x2跟x3放进去
要大家一个判断是对的
为什么
我们不能只放这个z我们要把x2x3要放进去
为什么
大家来看
如果我们没有把x2和x3放进去
那么我们把原方程把 x一替换成 x hat加残差
这样子
这个形式当然残差写错了
应该写成δ塔就写成e了
那么是不是因为e是一部分残差
那么我们可以把它挪出来
统一放到最后
是不是
这跟刚才我们算的这些残差是一个逻辑
这样的话其实是这样的一个形式
那么这时候有一个什么问题呢
当然了x hat它是外生的
这是没有问题的
因为它是由z来去估算的
但是这个问题在于什么呢
在现实中
虽然理论上x1跟x2和x3
它可以不相关
这两种情况首先,协变量 x1跟x2和x3呢
是不是可以相关
是可以相关的是不是
第二个它们也可以不相关
相互独立都可以
我们上节课讨论过了
它们相互独立的话
这是一种情况
它们相关的也可以
只要相关系数不要太高
比如说超过0.7
这是没有关系的
但是现实中就算我们理论上认为x1跟x2 x3是不相关
的
那么我们拿到随机变量之后
我们也会发现它往往还是有一些相关性的
那么这些相关性就会留在哪里
留在第一阶段的残差里面
因为z它是刻画的是外生性的部分
那么残差项里面就会有一些东西可能会跟x2和x3相关
使得原来本来是外生的x2和x3呢就变成了内生变量了
因为我把 x1里面不太好的部分全留到残差里面了
所以说一定要在第一阶段里面把z和x2x3都放进去
大家想
如果在第一阶段方程里面如果在这里我们加上x2加上x
3
都加上
那么这个时候我们跑出来的第一阶段的残差
δ也就是这里面的e
那么这个里面是不是就一定不含有x2和x3的任何变异
了
因为所有的变异都被x head给拿走了
是不是
所以在这里一定要加上x2和x2
好
关于多个IV
大家想我们找到一个IV是不容易
但是如果我们非常幸运的找到多个IV
我们要不要都用
当然要对不对
因为大家想同样我们也希望增加IV对x的解释
力度
是不是
那么如果有多个IV的话
我们能够得到的 x hat 的它的整个的
variation也会更大一些
包括 local的面积会更大
刚才都讨论过了
那么而且有的时候我们现在只有一个内生解释变量
我们没有时间讨论两个以上的内生解释变量
如果我们有多个内生解释变量的时候
我们一定要找到相应数量的IV只能多不能少
比如说我们有三个内存解释变量
那么我们只要找到三个IV来去处理
或者是三个以上都可以
这是说我们还是希望有多个IV的
但是多个IV的时候我们要做什么事情
我们也要做一个外生性检验的问题
也就是说我们已经知道,这个文字大家自己慢慢读
我给大家解释一下
跟刚才是一样的
我们知道假设我们只有一个内生解释变量
那么我们找到z1的时候
z1是一个好的IV我们已经确定了
这时候如果出现z2和z3的时候
我们要通过用z1来去判断
z2和z3是不是也是外生的
跟刚才判断x1是不是内生的
是一样的,也是用豪斯曼检验
那么来做这样的一个工作
这个就不再细说了
这里面还有一个weak IV的问题
大家一定要注意
就是说什么叫weak IV就是说 x跟z的相关系数如果非常
小
比如说趋近于0
比如说0.05这样的一些相关系数
这时候IV它就是一个非常弱的IV,用一个弱的IV来去
做回归的时候就会非常有问题
问题在哪
大家看这个是β1的估算值
矩估计的估算值
那么我们之前是假设这个东西为0的
但实际上在实证中这个值也不可能为0
它可能是一个趋近于0的值
比如说0.001或者0.01
这个就算可以了
当然值这个值我们认为它是足够大的
这时候后面这一项是可以忽略的
但是如果这个分母这一部分 x跟z的协方差
如果它不是很大
它也趋近于0的话
比如它是一个0.05这样的一个值
而分子是0.01
它俩的比值那就很大了
这个时候这一部分就不能被忽略了
在实证中我们会发现
所以这个就是弱 IV给我们带来的
如果这个工具变量是一个弱工具变量
它不但不能帮我们估算出一个渐近无偏的估计变量β
它还会给我们带来新的偏误
这是弱工具变量的问题
所以一定要重视
这是一个图形了
这个图就你看这个z,z如果跟 x的这个重叠非常少的
话
它当然就是一个弱工具变量
用这点黄色面积去来去估算
y,这个偏误刚才我们解释了
那么怎么样来检验它是一个弱IV
首先我们用第一阶段估成第一阶段的估算就是F检验来
去判断
那么在这篇文章里面也建立了一个大拇指法则
经验法则
也就是说我们希望 F统计量在第一阶段的方程里面
就是x关于z的方程里面
这个F值要大于10才会比较好
那么如果是弱工具变量
一定要把它扔掉
只用强工具变量
这个是weak IV。Forbidden regression
我们不去讲了
大家能遇到的机会很少
因为时间超了
只简单一说一句
就是说当我们的内生解释变量是 d它是一个二元变量的
时候
那么第一阶段本来应该用一个非线性方程
比如说probit来去估算
如果用probit的估算的时候
残差它就不是一个,它就不保证是跟fitted value是
相关的
那么这个时候我们把它带入到第二个方程里面
残差依然
d减d hat的是残渣了
这个东西如果是从 probit的方程里面估算
出来的残差
它并不保证跟fitted value
d hat的是不相关的
它是相关的
这个时候如果这么跑
是解决不了内生性问题的
因为跑了半天这个的还是跟残差相关
那么怎么办
我们多算了一步
第一阶段先做了一个probit的线性方程
然后用这个d hat的作为工具变量
再跑一个...
再跑一个刚才是先跑了一个非线性方程
得到d hat了之后再跑一个线性方程
然后再得到一个残差
用它再去做第二步相关
我们不做重点要求
当你遇到这种情况的时候我们再谈
因为我们尽量是避免这种情况出现的
好
那么就是今天的工具变量的讲授
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM