2.14 Extension 2慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

Ok我们来讨论下一个问题

刚才我们讨论全是一元的情况

对不对

我们只有一个x只有一个z我们现在考试考虑考试多元的

情况

考虑多元的情况

那么如果我们有更多的协变量

所谓协变量全都是指的是原方程里面的协变量

就是x2 x3这样子

那么我们要不要加上这些协别量

我们把这个说完

O k那么就是这种情况是不是

这个是我们之前只有一个协边量x1 还是一个内生的

情况下

我们用工具变量来解决它

这个时候我们因为手里还有别的变量

刚才同学们也提了对不对

disadvantage是不是可以做一个变量放进去等等

那么这个时候如果我们有这些变量要不要加进去

当然要加进去

是不是

只要这些变量是外生的

我们当然要把它加进去

那么为什么第一个搞不好这里面变量有一些它是跟红色

阴影面积是重叠的

这样的话如果把它放在了协变量里面

是不是 x跟原来 residual重叠的部分就会

减少

它内生性就会稍微弱一些

当然如果正好是内生性的延全的话

比如说之前说的ability

那就把内生性给解决了

x就不是内生变量了

是不是

这是第一点

当然如果我们没有这么lucky

没有把这一项的变量全都可以找出来

我们加一些其它的变量

像图中画的这种也是非常好的

为什么

是不是我们整个模型的解释力度更强了

是不是我们加入更多的协变量

我们解释了更多的y的variation

使得残差就变得更小

是吧

那么残差更小的话

大家想我们会有什么好处

因为残差的方差是我们用来估算所有参数的标准误的

对吧

我们刚才说了那个方程

一个很重要的一部分

所以当残差变小的时候

我们所有系数的标准误会怎么样

会减小

标准误减小

刚才我们讨论了标准误减小

我们的 power会怎么样

Power会增大

是不是

这是一件非常好的事情

所以有控制变量

性质良好的控制变量

那么我们要把它放进来

好

首先我们看果然我们是应该加入covariance

但是接下来就有一个问题是什么呢

就是说大家可以看到在这个方程里面我们现在有x1

x1是内生解释变量

那么我的问题是当我们跑一个两阶段最小二乘法的时候

不是矩估计，直接跑两阶段最小二乘法

那么在第一阶段里面

x一的方程里面除了z之外

工具变量之外

我们要不要把x2和x3也放进去呢

要还是不要

因为x2和x3它第一个是外生的

第二它是解释外的

那么只有x是内生的

那么z是用来解释x的

这是我们找好的工具变量

那么在第一阶段的方程里面

我们之前只有z但是现在因为原方程里面多了x2和x3

我们要不要把z放进去，呃

除了z之外要把要不要把x2跟x3放进去

要大家一个判断是对的

为什么

我们不能只放这个z我们要把x2x3要放进去

为什么

大家来看

如果我们没有把x2和x3放进去

那么我们把原方程把 x一替换成 x hat加残差

这样子

这个形式当然残差写错了

应该写成δ塔就写成e了

那么是不是因为e是一部分残差

那么我们可以把它挪出来

统一放到最后

是不是

这跟刚才我们算的这些残差是一个逻辑

这样的话其实是这样的一个形式

那么这时候有一个什么问题呢

当然了x hat它是外生的

这是没有问题的

因为它是由z来去估算的

但是这个问题在于什么呢

在现实中

虽然理论上x1跟x2和x3

它可以不相关

这两种情况首先,协变量 x1跟x2和x3呢

是不是可以相关

是可以相关的是不是

第二个它们也可以不相关

相互独立都可以

我们上节课讨论过了

它们相互独立的话

这是一种情况

它们相关的也可以

只要相关系数不要太高

比如说超过0.7

这是没有关系的

但是现实中就算我们理论上认为x1跟x2 x3是不相关

的

那么我们拿到随机变量之后

我们也会发现它往往还是有一些相关性的

那么这些相关性就会留在哪里

留在第一阶段的残差里面

因为z它是刻画的是外生性的部分

那么残差项里面就会有一些东西可能会跟x2和x3相关

使得原来本来是外生的x2和x3呢就变成了内生变量了

因为我把 x1里面不太好的部分全留到残差里面了

所以说一定要在第一阶段里面把z和x2x3都放进去

大家想

如果在第一阶段方程里面如果在这里我们加上x2加上x

都加上

那么这个时候我们跑出来的第一阶段的残差

δ也就是这里面的e

那么这个里面是不是就一定不含有x2和x3的任何变异

了

因为所有的变异都被x head给拿走了

是不是

所以在这里一定要加上x2和x2

好

关于多个IV

大家想我们找到一个IV是不容易

但是如果我们非常幸运的找到多个IV

我们要不要都用

当然要对不对

因为大家想同样我们也希望增加IV对x的解释

力度

是不是

那么如果有多个IV的话

我们能够得到的 x hat 的它的整个的

variation也会更大一些

包括 local的面积会更大

刚才都讨论过了

那么而且有的时候我们现在只有一个内生解释变量

我们没有时间讨论两个以上的内生解释变量

如果我们有多个内生解释变量的时候

我们一定要找到相应数量的IV只能多不能少

比如说我们有三个内存解释变量

那么我们只要找到三个IV来去处理

或者是三个以上都可以

这是说我们还是希望有多个IV的

但是多个IV的时候我们要做什么事情

我们也要做一个外生性检验的问题

也就是说我们已经知道，这个文字大家自己慢慢读

我给大家解释一下

跟刚才是一样的

我们知道假设我们只有一个内生解释变量

那么我们找到z1的时候

z1是一个好的IV我们已经确定了

这时候如果出现z2和z3的时候

我们要通过用z1来去判断

z2和z3是不是也是外生的

跟刚才判断x1是不是内生的

是一样的，也是用豪斯曼检验

那么来做这样的一个工作

这个就不再细说了

这里面还有一个weak IV的问题

大家一定要注意

就是说什么叫weak IV就是说 x跟z的相关系数如果非常

小

比如说趋近于0

比如说0.05这样的一些相关系数

这时候IV它就是一个非常弱的IV，用一个弱的IV来去

做回归的时候就会非常有问题

问题在哪

大家看这个是β1的估算值

矩估计的估算值

那么我们之前是假设这个东西为0的

但实际上在实证中这个值也不可能为0

它可能是一个趋近于0的值

比如说0.001或者0.01

这个就算可以了

当然值这个值我们认为它是足够大的

这时候后面这一项是可以忽略的

但是如果这个分母这一部分 x跟z的协方差

如果它不是很大

它也趋近于0的话

比如它是一个0.05这样的一个值

而分子是0.01

它俩的比值那就很大了

这个时候这一部分就不能被忽略了

在实证中我们会发现

所以这个就是弱 IV给我们带来的

如果这个工具变量是一个弱工具变量

它不但不能帮我们估算出一个渐近无偏的估计变量β

它还会给我们带来新的偏误

这是弱工具变量的问题

所以一定要重视

这是一个图形了

这个图就你看这个z，z如果跟 x的这个重叠非常少的

话

它当然就是一个弱工具变量

用这点黄色面积去来去估算

y，这个偏误刚才我们解释了

那么怎么样来检验它是一个弱IV

首先我们用第一阶段估成第一阶段的估算就是F检验来

去判断

那么在这篇文章里面也建立了一个大拇指法则

经验法则

也就是说我们希望 F统计量在第一阶段的方程里面

就是x关于z的方程里面

这个F值要大于10才会比较好

那么如果是弱工具变量

一定要把它扔掉

只用强工具变量

这个是weak IV。Forbidden regression

我们不去讲了

大家能遇到的机会很少

因为时间超了

只简单一说一句

就是说当我们的内生解释变量是 d它是一个二元变量的

时候

那么第一阶段本来应该用一个非线性方程

比如说probit来去估算

如果用probit的估算的时候

残差它就不是一个，它就不保证是跟fitted value是

2.14 Extension 2在线视频

2.14 Extension 2课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

2.14 Extension 2笔记与讨论

也许你还感兴趣的课程: