2.18 Q&A 4慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

大家好

我来解释一下第11个问题

我是*

然后第11题有同学题第一阶段估计为什么要放进x2和

其实我们所有的就工具变量的问题

或者是我们在整个估计的问题中

我们都要尽可能的满足OLS虽然说不可能完全满足

但是我们要尽可能的满足OLS的假设

也就是咱们的自变量的话和残差是相完全不相关的

也就是它们的协方差应该为0

如果咱们在整个阶段中

如果我们在整个阶段中需要比如说咱们在这个问题Yi它

等于这样

等于x1i和x2i以及x3i这样一个模型中

我们在第一个阶段的话

我们把x1的估计量用这个工具变量zi的话来表示x1i

之后的话

然后如果x1和x2以及x3是高度相关的

那么这时候也就x2x3是一个内生的问题

如果我们不把x2和x3放进去

也就是说我们在整个过程中把x2和x3忽略掉了

我们会发现后面的这一项的话

它都会变成一个残差的问题

这时候的话 x2x3它和X1可能是相关的

现在的话咱们就不满足OLS的假设了

所以我的理解的话是咱们在整个过程中要放进x2和x3

的问题的话

主要是为了满足OLS的一个假设

好

这是第11题一个

对

说的没错

再明晰一下

那么在这个地方大家想自变量之间相关是不是没有关系

只要它不是多重共线

比如说相关系数达到0.7以上

自变量之间相关是没有关系的

就怕自变量跟残差是相关的

自变量跟残差可能有一定相关性

不用达到0.7

其实就已经会影响到我们的估算的系数的偏误了这个问题

了

所以我们宁可在

这个地方是用的x hat

x1它里面可以 x1的拟合值

它可以包含一部分的x2x3的没有关系

它可以跟x2 x3相关

但是不要把这一部分扔到残差里去

好

这是第11题

然后第12题的话是说如果加入多个工具

多个工具变量的过程中的话

这些工这些变量之间会有多重共线性的可能吗

这个我觉得肯定是会存在的

老师的回答它是说，首先老师解释说工具变量

的话只是一个变量

它只是用于帮助我们的话更好的解释问题

所以的话我们在整个过程中关注的是整个工具变量z它对

x解释力度大小

相互之间的共线性的话

其实我们会使得它在我们两个阶段的stage

one就是那个阶段里面的SE的系数增大

但是的话整个它不会影响x的预测

这是老师的回答

然后另外一个就是我们小组讨论之后的话

我觉得还有一个想法是首先如果加入多个工具变量的话

在工具变量它在满足前提的假设下的话

首先它应该与咱们对应的内生变量的话是高度相关的

这样我们才可以用它把它当做一个工具变量来算

如果工具变量出现高度相关的话

那高度共同解释内生变量的情况

我觉得从某个角度而言的话

选择的模型中包含自变量本身就存在高度的相关了

也就是说多重共线性了

所以的话我们觉得此时需要重新选择一下模型

好

这是12题

这个地方就是多个工具变量的时候

它工具变量之间不必然是多重共线

但是如果它出现多重共线的话

这个时候确实要按照多重共线性来处理

要删掉一些工具变量

但是如果这个时候我们本身模型里有多个内生解释变量

比如说我们有 k的内生解释变量

那么如果我们现在只有k的工具变量

这是恰好识别的情况

这个时候有没有办法删

只能去寻找新的工具变量

好

这是两个比较简单的问题

有问问这个问题的同学

如果觉得没有答清楚

你也可以随时的插话进来

我希望大家能够鼓励你们能够随时的能够探讨起来

好

各位同学老师大家好

然后我为大家主要解释...

各位老师同学大家好

然后我主要为大家解释的是两个有关于工具变量外生性

检验的一个问题

首先第一个是它问的一个工具变量外生性这一个假设如何

检验

这个主要是我们可以针对两种情况来讲

第一种情况的话就是到我们工具变量它过度识别的时候

也就是说当你这个时候存在了两个及以上的工具

变量的情况该怎么解释

这个时候的话我们通常像第一组同学

刚刚*同学已经讲到了

就是说我们可以去用二阶段估计法

然后把估计变量它参数这边算出来，看这两个参数值之间它

的差异大不大

如果不大的话

那就证明我们外生性检验是通过的

那大的话就证明是没有通过的

后面我们用了一个统计学意义上的比较更为按科学的方法

来说的话

就是豪斯曼检验，它的原理的话

只是说要所有的IV估计量的参数值在我们大样本的情况

下应该做到一个收敛

也就是说在大样本下

我们IVE的估计量的一个参数的它的一个差异是不

显著的

第二种情况的话是一种恰好识别的情况

这种情况其实比较棘手的

在这种情况的话

我们只能从理论角度进行一个分析和判别

我们主要就是要考察你选择的工具变量对吧

是不是

它一定只能通过影响你的一个x去影响你的y呢

在我们这个系统里面会不会存在一些其它的变量

你的工具变量可以影响它是影响y的

如果有的话

那就不是一个严格的外生的

但是我们教育学研究系统里面其实许多变量都是一个相互

关联的

受到我们认知水平的限制

其实我们很难在这种情况下做出一个百分之百的检验

然后第二个问题也是问的关于工具变了一个外生的

然后这位同学它是站在的统计学的一个角度去问的

它问的是让我们再进行一个IV的一个前提

假设的一个检验的时候

我们能不能在斯里塔里面先做一个red y IV

然后去看y IV的系数显著

然后再做一个 y然后IV跟x一起加进去

大家看IV的系数不显著

然后这个时候它就说虽然 y与IV的显著相关

但是将x作为控制变量的时候

y与IV就不显示相关了

就是说我证明了这条路径

刚刚我也说

因为它这个是从统计学的角度去讲的

其实我们都知道我们在做实证研究的时候

我们依托的根本还是我们的理论

就是说如果你没有能够从理论上面去进行一个证明的话

都不算是一个规范的证明

统计上的检验只能作为一个佐证

然后不能去进行一个验证

针对于这位同学

针对于它的一个想要表达的意思

从统计学的意义上去讲的话

其实它这样做还是不行的

你比如如果它会发现两种情况

第一种情况就是说一开始我的IV是显著的

我后面加了个变量进来

IV不显著了，这个时候会不会你加进来的

一个变量

出现了一个多重共线性的问题

第二个的话就是说按照这位同学它的一个检验思路来看的

话

它检验思路是很中介效应的一个一次检验的步骤的

但是它这个步骤里面也少了一个，也少了两部非常重要的

它包含了第1步跟第3步

但是它没有包含第2步和

第4步也就是说它没有办法证明我的工具变量跟我的内生

变量，它之间是显着的

也就是说我们的z到x它是没有办法证明的

然后第二个它虽然说，上面它证明了这一个按中介作用可能

是存在的

但是它没有办法证明这条路径是显著的

因为它没有通过一个是sobel检验或者说bootstrap

之间的检验

而且证明这条路径是显著的

所以说也没有办法证明

而且即便它是把整个过程都给证明出来了

然后我证明出来了我的z的对x显著

x对y显著

然后再通过x到y的一个中间效应也是显着的

但仍然没有办法说明问题

因为即使它证明就像它说的

我的第二步那个地方是IV的系数变得不显著

不显著的时候

然后你再证明证明中介效应这条路径是显著的时候

就说明它是一个完全中介的作用

完全中介的作用只能说明你的z要想把效应传到y你是把

z所有的东西全部给了x再给y

但是你没有办法说明

你z只能通过把所有东西给到x再给y

这个完全也可以把它的所有东西给到另外一个变量再给到

还是没有办法满足外生性的一个检验的条件

所以说归根到底我们还是只能从理论层面去进行一个规范

的证明

下一个问题就是关于一个豪斯曼检验的原理以及它的自由

度的问题

这个问题刚刚已经说了

豪斯曼它的检验的一个原理就是,因为豪斯曼检验的时候

我们前面是构造了一个矩阵

矩阵里面其实有很多个向量

1行2行

3行

4行5行向量

然后这个向量里面的话其实包含的就是我们的IV的一个

估计量

然后我们要去检验的就是这些IV估计量之间的参数

在大样本下面是不是一个显著的，然后它的自由度其实也

很好理解的

就是我们一一每一行的向量

然后它有多少行量

这个秩的话其实它是线性代数里面的一个概念

就是说在经过你的初等行变换之后

你的非零的行的向量数量有多少个

那就是它的秩

你比如说如果你只有一个工具量的话

那么你的秩就是1

当然你那个秩不能是0

那么这里的一第一个题目是说对于这个公式的理解

其实这个公式刚才在第一小组讲的时候也出现了一下

那么我们看到这个公式它本身它这个公式里面它想描述的

其实是一个我们能够观测出来平均处理效应是多少

那么这里就有一个理想状态

我把它叫做理想状态一个问题

我们理想就是当Di也就是我们给它加了处理条件的

时候

那么它的结果就是这么一个 y1i那么没有加的时候

比如说对照的时候

它的结果就是y0i

这就是我们能够观测出来的这样一个差异

但是但是存在有这么一批,有这样一个事就是被框框挡住了

这一块

它使得我们观测出来的值和我们真是想求的值当中有一个

差异

有一部分的当它加了处理条件的时候

它的结果还是会显示为0

那么这一块的话是在我们式子当中等于被消解了

也就是说它在对照和实验组两两组当中结果是有重合的

那么这一部分产生就使得我们有了这样一个自选择偏误

那么它的意思其实直白解释就是说有这么一部分的 y的

变动

它是在我们模型解释因素

模型能够解释因素之外的一部分的内生或者说是禀赋类的

因素所导致的

比如说我们想知道上学和上大学和工资高低的关系

那么但是有没有上大学这个变量

它本身是内生的

也就是说它上大学的毕业生和没有上过大学的人很多条件

不一样

比如它的父母的受教育水平

比如它自己的智商

那么这一部分的就算我们最后观测出了说大学生平均工资

比没上过大学这个人更高了

好我们也不能得出结论说这两个是因果关系

而只能说它是有相关关系

是因为有这么一部分这个偏误的存在

那么这是关于自选择偏误公式的一个解释

如果没有什么问题的话

那么就到下一个

好的

那么这里的话最后就是看一个工具变量和代理变量的区别

首先我们知道工具变量

我们一直说的就是它和我们想要去解释

或者说被替代变量它本身是相关的

那么在代理变量里面

它其实也是存在这样一个相同点

就是它和 x本身它是相关的

但是有一个不同的就是代理变量

我们再去处理的过程当中

工具变量是作为一个间接

通过x间接影响y

那么代理变量它是因为x由于某些原因我们没有办法去

直接测量

比如说在这里我们想要去测量一个能力

但是我们并不能够直接去用一个直接去衡量它的能力

那么这个时候我们就要找一个能够去反映出它能力的一个

变量

那么这个时候比如说IQ

智商

那么它就是一个能够测量出来的代理变量

也就是说在最后解释的时候

我们在解释模型的时候

工具变量这一块的话

我们还是要采用原来内生的解释变量来解释

但是在代理变量的时候

我们最后解释模型的时候

也是要用代理变量来解释

回归模型本身

然后它们和主要有一个区别

就是和y之间这样一个直接或者说间接的影响的路径的

关系

那么这就是关于工具变量和代理变量区别的解释

2.18 Q&A 4在线视频

2.18 Q&A 4课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

2.18 Q&A 4笔记与讨论

也许你还感兴趣的课程: