当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.18 Q&A 4
大家好
我来解释一下第11个问题
我是*
然后第11题有同学题第一阶段估计为什么要放进x2和
x3
其实我们所有的就工具变量的问题
或者是我们在整个估计的问题中
我们都要尽可能的满足OLS虽然说不可能完全满足
但是我们要尽可能的满足OLS的假设
也就是咱们的自变量的话和残差是相完全不相关的
也就是它们的协方差应该为0
如果咱们在整个阶段中
如果我们在整个阶段中需要比如说咱们在这个问题Yi它
等于这样
等于x1i和x2i以及x3i这样一个模型中
我们在第一个阶段的话
我们把x1的估计量用这个工具变量zi的话来表示x1i
之后的话
然后如果x1和x2以及x3是高度相关的
那么这时候也就x2x3是一个内生的问题
如果我们不把x2和x3放进去
也就是说我们在整个过程中把x2和x3忽略掉了
我们会发现后面的这一项的话
它都会变成一个残差的问题
这时候的话 x2x3它和X1可能是相关的
现在的话咱们就不满足OLS的假设了
所以我的理解的话是咱们在整个过程中要放进x2和x3
的问题的话
主要是为了满足OLS的一个假设
好
这是第11题一个
对
说的没错
再明晰一下
那么在这个地方大家想自变量之间相关是不是没有关系
只要它不是多重共线
比如说相关系数达到0.7以上
自变量之间相关是没有关系的
就怕自变量跟残差是相关的
自变量跟残差可能有一定相关性
不用达到0.7
其实就已经会影响到我们的估算的系数的偏误了这个问题
了
所以我们宁可在
这个地方是用的x hat
x1它里面可以 x1的拟合值
它可以包含一部分的x2x3的没有关系
它可以跟x2 x3相关
但是不要把这一部分扔到残差里去
好
这是第11题
然后第12题的话是说如果加入多个工具
多个工具变量的过程中的话
这些工这些变量之间会有多重共线性的可能吗
这个我觉得肯定是会存在的
老师的回答它是说,首先老师解释说工具变量
的话只是一个变量
它只是用于帮助我们的话更好的解释问题
所以的话我们在整个过程中关注的是整个工具变量z它对
x解释力度大小
相互之间的共线性的话
其实我们会使得它在我们两个阶段的stage
one就是那个阶段里面的SE的系数增大
但是的话整个它不会影响x的预测
这是老师的回答
然后另外一个就是我们小组讨论之后的话
我觉得还有一个想法是首先如果加入多个工具变量的话
在工具变量它在满足前提的假设下的话
首先它应该与咱们对应的内生变量的话是高度相关的
这样我们才可以用它把它当做一个工具变量来算
如果工具变量出现高度相关的话
那高度共同解释内生变量的情况
我觉得从某个角度而言的话
选择的模型中包含自变量本身就存在高度的相关了
也就是说多重共线性了
所以的话我们觉得此时需要重新选择一下模型
好
这是12题
这个地方就是多个工具变量的时候
它工具变量之间不必然是多重共线
但是如果它出现多重共线的话
这个时候确实要按照多重共线性来处理
要删掉一些工具变量
但是如果这个时候我们本身模型里有多个内生解释变量
比如说我们有 k的内生解释变量
那么如果我们现在只有k的工具变量
这是恰好识别的情况
这个时候有没有办法删
只能去寻找新的工具变量
好
这是两个比较简单的问题
有问问这个问题的同学
如果觉得没有答清楚
你也可以随时的插话进来
我希望大家能够鼓励你们能够随时的能够探讨起来
好
各位同学老师大家好
然后我为大家主要解释...
各位老师同学大家好
然后我主要为大家解释的是两个有关于工具变量外生性
检验的一个问题
首先第一个是它问的一个工具变量外生性这一个假设如何
检验
这个主要是我们可以针对两种情况来讲
第一种情况的话就是到我们工具变量它过度识别的时候
也就是说当你这个时候存在了两个及以上的工具
变量的情况该怎么解释
这个时候的话我们通常像第一组同学
刚刚*同学已经讲到了
就是说我们可以去用二阶段估计法
然后把估计变量它参数这边算出来,看这两个参数值之间它
的差异大不大
如果不大的话
那就证明我们外生性检验是通过的
那大的话就证明是没有通过的
后面我们用了一个统计学意义上的比较更为按科学的方法
来说的话
就是豪斯曼检验,它的原理的话
只是说要所有的IV估计量的参数值在我们大样本的情况
下应该做到一个收敛
也就是说在大样本下
我们IVE的估计量的一个参数的它的一个差异是不
显著的
第二种情况的话是一种恰好识别的情况
这种情况其实比较棘手的
在这种情况的话
我们只能从理论角度进行一个分析和判别
我们主要就是要考察你选择的工具变量对吧
是不是
它一定只能通过影响你的一个x去影响你的y呢
在我们这个系统里面会不会存在一些其它的变量
你的工具变量可以影响它是影响y的
如果有的话
那就不是一个严格的外生的
但是我们教育学研究系统里面其实许多变量都是一个相互
关联的
受到我们认知水平的限制
其实我们很难在这种情况下做出一个百分之百的检验
然后第二个问题也是问的关于工具变了一个外生的
然后这位同学它是站在的统计学的一个角度去问的
它问的是让我们再进行一个IV的一个前提
假设的一个检验的时候
我们能不能在斯里塔里面先做一个red y IV
然后去看y IV的系数显著
然后再做一个 y然后IV跟x一起加进去
大家看IV的系数不显著
然后这个时候它就说虽然 y与IV的显著相关
但是将x作为控制变量的时候
y与IV就不显示相关了
就是说我证明了这条路径
刚刚我也说
因为它这个是从统计学的角度去讲的
其实我们都知道我们在做实证研究的时候
我们依托的根本还是我们的理论
就是说如果你没有能够从理论上面去进行一个证明的话
都不算是一个规范的证明
统计上的检验只能作为一个佐证
然后不能去进行一个验证
针对于这位同学
针对于它的一个想要表达的意思
从统计学的意义上去讲的话
其实它这样做还是不行的
你比如如果它会发现两种情况
第一种情况就是说一开始我的IV是显著的
我后面加了个变量进来
IV不显著了,这个时候会不会你加进来的
一个变量
出现了一个多重共线性的问题
第二个的话就是说按照这位同学它的一个检验思路来看的
话
它检验思路是很中介效应的一个一次检验的步骤的
但是它这个步骤里面也少了一个,也少了两部非常重要的
它包含了第1步跟第3步
但是它没有包含第2步和
第4步也就是说它没有办法证明我的工具变量跟我的内生
变量,它之间是显着的
也就是说我们的z到x它是没有办法证明的
然后第二个它虽然说,上面它证明了这一个按中介作用可能
是存在的
但是它没有办法证明这条路径是显著的
因为它没有通过一个是sobel检验或者说bootstrap
之间的检验
而且证明这条路径是显著的
所以说也没有办法证明
而且即便它是把整个过程都给证明出来了
然后我证明出来了我的z的对x显著
x对y显著
然后再通过x到y的一个中间效应也是显着的
但仍然没有办法说明问题
因为即使它证明就像它说的
我的第二步那个地方是IV的系数变得不显著
不显著的时候
然后你再证明证明中介效应这条路径是显著的时候
就说明它是一个完全中介的作用
完全中介的作用只能说明你的z要想把效应传到y你是把
z所有的东西全部给了x再给y
但是你没有办法说明
你z只能通过把所有东西给到x再给y
这个完全也可以把它的所有东西给到另外一个变量再给到
y
还是没有办法满足外生性的一个检验的条件
所以说归根到底我们还是只能从理论层面去进行一个规范
的证明
下一个问题就是关于一个豪斯曼检验的原理以及它的自由
度的问题
这个问题刚刚已经说了
豪斯曼它的检验的一个原理就是,因为豪斯曼检验的时候
我们前面是构造了一个矩阵
矩阵里面其实有很多个向量
1行2行
3行
4行5行向量
然后这个向量里面的话其实包含的就是我们的IV的一个
估计量
然后我们要去检验的就是这些IV估计量之间的参数
在大样本下面是不是一个显著的,然后它的自由度其实也
很好理解的
就是我们一一每一行的向量
然后它有多少行量
这个秩的话其实它是线性代数里面的一个概念
就是说在经过你的初等行变换之后
你的非零的行的向量数量有多少个
那就是它的秩
你比如说如果你只有一个工具量的话
那么你的秩就是1
当然你那个秩不能是0
那么这里的一第一个题目是说对于这个公式的理解
其实这个公式刚才在第一小组讲的时候也出现了一下
那么我们看到这个公式它本身它这个公式里面它想描述的
其实是一个我们能够观测出来平均处理效应是多少
那么这里就有一个理想状态
我把它叫做理想状态一个问题
我们理想就是当Di也就是我们给它加了处理条件的
时候
那么它的结果就是这么一个 y1i那么没有加的时候
比如说对照的时候
它的结果就是y0i
这就是我们能够观测出来的这样一个差异
但是但是存在有这么一批,有这样一个事就是被框框挡住了
这一块
它使得我们观测出来的值和我们真是想求的值当中有一个
差异
有一部分的当它加了处理条件的时候
它的结果还是会显示为0
那么这一块的话是在我们式子当中等于被消解了
也就是说它在对照和实验组两两组当中结果是有重合的
那么这一部分产生就使得我们有了这样一个自选择偏误
那么它的意思其实直白解释就是说有这么一部分的 y的
变动
它是在我们模型解释因素
模型能够解释因素之外的一部分的内生或者说是禀赋类的
因素所导致的
比如说我们想知道上学和上大学和工资高低的关系
那么但是有没有上大学这个变量
它本身是内生的
也就是说它上大学的毕业生和没有上过大学的人很多条件
不一样
比如它的父母的受教育水平
比如它自己的智商
那么这一部分的就算我们最后观测出了说大学生平均工资
比没上过大学这个人更高了
好我们也不能得出结论说这两个是因果关系
而只能说它是有相关关系
是因为有这么一部分这个偏误的存在
那么这是关于自选择偏误公式的一个解释
如果没有什么问题的话
那么就到下一个
好的
那么这里的话最后就是看一个工具变量和代理变量的区别
首先我们知道工具变量
我们一直说的就是它和我们想要去解释
或者说被替代变量它本身是相关的
那么在代理变量里面
它其实也是存在这样一个相同点
就是它和 x本身它是相关的
但是有一个不同的就是代理变量
我们再去处理的过程当中
工具变量是作为一个间接
通过x间接影响y
那么代理变量它是因为x由于某些原因我们没有办法去
直接测量
比如说在这里我们想要去测量一个能力
但是我们并不能够直接去用一个直接去衡量它的能力
那么这个时候我们就要找一个能够去反映出它能力的一个
变量
那么这个时候比如说IQ
智商
那么它就是一个能够测量出来的代理变量
也就是说在最后解释的时候
我们在解释模型的时候
工具变量这一块的话
我们还是要采用原来内生的解释变量来解释
但是在代理变量的时候
我们最后解释模型的时候
也是要用代理变量来解释
回归模型本身
然后它们和主要有一个区别
就是和y之间这样一个直接或者说间接的影响的路径的
关系
那么这就是关于工具变量和代理变量区别的解释
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM