当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.10 Residual of 2SLS
那么这部分很重要
大家一定要注意
这部分我们讨论清楚几个概念
好
首先我们来看这个原始的方程
这个问题是这么提的
但是这个问题本身它的目的不是让大家去手动的去跑
两阶段最小二乘
但是如果你手动的去带入来跑的话
它到底发生了什么
这个事我们要搞清楚
那么首先这个是我们的原始的问题
对不对
这个问题里面它就是因为x是内生的
x跟ε相关
所以我们要用工具变量来解释
第一阶段方程没有问题
x是关于z的这样的一个方程
那么如果我们把 x等于x hat等于α0 hat
加上α1 hat 的乘以z这样的一个拟合值
直接手动的带入到第二步
会发生什么
我们先把它写成一个公式的形式
方程的形式是这样子的
手动第二步
我为什么加个手动
它跟前面我们说的 stage two它不是一回事
因为前面 stage two是软件里帮我们跑出来的
那个是我们对原始的方程的无偏的估计
但是不是,这个是我们手动把x开始带入
我们来看发生了什么
如果我们想手动的带入x hat
我们等于在第一步模型里面是加一个β1 x hat
再减去一个β1 hat
是不是
这个方程就保持等号不变
这样的话我们做一下重新的一个组合
把β1 *x hat的挪到前面去
这样的话就把 x减去x hat 的把它并到一起
外面是系数β1
对不对
那么因为我们手动的第二步里面
在这个方程里只留了 x hat
所以说我们的残差是哪一部分
我们的残差是原始的
ε
再加上β1乘以x减去x hat
x减去x hat的是不是就是第一步里面的残差
对不对
第一步里面的δ,残差
它就是x减去x hat
是不是
所以说这个时候其实当我们手动的来去做了第二步的估算
的时候
那么η它其实是等于这个东西的这个时候η
并不等于原来的方程里面的 ε
*没有问题
有了新想法
我看看那是在说刚才那道原图的题没有关系
老师我没关系
我们说了大家课堂参与是重点
你参与了多少差一点少一点都没有关系
我们就希望大家参与
Ok
好
这一步有没有问题
这个很重要
就是刚才推导我可能说的快了点
有问题希望你们现在就提出来
好
没有问题我们接着过
所以说首先我们意识到如果你手动带入的话
最后的残差η它是ε跟δ的一个线性组合
它不再是原来的ε
我们为什么要关心这些残差的结构呢
这就是这个问题
就是说你看我们有这么多残差
我没有原始方程里的参差ε
我们有这个软件报告给我们的估算好的一个第二阶段的
一个回归结果里面也是要ε
还有刚才我们推导的
如果是手动带入跑出第二阶段的话
它残差
η
那么我们到底是需要哪一个残差
显然其实我们需要的是ε对不对
就是说其实我们要估算的还是残差ε
我们要的差
但是因为在原始的方程里面
x跟ε相关
所以估算会有偏
所以我们没有办法得到从这个里面得到
我们是从工具
变量法估算之后
我们又算出来ε,但是 ε并不是η
说了η跟ε刚才性关系已经说过了
那么这个是不相等的
我们要的还是ε
这是很重要的
那么接下来我就问
为什么我们关心的是ε
它反正就是个残差对不对
其实我们要的只不过是我们要的是β
是不是
我们并不关心残差
本来就这个不是我们的研究的兴趣
那么为什么我们还要去关心
我们求了到底是一个ε一个η
这就是因为我们不要忘了我们对于β的估算
我们对它是有两个估算的
一个是点估计
一个是方差估计对不对
也就是说对于我们估算的参数
点估计就是β hat
它大概的取值是什么
它的期望值是什么
β hat 这是点估计
同时我们是不是还要做一个假设检验
来统计推断
来看β1它是不是显著的区别于0
是不是
也就是我们上节课复习的 t检验
大家想在 t检验里面
我们是不是用到了β的标准误
是不是
那么标准误是怎么算的呢
那么标准误它其实就是通过残差的方差来去计算
所以说这个时候我们要用哪一个残差的方差来去计算β
的标准物
我们当然要用原始的残差
也就是说这个里面的残差
而不是η
因为我们求的是原来这个方程
那么所以我们要关心的是我们求出来的最后是不是
ε
因为用ε来去计算的β的标准误才是无偏的
才能够用它来去对β做统计推断
来判断β是不是显著的区别于0
所以说这边就是要把这个问题要说清楚
好
有没有问题
刚才这个分析是是很重要的
虽然现在大家注意软件里面
比如说STATA里面
当你跑一个两阶段最小二乘法的时候
它给你报告的最后残差它就是ε
它已经给你换算完了
那个是没有错的
但是如果你在一些研究任务中
你手动的去跑的时候
你要知道你手动跑出来η
它就不是原来ε了
这个时候对于β的标准误的计算以及t统计量的计算都
变了
这个值就是不不对的了
这句话,就是说我们要的还是要估算这里面的值
说白了我们的研究任务是第一个方程
是不是
第一个方程里的每一个参数都是我们想估算出来的
这个是*的问题
也就是说我们想估算出β
当然截距项我们不感兴趣
我们要估算β1 hat, β0 hat
我们还需要估算残差
为什么要把残差的方差估算出来
因为残差的均值是等于0
不用估算
残差的方差是σ方对不对
我们为什么关心σ方
是因为这个地方就是说我们特别关心β的标准误
β的标准误里面是通过σ方来去计算的
当然σ方在实证的时候
它是用所有的残差的平方和来去做处理来得到的
所以说我们只有求出ε的方差
我们才能够去对β1的参数估计值做统计推断
看看它是显著的区别于0
还是不是 t检验
对不对
因此我们要的是一
但是一我们没法直接用
因为 x是内生的
我们不能用OLS所以说我们其实用的是工具变量的两阶段
最小二乘法来求出来的式子
这个式子里面它是报告的是一个结果而已
它们这个里面唯一变化的就是把 x换成x hat
x hat当然是从第一阶段里面估算出来的
但是残差并不是手动带入第二阶段之后的残差η
而是我们经过换算
怎么换算的呢
这个式子是不是其实我们求出来是η
然后我们也能够求出δ
因为这两个都是外生的
都是...不是外生的
都是OLS可以直接跑出来的
那么这个是可以算出来的
我们通过这两个值反过来又去求的ε
对不对
我们要的是ε所以说在软件里面给出来的ε
就是报出来的第二阶段的值是重新换算的
它不是直接把第一阶段的fitted value带入到第
二阶段
然后跑了一个最小二乘法
跑出来的残差是是η
所以我们要的不是这个东西
*我说清楚了吗
总而言之我们要的是 ε
好
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM