当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.1 Classical assumptions of OLS
好
同学们大家上午好
我们这周开始关于新知识的讨论
那么今天是非常重要
也是最经典的工具变量法
那么我们今天讲工具变量
工具变量法是计量经济学里面最经典的一种方法
也非常基础
我们后续的课程内容里面还会回顾它
所以它非常重要
可以这样讲
如果你借着学工具变量的这样的一个机会
把线性回归里面经常遇到的问题都搞明白的话
我觉得有13的基础知识你就会掌握得非常扎实
所以这堂课是很重要的
那么我们会先从最小二乘法的假设被违背这种情况来开始
谈起
然后来看工具变量法是如何去思考来解决的
我用idea而不是用 model set up
是因为我们还是希望跟同学们来探讨
如果你遇到这个问题
这个世界上没有工具变量法的时候
你怎么样能够通过一个朴素的推理和想象
然后来去找到一种方法解决内生性问题
所以是idea是它背后这种朴素的思考
这个是非常宝贵的
比直接告诉你一个答案
model set up比较重要的多
那么接着我们会讨论模型的假设
大家知道所有的模型都有假设
所以我们谈一个模型的时候要先谈它的假设
接着我们会讨论工作还蛮好的
讨论估算方法
那么然后是对假设的检验
以及关于IV estimation里面一些非常
重要的问题
extension,这样的extension不是它不
重要
而是因为它不是在一个主干逻辑下面的
它是其它的一些非常重要的问题
我们在做研究设计的时候要考虑的
那么大概是这6个部分
Ok我们先讨论是对OLS假设的这样的一个违背
那么我们并不准备review所有的假设
这是其中几个很重要的
包括最小二乘法
它要求残差项
它服从一个均值为0
方差为σ方的正态分布
那么残差没有序列相关性
也就是说第i个样本的残差跟第j样本的残差是不相关的
还有外生性
外生性是x那么自变量x它跟残差也是不相关的
这是几个非常重要的假设
那么我们这堂课会用非常形象的维恩图来探讨一些逻辑
这样的话比较形象
首先这一个圈圆圈它代表的是因变量y的
variation
因为y是一个随机变量
它有一定的变化的范围是吧
我们就非常形象的拿这样的一个区域来去表示它的变动的
范围
大概是这样的一个意思
它并不是很严谨的
它很形象
那么x是另外一个变量
也就是我们的自变量么
x的 variation它我们用更深色的一个椭圆来
去表示
那么这个是x的variation
大家可以看到x和y是不是有一个重叠的部分
这个重叠的部分就代表x跟y它是具有相关性的
在统计上是相关性
在理论上的x是对y有解释性
这是这个只是用这个重叠来去表示的
正因为如此
我们采用x的variation来去解释y的一部分
variation
对吧
那么重叠的部分就是x能够解释的y的
variation
那么剩下的这一部分没有跟深蓝色椭椭圆重合的这一部分
浅蓝色的y的variation
我们就叫它残差
是不是相当于这样的一个组成
那么其实y的所有的variation就被分成两部分
一部分是x可以解释的variation
一部分是解释不了的variation
那就是的variation
那么x对y的解释强度当然是用β来表示的
所以这个是一个比较形象的维恩图
Ok那么一个简单的问题
那么在这样的维恩图里面
我们知道我们用x对y进行建模回归进行分析以后
我们会得到y关于x这个模型的一个fitted value,叫
拟合值
对不对
就是y hat, y 尖
大家看在维恩图里面哪一部分是y hat就是跑完回归
之后对吧
Y hat就等于β0 hat加上β1 hat乘以
x residual就没有了
这样的话哪一部分是y hat的
variation呢
对交叉的一部分大家说得非常好
也就是黄色阴影面积这一部分重合的这一部分
它就叫y hat的variation是吧
大家也充分理解了这个图想表达的意思非常好
Ok我们通过一个例子来形象的往后去讨论
那么这个是一个非常经典的教育经济学里面的例子
就是我们探讨schooling
受教育年限的长短
对于未来工资的影响
这个是一个很经典的问题
那么我们如果建模的话
就是wage 等于β0+β1×schooling
schooling是学业年限就是上多少年学,加上
residual
把它抽象为一个一般的方程
就是下面这个方程式
那么如果我们对这个方程做一个最小二乘法的估算的话
用这个去估计的方法
那么我们就会来用这样的一个推导
那么这一部分 x和y的协方差
我们把 y等于 x的公式把它带进去的话
那么就是下面这一部分等式的右边这一部分
β0+β1*x加上 residual (ε)
那么这个时候我们求这一个线性表达式和x的协方差
我们就往下走一步
它跟常数xi跟β0
常数的协方差当然是0
那么它跟β1xi的协方差就是它自己的方差
好
那么这是x的方差乘以β1
以及剩下 x和residual的协方差
那么我们把它写成一个简单的形式
就是σyx就等于β1*σx方加上
σεx,这是一样的
这样的话我们移动一下这个公式
等式就可以求出β1
它就等于
分子是
就是y跟x的协方差减去ε跟x的协方差除以x的
方差
我们这个OLS的假设是
ε跟x协方差等于0
这样的话前面这个式子它就等于 x y的协方差除以x
的方差
这个就是β1的估算值
那么这里面就用到了一个重要的假设
就是ε跟x的协方差
它是等于0的
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM