当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.17 Random-effecrt and Fiexed-effect model
没有问题我们就开始讨论两这两种模型的特点
那么这个random effect model跟 fixed
effect model
他们到底有何优劣
我们应该如何做出一个取舍
在我们的研究设计中
首先可以看到说
当然随机效应模型
因为他只用了所以说它的自由度它是比较大
但是大家想到它既然是用了一个random effect
model
那么它其实就是一个随机变量
那么这个随机性是来自于μ0j这一部分
那么这个μ0j我们要跑方程的话
这个随机变量残差
这一部分残差他是不是要符合我们跑回归的这些基本假设
也就是说 μ0j它不能跟其他的任何自
变量相关
对吧
跟他同一层的
比如说学校这一层的自变量
μ0j也不能跟他相关
那么跟学校内部的自变量也不能相关
比如说individual level的学生层面的
这些自变量也不能有相关
他就满足这个假设
那么跑回归得出来的这些自变量的系数才是无偏估计
所以说这个是有一个很强的假设要满足的
但是是不是他总能满足
其实是不一定的
是不是
那么这个是我们之前都反复讨论过的
我们再来看 fixed effect
固定效应模型
它的一个好处是非常清楚
是不是
我其实因为组也不会太多
几十个
然后我的样本量可能是上千
我放上几十个dummy进去
其实不太会影响我的方程的性质
而且我就可以非常清晰的把这些截距都表达出来
而且他不受而且它不受前面 random
effect里面的μ0j这一假设的限制
假设是很强的
但是 fixed effect model
fixed model它就会变成一组这个常数
对不对
一组dummy它的系数是一些常数
那么它就变成自变量了
这个时候在fixed effect model它是自变量
那么自变量我们就不用担心它是不是跟其他自变量相关的
问题了
是不是还有一点点简单的一些小的相关的不影响我们的
估算结果
就跟残差没有什么关系了
这个时候因为我们把残差变成了一组dummy和它的系数
所以说这个也是他的完美为止
我们不用担心假设了
而且还有一个很重要的应用是什么
就是说当我关心的比如说是个两层模型
当我关心的是第二层模型
是第一层模型的一些关键的解释变量的效应的时候
那么第二层的模型我就不需要加入很多的控制变量去解释
它
但是我又希望能够把残差尽量的减小
我就放一组 fixed effect就可以了
那么就用这一组dummy就可以把组间的差异很好的就控制住
这样的话第二层的残差也会比较小
我就放心的在第一层来去做我的探索就可以了
这是他的一个很大的优点
那么这个这是这一点
但是他它有两个明显的缺点
它的第一个缺点就是说它会失去很多自由度
如果我们的总的样本量
比如说是1000
我放上40个学校
其实没有什么关系
但我如果总的样本量
比如说200只有200个学生
我放40个dummy进去
自由度的损失是非常大的
那么第二个问题就是多重共线的问题
也就是说当我关心的解释变量也在就是fixed
effect变量的同一层的时候
像下面这个等式所展开的
那会出现多重共线
大家来看一下这个式子
也就是说这个sfa是我们每一个学校对这个学校是否
接受了 treatment这样的一个dummy
当然是我们的 rct里面的最重要的一个变量
分组变量
我们最关心的就是sfa的系数
这个γ01它就是 treatment的效果
是不是
但是变量是不是school level
我们是以学校为单位来实施的干预
所以说这是一个school level的
variable
那么而且因为我们提前是有一个分组的方案的
大家记得我们上节课展示的表格你们可以往前翻
那么分组方案也就是说我知道从第一个学校到第21个
学校
那么它是一组从比如说第22个到第41个学校
它是第二组
我是很清楚的知道每一个学校到底是在哪一组的
这个时候大家想一下
如果我知道前面的 s的取值
也就是说我知道他正好是第j个学校
我知道sj是等于1的
其他的s都等于0
那么前面这个截距项就变成了α0加上αj 就这样
的情况下
是不是我同时就知道了sfa的取值
因为这是j我知道了
是不是
那么sfa的取值我也同时知道了
所以这种情况就会出现一前面这一串的固定截距
跟我们最感兴趣的 treatment变量它成了共线
了
它是也就是说sfa变量可以被前面这一串s线性表出
也就这个意思
这是完全共线
这个时候导致我无法估算出我想我感兴趣的 sfa
的变量
就出现这样的一个问题
所以说在这种情况下
我们是没有办法使用 fixed effect model的
这点很重要
大家有没有听明白
大家想如果我感兴趣的变量不是在这个学校
是在 student这一层
是在学生这一层
那么它应该是在student level有一个方程
这个时候我在school level去控制这样的
一些变量
作为fixed effect model是没有问题的
因为它不在同一层上不会有共线的问题
但是如果我感兴趣的变量是一个01变量
在school level
那么这个时候我就会跟前面这一串 fixed
effect这样的一些变量共线
这时候就没有办法估算了
这时候我们只能使用random effect model
没有别的招
大家有没有问题
明白
那么接下来一个问题就是刚才提到的豪斯曼
当这两个方程都能用的时候
我选哪一个
那么这个时候我们就可以来做这样的一个豪斯曼检验
当两个方程都能用
如果 random effect model它满足
了它的假设
也就是残差μ0j跟所有的自变量不相关
我们当然会选择random effect model对不对
因为它的自由度会更大一点
它浪费的自由度少
那么但是如果我们μ0j它跟其他的自变量有相关
我们就不能选
我们就只能选fixed effect model
所以当两个都能用的时候
没有共线的问题的时候
我们选哪一个就要去来判断μ0j到底跟其他的自变量
是否相关
这个时候豪斯曼检验咱们的原理之前我们讲过了
h0就是原假设是
μ0j
他跟其他自变量都不相关
那么备择假设就是μ0j它跟其他自变量跟其中有一个
至少它可能是相关的
它是相关的
我们大家想一下
大家想一下豪斯曼检验它的原理是不是就
来看
在这两种假设下
这个方程的结果是不是应该一致
是不是
当μ0j跟自变量不相关的时候
我们不论用random effect
还是用fixed effect
我们得出来的估算值是不是应该是一致的
因为这两种方程都满足假设
所以他们的估算值应该都是无偏的
既然是无偏的
他们就应该是一致的
那么我们这个是第一种
但是当μ0j是跟某一个自变量相关的时候
那么是不是我们用random effect来估算的
结果它就是有偏的
而用fixed effect估算的结果是无偏的
是不是
这两种估算结果之间就会有一定的差异
有较大的差异
是不是
所以说我们其实就是利用这样的一个思想
构建统计量来去做这样的一个豪斯曼检验
豪斯曼检验的统计量我们之前都讲过了是一样的
只不过是我们把情境换了一下
所以如果豪斯曼检验我们拒绝了零假设
那么这种情况下
我们其实就是认为μ0j是跟某一个自变量相关的
我们就必须要选择fixed effect model
但是如果我们没有拒绝零假设
那么我们就会选择random effect
model
从这个方程的效率的角度来考虑
好
检验有没有问题
好
我们待会儿在workshop的时候还会再咱们一块来
看一下具体怎么做
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM