3.17 Random-effecrt and Fiexed-effect model慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

没有问题我们就开始讨论两这两种模型的特点

那么这个random effect model跟 fixed

effect model

他们到底有何优劣

我们应该如何做出一个取舍

在我们的研究设计中

首先可以看到说

当然随机效应模型

因为他只用了所以说它的自由度它是比较大

但是大家想到它既然是用了一个random effect

model

那么它其实就是一个随机变量

那么这个随机性是来自于μ0j这一部分

那么这个μ0j我们要跑方程的话

这个随机变量残差

这一部分残差他是不是要符合我们跑回归的这些基本假设

也就是说 μ0j它不能跟其他的任何自

变量相关

对吧

跟他同一层的

比如说学校这一层的自变量

μ0j也不能跟他相关

那么跟学校内部的自变量也不能相关

比如说individual level的学生层面的

这些自变量也不能有相关

他就满足这个假设

那么跑回归得出来的这些自变量的系数才是无偏估计

所以说这个是有一个很强的假设要满足的

但是是不是他总能满足

其实是不一定的

是不是

那么这个是我们之前都反复讨论过的

我们再来看 fixed effect

固定效应模型

它的一个好处是非常清楚

是不是

我其实因为组也不会太多

几十个

然后我的样本量可能是上千

我放上几十个dummy进去

其实不太会影响我的方程的性质

而且我就可以非常清晰的把这些截距都表达出来

而且他不受而且它不受前面 random

effect里面的μ0j这一假设的限制

假设是很强的

但是 fixed effect model

fixed model它就会变成一组这个常数

对不对

一组dummy它的系数是一些常数

那么它就变成自变量了

这个时候在fixed effect model它是自变量

那么自变量我们就不用担心它是不是跟其他自变量相关的

问题了

是不是还有一点点简单的一些小的相关的不影响我们的

估算结果

就跟残差没有什么关系了

这个时候因为我们把残差变成了一组dummy和它的系数

所以说这个也是他的完美为止

我们不用担心假设了

而且还有一个很重要的应用是什么

就是说当我关心的比如说是个两层模型

当我关心的是第二层模型

是第一层模型的一些关键的解释变量的效应的时候

那么第二层的模型我就不需要加入很多的控制变量去解释

它

但是我又希望能够把残差尽量的减小

我就放一组 fixed effect就可以了

那么就用这一组dummy就可以把组间的差异很好的就控制住

这样的话第二层的残差也会比较小

我就放心的在第一层来去做我的探索就可以了

这是他的一个很大的优点

那么这个这是这一点

但是他它有两个明显的缺点

它的第一个缺点就是说它会失去很多自由度

如果我们的总的样本量

比如说是1000

我放上40个学校

其实没有什么关系

但我如果总的样本量

比如说200只有200个学生

我放40个dummy进去

自由度的损失是非常大的

那么第二个问题就是多重共线的问题

也就是说当我关心的解释变量也在就是fixed

effect变量的同一层的时候

像下面这个等式所展开的

那会出现多重共线

大家来看一下这个式子

也就是说这个sfa是我们每一个学校对这个学校是否

接受了 treatment这样的一个dummy

当然是我们的 rct里面的最重要的一个变量

分组变量

我们最关心的就是sfa的系数

这个γ01它就是 treatment的效果

是不是

但是变量是不是school level

我们是以学校为单位来实施的干预

所以说这是一个school level的

variable

那么而且因为我们提前是有一个分组的方案的

大家记得我们上节课展示的表格你们可以往前翻

那么分组方案也就是说我知道从第一个学校到第21个

学校

那么它是一组从比如说第22个到第41个学校

它是第二组

我是很清楚的知道每一个学校到底是在哪一组的

这个时候大家想一下

如果我知道前面的 s的取值

也就是说我知道他正好是第j个学校

我知道sj是等于1的

其他的s都等于0

那么前面这个截距项就变成了α0加上αj 就这样

的情况下

是不是我同时就知道了sfa的取值

因为这是j我知道了

是不是

那么sfa的取值我也同时知道了

所以这种情况就会出现一前面这一串的固定截距

跟我们最感兴趣的 treatment变量它成了共线

了

它是也就是说sfa变量可以被前面这一串s线性表出

也就这个意思

这是完全共线

这个时候导致我无法估算出我想我感兴趣的 sfa

的变量

就出现这样的一个问题

所以说在这种情况下

我们是没有办法使用 fixed effect model的

这点很重要

大家有没有听明白

大家想如果我感兴趣的变量不是在这个学校

是在 student这一层

是在学生这一层

那么它应该是在student level有一个方程

这个时候我在school level去控制这样的

一些变量

作为fixed effect model是没有问题的

因为它不在同一层上不会有共线的问题

但是如果我感兴趣的变量是一个01变量

在school level

那么这个时候我就会跟前面这一串 fixed

effect这样的一些变量共线

这时候就没有办法估算了

这时候我们只能使用random effect model

没有别的招

大家有没有问题

明白

那么接下来一个问题就是刚才提到的豪斯曼

当这两个方程都能用的时候

我选哪一个

那么这个时候我们就可以来做这样的一个豪斯曼检验

当两个方程都能用

如果 random effect model它满足

了它的假设

也就是残差μ0j跟所有的自变量不相关

我们当然会选择random effect model对不对

因为它的自由度会更大一点

它浪费的自由度少

那么但是如果我们μ0j它跟其他的自变量有相关

我们就不能选

我们就只能选fixed effect model

所以当两个都能用的时候

没有共线的问题的时候

我们选哪一个就要去来判断μ0j到底跟其他的自变量

是否相关

这个时候豪斯曼检验咱们的原理之前我们讲过了

h0就是原假设是

μ0j

他跟其他自变量都不相关

那么备择假设就是μ0j它跟其他自变量跟其中有一个

至少它可能是相关的

它是相关的

我们大家想一下

大家想一下豪斯曼检验它的原理是不是就

来看

在这两种假设下

这个方程的结果是不是应该一致

是不是

当μ0j跟自变量不相关的时候

我们不论用random effect

还是用fixed effect

我们得出来的估算值是不是应该是一致的

因为这两种方程都满足假设

所以他们的估算值应该都是无偏的

既然是无偏的

他们就应该是一致的

那么我们这个是第一种

但是当μ0j是跟某一个自变量相关的时候

那么是不是我们用random effect来估算的

结果它就是有偏的

而用fixed effect估算的结果是无偏的

是不是

这两种估算结果之间就会有一定的差异

有较大的差异

是不是

所以说我们其实就是利用这样的一个思想

构建统计量来去做这样的一个豪斯曼检验

豪斯曼检验的统计量我们之前都讲过了是一样的

只不过是我们把情境换了一下

所以如果豪斯曼检验我们拒绝了零假设

那么这种情况下

我们其实就是认为μ0j是跟某一个自变量相关的

我们就必须要选择fixed effect model

但是如果我们没有拒绝零假设

那么我们就会选择random effect

model

从这个方程的效率的角度来考虑

好

检验有没有问题

好

我们待会儿在workshop的时候还会再咱们一块来

看一下具体怎么做

3.17 Random-effecrt and Fiexed-effect model在线视频

3.17 Random-effecrt and Fiexed-effect model课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

3.17 Random-effecrt and Fiexed-effect model笔记与讨论

也许你还感兴趣的课程: