当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.16 Fixed-effect model
那么我们开始接着讲上节课没有讲完的固定效应跟随机
效应的问题
我们上节课已经把两个模型都讲到了
刚才正好最后一道问题也是在问这个问题
接着我们觉得讨论这两种模型的区别
ok那么这个是 random
intercept model
我们大家可以看到说在这个模型里面
我们把组间的残差提到了前面
那么这样的话我们就看上去得到了一个随机的一个截距
这个截距它随机在哪呢
就是说大家看到这个角标 i和j i是在一个
学校内部个体的编号
j是学校的编号
也就是说大家想一下 j如果我们给定学校
刚才陈哲也解释了
如果j的取值是知道了
那么这个时候μ0j也是一个固定值
对吧
比如说j=1
那么μ01就是第一个学校的均值跟所有样本就是grandmean
跟γ00
就跟grandmean的差值不是γ00
那么是差值的
也就是说这个时候这一部分它其实是固定的一个值
那么γ00是一个整个样本的一个均值
这个是样本的一个截距
那么μ01就是第一个学校的平均值跟样本均值的差值
他们俩共同构成了第一个学校的方程里面的截距项
那么这个时候这个时候j是给定的
只有i会变
也就是说这个方程就变成了在第一个学校内部那么构成的
一个回归方程
是不是
那么就是截距的意思
那么当比如说j等于5的时候
就是第5个学校内部的一个方程
所有的样本都是在第5个学校内部
因为j给定了固定住了
那么i从1一直到第k个
那么这样子来去理解
所以这个是截距的这样一个特点
那么我们休息5分钟
接着把后面讲完
因为后面还是比较重要的
大家先休息一下
好
同学们我们继续继续讲
好
下面这个很关键
首先这个式子大家有没有不理解的
对这个式子的定义
你们可以在聊天区里面提
也可以用弹幕都可以
好
那么既然我们看到说因为不同的学校它的学校的平均分不
一样
假设y是成绩的话
学校的平均跟每个学校不一样
那么它的截距项就会不一样
那么我们就可以我们就可以把这个γ00加上μ0j
写成一个变量
就写成αj那么αj也是随着j变化而
变化的
那么当然如果j是给定的时候
α的取值就是给定的是吧
我们刚才说了给定j的值我们是知道它的截距是多少的
但是如果j的值不知道的时候
我们就认为它是一个随机项
如果j可以在比如说1到J之间变化
那么一一般来讲
在这样的一个研究里面
嵌套的这样的一个数据结构下
cluster数量一般是比较少的
cluster数量相对于总的样本量来说一般会比较少
是可以比较容易的穷尽的
可以穷举的
因此我们来看咱们上节课说的例子
一共有41个学校参加了这个随机实验
那么取值就是从1~41是吧
那么其实我们就可以非常容易的把αj写成Sj
的一个线性表达式
那么这个Sj一它是一组哑变量
一组 dummy variable
也就是说当 observation i就是第i个
学生
它是来自于school j的时候
它所对应的 Sj的取值就是1
否则就等于0
那么这是一组这样的一组哑变量
那么这样的话
是不是我们非常好理解
当然我们把这个s1也去掉了
s1他作为参照组就把它去掉了
可能会共线
Ok
那么α0就可以代表第一组
所以说我没有当我们有41个组的时候
我们只需要40个哑变量就可以把它全部表达出来
那么这样的话其实大家想一下
每一个学校它的固定的这个截距是多少
是不是
α0加上它所对应的αj就跟这个式子的
表达的时候不同
αj跟这个αj不是完全一样的这个地方
它是α0加上它对应的 Sj的系数
所以我们把线性表达式重新带到前面的方程里面
我们就得到了下面这个方程
那么大家可以看到前面是一组看上去非常冗长的一个线性
表达式
他就说了一件事
第j个学校它的截距项是多少
是不是
大家看
上面这个式子我们只用一个随机变量αj来去表达的
时候
它是一个随机截距
那么下面这个式子我们用一个线性表达式非常清楚的展示
了每一个学校他的截距项的取值会是多少
它就变成了一个固定的截距
只要我知道学校是哪个学校
我就知道他的截距项是多少
所以我们就把下面这个式子叫做fixed effect
把上面这个式子我们上节课讲叫random
effect
有没有在概念上大家是不是就会很清晰了
他俩说的是一回事儿
对不对
一个是用一个 random effect
是用一个随机变量来表达了我们的截距
它在组间是可以变化的
么fixed effect的就直接用一组dummy来表达
Fixed effect model是不是我们非常常用
包括 year fixed effect
或者说是其实比如说最简单的大家感兴趣的一些dummy
variable的系数
比如说性别差异
或者是这个地区差异
用一组dummy来表达的时候
其实的效应其实都是fixed effect model
都是一样的
那么大家对这个有没有问题
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM