7.6 Three level HLM慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

那么上星期我们是把 hlm 模型的

使用的

背景为什么要使用它

怎么样来去建一个两层的模型

它的分析的估算的思路是什么样子的

我们都

做了讨论

那么我们接下来就开始进一步的延伸

那么首先是从两阶段模型

两层模型扩展到三层模型

刚才已经有同学问了

显然他是认真预习了非常好

那么我们

答疑的同学也答得很好

所以我们这一块就简单的来看一下

两层模型还是三层模型

本质上是取决于你的数据结构的

如果你的数据结构本身

它的组织的模式上

就能分成三层的话

就应该有三层模型

但是因为我们知道这个组可以无限

有的时候可以分很多层的

那么如果有的层它其实

并没有很强的组内相似性的话

就没有必要考虑这一层

所以说

给大家在建模的时候要注意的

那么三层模型我们在这样的一个

例子就加入班级这一层

就第二层加入班级这一层

就是student level

学生嵌套在班级里

班级嵌套在学校里这样

的一个三层嵌套模型

那么班级这一层

磨成模型的型空模型的形式

这个就比较简单

我们

来看一下那么

也就是说

β00k是每一个

每一个

每一个学校的这样的一个

均值

那么

π0j是每一个班的均值

那么在一个学校内部

每一个班与班之间的均值都不相等

我们就会出现π0j这样

的一个变截距模型

就是截距可以随机变化的

这样的一个模型

当然β00k它也是变的

它在哪一层变它在学校这一层变

那是下一层

所以

方差形态

那么在school level

就是第三层模型

β10k

它才等于grand mean

grand mean

这时候角标就变成三个数字

γ000

再加上残差μ00k

那么这个就是三层模型

思路上来看是非常的

容易做到的

以此类推就做到了

那么这张图刚才同学们也都展示了

所以我们可以看到它这样的一个嵌套关系

当然我们对每一层的残差

它的方差都做了一个假设

分别是多少我们都把它记下来

那么这些都是可以估算的参数

所以空模型方差分析它

其实就是分为三部分

一个是班内的

一个是班级之间

同一个学校内部班级之间的

再一个就是学校之间的

那么这个方差就被分成三部分

我们做方差分析的时候

那么这个估算也是一样的

我们还是使用 shrinkage

estimation

那么也是要先对它

reliability进行

估算

那么估算的思路跟两阶段是一样的

只不过方程的公式

它会更加复杂一些

因为多了一层

不要求大家掌握

但是这个思路大家了解

所以我们来看这个肯定是model

就是说我们加入斜变量

那么在第一层大家可以看到Yijk

是第二个学生在第j个班级

在第k个学校

他的 outcome比如说成绩

那么它在斯顿勒布就有

很多个体层面的变量

可以决定影响到他的成绩

那么这些变量就分别是α一

ajk一直到α

p什么有这些

协变量

他们会对应一组参数π系数

那么这个就是第一层的建模

当然我们可以把它写成一个非常

简约的形式连加的形式

那么所有的这些大家看这里面就是两种参

三种参数

一个是π0jk这个是截距

再一种就是斜率

从π1到πp这个是斜率

再就是我们的残差这个意义可以

这也是我们的代工参数

那么显然

首先我们肯定会去假设

π0jk

也就是不同班级之间的

平均分

他们是有差异的

那么这样才会给我们一个理由

在第二层建模

在班级层面建模

那么斜率是否需要变化

我们上节课讨论过

是取决于我们的假设

就是理论他们是不是在班级层面要变化

以及数据的实际的情况是

假设检验我们待会看一下

所以

当我们假设第一层的某一个参数

无论它是截距也好

还是斜率也好

πpjk

他在班级层面是可以变化的

学校内部班级层面他是可以变化的

那么这个时候我们就可以在第二层加入

班级层面的这些协变量来去建模

来解释它的变化

它为什么会变

班级层面什么特征导致它的变化

对吧

那么我们就加入 x

这一组

变量

么x是班级层面的变量

大家想一下

这个班级层面的变量一般是什么

因为学生个体特征我们都已经很熟悉了

那么班级层面的变量

针对这一个班级它是不变的

但是不同班级之间它是变化的

往往

我们会考虑哪些变量呢

我们会考虑

比如说班级平均分

班级性别比

班内接受比如说阳光午餐的

也就是比如困难补助的

学生的比例

或者是班级的 s e s的平均值

等等

就是这些班级特征的这些

aggregate data

作为班级层面的这些写变量

这个是大家要注意

你是怎么去产生和

选取班级的级别量的

包括比如说教师一个班就面对一个教师

教师的一些特点

也可以成为班级层面的一些协变量

习变量的选取

当然具体的话就要看具体的研究了

那么接着就是在 school

level

当我们在第二层class level

产生了这个就是放入了一系列

的这些协变量的时候

就算我不放协变量

我们还有一个截距就是

βp0k还有这么个截距

那么放入更多的协变量的时候

就会产生更多的待估参数

这些待估参数还是截距

以及斜率

当然还有残差

截距跟斜率它就可以在school

level变化

这个

这个就是说

学校之间它有不同的

截距或者说是第二层的斜率

那么我们就可以在第三层建模

就在school level

我用学校层面的这些特征这些变量

来去解释

这些参数

班级层面的参数为什么

他在学校这个层面上他能够变化

那么这个时候我们就引入

一组 w这组参数同样

这组参数它是在学校层面的一些

aggregate的β

比如说百分比

平均分

等等那么

如果你的研究兴趣在于组织结构

institution

organization

这个时候这些

组织层面的一些变量

包括比如说我们见过的校长领导力等等

这些变量就放到学校层面上来

那么就可以来建模去分析

这个是三层模型

那么这张图刚才同学们也都讨论了

并不是说

我们是可以非常任意的去

在建成一个三层模型以后

要去加很多的变量

第一个我们要不要建三层模型

第二个就是说我们建了三层模型以后

我们

到底要

一

放入多少鞋变量

因为大家可以看到

当我们放入一个协变量之后

我们其实会产生大量的代步参数

那么这个就会

第一个占有很多自由度

第二个它会使我们的估算

就越来变得越来越困难

尤其大家知道当你的假设

斜率来变化的时候

其实你会产生一大批

自变量的交叉项

和自变量以及不同层级的残差的交叉项

所以这些交叉项的估算其实是非常困难的

他不见得说你的数据会支撑

你这个模型写好了

实际估算的时候可能估算不出来

这个极大似然估计法

他最后不收敛

就求不出极值

这种情况都会遇到

当你的方程变得非常复杂的时候

所以不要随意的去设一个很复杂的方程

虽然不是你手算

电脑里面也算不出来

那么我们这个时候就要想清楚

我们为什么

要在这一层

加自变量

有的时候我们可能只需要考虑

一个残差结构就可以了

比如说它是三层模型

但是我可能只在

其中的一层或者两层

加自变量

有一层我其实只控制它的方差结构

不去在这一层加入泄变量

出于研究目的出于

各个方面的考虑

有的时候如果我没有特别强的研究兴趣

和理论假设

我不要把那些斜率都设成是随机的

你设一个随机斜率

就要估算好多东西

它那个方程的复杂程度是完全不一样的

所以这些都是大家要

要在建模的时候考虑的

因为时间关系

我们就不展开讨论了

所以更多的是需要实战

大家以后有机会用的时候

可以再展开了去探究

那么这个就是关于三层模型

7.6 Three level HLM在线视频

7.6 Three level HLM课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

7.6 Three level HLM笔记与讨论

也许你还感兴趣的课程: