当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.6 Three level HLM
那么上星期我们是把 hlm 模型的
使用的
背景为什么要使用它
怎么样来去建一个两层的模型
它的分析的估算的思路是什么样子的
我们都
做了讨论
那么我们接下来就开始进一步的延伸
那么首先是从两阶段模型
两层模型扩展到三层模型
刚才已经有同学问了
显然他是认真预习了 非常好
那么我们
答疑的同学也答得很好
所以我们这一块就简单的来看一下
两层模型还是三层模型
本质上是取决于你的数据结构的
如果你的数据结构本身
它的组织的模式上
就能分成三层的话
就应该有三层模型
但是因为我们知道这个组可以无限
有的时候可以分很多层的
那么如果有的层它其实
并没有很强的组内相似性的话
就没有必要考虑这一层
所以说
给大家在建模的时候要注意的
那么三层模型我们在这样的一个
例子就加入班级这一层
就第二层加入班级这一层
就是student level
学生嵌套在班级里
班级嵌套在学校里这样
的一个三层嵌套模型
那么班级这一层
磨成模型的型空模型的形式
这个就比较简单
我们
来看一下 那么
也就是说
β00k是每一个
每一个
每一个学校的这样的一个
均值
那么
π0j是每一个班的均值
那么在一个学校内部
每一个班与班之间的均值都不相等
我们就会出现π0j这样
的一个变截距模型
就是截距可以随机变化的
这样的一个模型
当然β00k它也是变的
它在哪一层变 它在学校这一层变
那是下一层
所以
方差形态
那么在school level
就是第三层模型
β10k
它才等于grand mean
grand mean
这时候角标就变成三个数字
γ000
再加上残差μ00k
那么这个就是三层模型
思路上来看是非常的
容易做到的
以此类推就做到了
那么这张图刚才同学们也都展示了
所以我们可以看到它这样的一个嵌套关系
当然我们对每一层的残差
它的方差都做了一个假设
分别是多少我们都把它记下来
那么这些都是可以估算的参数
所以空模型方差分析它
其实就是分为三部分
一个是班内的
一个是班级之间
同一个学校内部班级之间的
再一个就是学校之间的
那么这个方差就被分成三部分
我们做方差分析的时候
那么这个估算也是一样的
我们还是使用 shrinkage
estimation
那么也是要先对它
reliability进行
估算
那么估算的思路跟两阶段是一样的
只不过方程的公式
它会更加复杂一些
因为多了一层
不要求大家掌握
但是这个思路大家了解
所以我们来看这个肯定是model
就是说我们加入斜变量
那么在第一层大家可以看到Yijk
是第二个学生在第j个班级
在第k个学校
他的 outcome比如说成绩
那么它在斯顿勒布就有
很多个体层面的变量
可以决定影响到他的成绩
那么这些变量就分别是α一
ajk一直到α
p什么有这些
协变量
他们会对应一组参数π系数
那么这个就是第一层的建模
当然我们可以把它写成一个非常
简约的形式连加的形式
那么所有的这些大家看这里面就是两种参
三种参数
一个是π0jk这个是截距
再一种就是斜率
从π1到πp这个是斜率
再就是我们的残差这个意义可以
这也是我们的代工参数
那么显然
首先我们肯定会去假设
π0jk
也就是不同班级之间的
平均分
他们是有差异的
那么这样才会给我们一个理由
在第二层建模
在班级层面建模
那么斜率是否需要变化
我们上节课讨论过
是取决于我们的假设
就是理论他们是不是在班级层面要变化
以及数据的实际的情况是
假设检验我们待会看一下
所以
当我们假设第一层的某一个参数
无论它是截距也好
还是斜率也好
πpjk
他在班级层面是可以变化的
学校内部班级层面他是可以变化的
那么这个时候我们就可以在第二层加入
班级层面的这些协变量来去建模
来解释它的变化
它为什么会变
班级层面什么特征导致它的变化
对吧
那么我们就加入 x
这一组
变量
么x是班级层面的变量
大家想一下
这个班级层面的变量一般是什么
因为学生个体特征我们都已经很熟悉了
那么班级层面的变量
针对这一个班级它是不变的
但是不同班级之间它是变化的
往往
我们会考虑哪些变量呢
我们会考虑
比如说班级平均分
班级性别比
班内接受比如说阳光午餐的
也就是比如困难补助的
学生的比例
或者是班级的 s e s的平均值
等等
就是这些班级特征的这些
aggregate data
作为班级层面的这些写变量
这个是大家要注意
你是怎么去产生和
选取班级的级别量的
包括比如说教师一个班就面对一个教师
教师的一些特点
也可以成为班级层面的一些协变量
习变量的选取
当然具体的话就要看具体的研究了
那么接着就是在 school
level
当我们在第二层class level
产生了这个就是放入了一系列
的这些协变量的时候
就算我不放协变量
我们还有一个截距就是
βp0k还有这么个截距
那么放入更多的协变量的时候
就会产生更多的待估参数
这些待估参数还是截距
以及斜率
当然还有残差
截距跟斜率它就可以在school
level变化
这个
这个就是说
学校之间它有不同的
截距或者说是第二层的斜率
那么我们就可以在第三层建模
就在school level
我用学校层面的这些特征这些变量
来去解释
这些参数
班级层面的参数 为什么
他在学校这个层面上他能够变化
那么这个时候我们就引入
一组 w这组参数同样
这组参数它是在学校层面的一些
aggregate的β
比如说百分比
平均分
等等 那么
如果你的研究兴趣在于组织结构
institution
organization
这个时候这些
组织层面的一些变量
包括比如说我们见过的校长领导力等等
这些变量就放到学校层面上来
那么就可以来建模去分析
这个是三层模型
那么这张图刚才同学们也都讨论了
并不是说
我们是可以非常任意的去
在建成一个三层模型以后
要去加很多的变量
第一个我们要不要建三层模型
第二个就是说我们建了三层模型以后
我们
到底要
一
放入多少鞋变量
因为大家可以看到
当我们放入一个协变量之后
我们其实会产生大量的代步参数
那么这个就会
第一个占有很多自由度
第二个它会使我们的估算
就越来变得越来越困难
尤其大家知道当你的假设
斜率来变化的时候
其实你会产生一大批
自变量的交叉项
和自变量以及不同层级的残差的交叉项
所以这些交叉项的估算其实是非常困难的
他不见得说你的数据会支撑
你这个模型写好了
实际估算的时候可能估算不出来
这个极大似然估计法
他最后不收敛
就求不出极值
这种情况都会遇到
当你的方程变得非常复杂的时候
所以不要随意的去设一个很复杂的方程
虽然不是你手算
电脑里面也算不出来
那么我们这个时候就要想清楚
我们为什么
要在这一层
加自变量
有的时候我们可能只需要考虑
一个残差结构就可以了
比如说它是三层模型
但是我可能只在
其中的一层或者两层
加自变量
有一层我其实只控制它的方差结构
不去在这一层加入泄变量
出于研究目的 出于
各个方面的考虑
有的时候如果我没有特别强的研究兴趣
和理论假设
我不要把那些斜率都设成是随机的
你设一个随机斜率
就要估算好多东西
它那个方程的复杂程度是完全不一样的
所以这些都是大家要
要在建模的时候考虑的
因为时间关系
我们就不展开讨论了
所以更多的是需要实战
大家以后有机会用的时候
可以再展开了去探究
那么这个就是关于三层模型
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM