7.15 Q&A 3慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

然后第一道题是**师姐负责的题目

然后他问的是 hlm

和固定向量模型

随机向量模型之间的关系是什么

然后是不是说 hlm的方法在不同

层次的建模中可以使用这些模型

还是说这两种不同

一个是两种不同的因果推断的思想

我们知道 hlm

它也有一些别的名称

比如说混合模型

混合模型同时要考虑固定效应和随机效应

换句话说他认为

适合于所有的观测值的系数都是固定的

因此而异的系数数是随机的

对于任何特定的解释变量

它可能具有随机斜率

也可能具有随机的截距

我们组认为在具体的模型设定当中

哪部分是固定的

哪部分是随机的

应该根据研究假设来判断

比如说我们就可以看到 hlm

这4组的模型设定

在空模型当中

我们把因变量拆分成一个

组的作用和一个个一个个体的作用

那组的作用就用这个组的作用分为一个

固定的部分

γ00和随机μ0j来表示

然后

公式yIj等于γ00加μ0j+

eij 单因素的方差模型

有总均值γ00分组效应

μ0j还有个人效应的 eij

零模型通常作为一个研究的起点

用来

作为分更加复杂的模型的参照

特别是用于计算

组间的相关系数

对于随机截距模型来说

我们可以从右下角这张图可以看出来

我们假定这个斜率是相同的

截距是不同的

比如说我们可以去研究

我们可以相信不同班级的

阅读水平是不同的

但是个体学生的学习时间对于

阅读能力是没有影响的

我们可以

使用这个模型

根据假设我们把第一层

第一层模型中的截距

β零这一设定成一个

固定的部分γ00

和一个随机的部分μ0j

然后把

β1j设定为固定的

把β1j 一设置斜率设置为固定的

在

对于随机的斜率模型来说

我们假设

斜率和截距都是随机的

比如说我们可以去

研究不同班级的

数学成绩的不同

并且我们可以打听不同班级

的数学成绩是不同的

然后

个体的智力对于

个体的智力水平对数学成绩也是有影响的

那么根据假设我们可以使用这样的模型

也是对于第一层的系数来说

我们把截距β0j分成了固定效应

它们

固定效应的部分γ00和

随机的部分μ0j

然后把斜率β1j也是

分成了一个固定的部分

γ10和随机的部分μ1j

在

完整的模型和随机斜率模型是类似的

区别就在于第二层多了解释的变量

总的来说 hlm同时考虑

的随机效应和固定效应

具体包括哪些内容应该

根据研究假设来判断

然后第二道题二道题

第二道题问的是

h7m对这几条题是金美系同学负责的

然后这道题问的是hlm对

抽样方法有没有什么要求

然后对每一层的样本量我们有什么要求

以一个两层为例

其实在我们实际的工作当中

很少说就是为了一种

特别的这种分析的方法去选择抽样的方法

更多的是根据有的数据去

选择合适的分析工具

因此对于数据的要求

其实

也就是对于产生这种数据

的抽样方法的要求

对于hlm来说

首先要求数据样本是多层次

并且要满足基本的假设

比如说方差齐性独立性

还有线性

还有误差的正态分布

因此对于hlm来说

最合适的出让方法应该是分层抽样

当然如果说其他的方法可以达到上述

的这些要求的话也是可以的

Hlm对于样本量的要求比较高

总体来说是要用大样本的

分析方法

以下的这些

列出来这几篇的参考的文献当中

也是提出了一些

不同的法则

但是最近的一个研究 Hox

他提出来说说

通过设置不同的组别数和各组样

各组的样本数

发现还是说组别是更重要的

然后当组别达到50组的时候

个组样本数是5事实或者还是30

其实没有太大的区别

对

其实是不是跟我们之前讨论的

power analysis是很

像的

就是说如果他要组内相似性的时候

power可能更多的取决于

组的个数

而不是组内的样本的个数

咱们之前在rct的那个时候讨论过一次

现在还有印象

然后三第三道题问的是有没有

什么标准可以帮助我们判断

这个是hlm的适用与否

这道题**同学负责的

我们首先可以通过两个层面来考虑

首先我们在

选择之前就是要考虑的是什么样的问题

适合使用选择hlm的方法

然后我们要考虑到就是说

面对一个研究的

数据或者是问题的时候

首先要

想到的hlm他

要处理的就是说社会环境或者说高层次

的特征对个体行为产生的影响

比如说一个学校内部的学生会越来越相似

所以说当我想研究一个城市的学生的

学习时间对学习成绩的影响的时候

我们不必须要考虑到从学校

对学生成绩的影响

我们为什么一定要使用

hlm的方法

这样的话我们要考虑到就是说

如果不使用这个方法

他可能就会被

两种假设

一个是独立性的假设

因为样本之间可能会存在这个

相似性

第二个就会违背同方差的假设

通过使

从使用 h l m通过多层次

的一个数据来阐释不同层次之间的关系

然后进而可以帮助我们更好的

去分析变量之间的因果效应

选择之后

我们就要去考虑我们设置

的模型是否是合适的

我现在的第一步就是

我们可以去

进行假设检验

每一层的模型都应该去满足

方差齐性或者还有独立性

还有随机误差独立的假设

而两层模型之间的误差

不同层之间的变量

和随机误差项之间也要保持

独立 PPT蓝色的部分

假设关系到了第二层模型系数的准确性

然后黑色的部分关系到了第二

次模型技术标准物的准确性

因此如果说有一项假设不满足

然后都会影响模型的适切性

而哪条假设不会满足

我们就可以对应到左侧的三

点当中进行相应的调整

除了假设检验之外

我们也可以通过检验hlm

模型分析结果的稳健性

来去判断这个模型是否使用的合适

检验的方法就是选择其他的分析

方法这个数据去进行对比

将分析结果和基于hlm稳健

性标准物的结果来进行对比

这里强调的基于稳健性的标准误

是因为稳健标准误对于

模型中可能从

异方差或者是自相关

的问题是不敏感的

在样本量比较大的情况下

我们更相信稳健标准误下的技术估计

那么这里举了一个例子来去

说明如何去验证例子来

源于三篇参考文献

主要是

研究的问题是探讨新移民家庭子女和

父母的代际关系

因为使用的样本数据具有嵌套结构

同一个接受调查的老人可能

拥有多个存活的子女

所以他们会具有

一定的共同特征

所以选择了hlm的方法

对于数据的分析结果

我们可以从这个图里面看出来

主要是探讨左侧的这些自变量

对于子女提供经济支持日常照料以及

情感知识可能性的影响

为了避免异方差性

这些技术的估计都是基于hlm的稳健性

稳健性的标准性

为了检验这一结果是否稳健

作者采用了二元probit回归的

回归检验

来检验经济支持和日常照料的研究结论

并采用了

os回归去检验情感知识的结论

就是右边这张图

右边这张图的结论与hlm的模型的分析

与

与右边这张图的结论与 hlm结果

的分析基本是一致的

所以进而就可以说明我们选择的模型它是

结果是具有稳定性

也就是说是比较合适的

7.15 Q&A 3在线视频

7.15 Q&A 3课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

7.15 Q&A 3笔记与讨论

也许你还感兴趣的课程: