当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.15 Q&A 3
然后第一道题是**师姐负责的题目
然后他问的是 hlm
和固定向量模型
随机向量模型之间的关系是什么
然后是不是说 hlm的方法在不同
层次的建模中可以使用这些模型
还是说这两种不同
一个是两种不同的因果推断的思想
我们知道 hlm
它也有一些别的名称
比如说混合模型
混合模型同时要考虑固定效应和随机效应
换句话说 他认为
适合于所有的观测值的系数都是固定的
因此而异的系数数是随机的
对于任何特定的解释变量
它可能具有随机斜率
也可能具有随机的截距
我们组认为在具体的模型设定当中
哪部分是固定的
哪部分是随机的
应该根据研究假设来判断
比如说我们就可以看到 hlm
这4组的模型设定
在空模型当中
我们把因变量拆分成一个
组的作用和一个个一个个体的作用
那组的作用就用这个组的作用分为一个
固定的部分
γ00和随机μ0j来表示
然后
公式yIj等于γ00加μ0j+
eij 单因素的方差模型
有总均值γ00分组效应
μ0j还有个人效应的 eij
零模型通常作为一个研究的起点
用来
作为分更加复杂的模型的参照
特别是用于计算
组间的相关系数
对于随机截距模型来说
我们可以从右下角这张图可以看出来
我们假定这个斜率是相同的
截距是不同的
比如说我们可以去研究
我们可以相信不同班级的
阅读水平是不同的
但是个体学生的学习时间对于
阅读能力是没有影响的
我们可以
使用这个模型
根据假设我们把第一层
第一层模型中的截距
β零这一设定成一个
固定的部分γ00
和一个随机的部分μ0j
然后把
β1j设定为固定的
把β1j 一设置斜率设置为固定的
在
对于随机的斜率模型来说
我们假设
斜率和截距都是随机的
比如说我们可以去
研究不同班级的
数学成绩的不同
并且我们可以打听不同班级
的数学成绩是不同的
然后
个体的智力对于
个体的智力水平对数学成绩也是有影响的
那么根据假设我们可以使用这样的模型
也是对于第一层的系数来说
我们把截距β0j分成了固定效应
它们
固定效应的部分γ00和
随机的部分μ0j
然后把斜率β1j也是
分成了一个固定的部分
γ10和随机的部分μ1j
在
完整的模型和随机斜率模型是类似的
区别就在于第二层多了解释的变量
总的来说 hlm同时考虑
的随机效应和固定效应
具体包括哪些内容应该
根据研究假设来判断
然后第二道题二道题
第二道题问的是
h7m对这几条题是金美系同学负责的
然后这道题问的是hlm对
抽样方法有没有什么要求
然后对每一层的样本量我们有什么要求
以一个两层为例
其实在我们实际的工作当中
很少说就是为了一种
特别的这种分析的方法去选择抽样的方法
更多的是根据有的数据去
选择合适的分析工具
因此对于数据的要求
其实
也就是对于产生这种数据
的抽样方法的要求
对于hlm来说
首先要求数据样本是多层次
并且要满足基本的假设
比如说方差齐性 独立性
还有线性
还有误差的正态分布
因此对于hlm来说
最合适的出让方法应该是分层抽样
当然如果说其他的方法可以达到上述
的这些要求的话也是可以的
Hlm对于样本量的要求比较高
总体来说是要用大样本的
分析方法
以下的这些
列出来这几篇的参考的文献当中
也是提出了一些
不同的法则
但是最近的一个研究 Hox
他提出来说说
通过设置不同的组别数和各组样
各组的样本数
发现还是说组别是更重要的
然后当组别达到50组的时候
个组样本数是5事实或者还是30
其实没有太大的区别
对
其实是不是跟我们之前讨论的
power analysis是很
像的
就是说如果他要组内相似性的时候
power可能更多的取决于
组的个数
而不是组内的样本的个数
咱们之前在rct的那个时候讨论过一次
现在还有印象
然后三第三道题问的是有没有
什么标准可以帮助我们判断
这个是hlm的适用与否
这道题**同学负责的
我们首先可以通过两个层面来考虑
首先我们在
选择之前就是要考虑的是什么样的问题
适合使用选择hlm的方法
然后我们要考虑到就是说
面对一个研究的
数据或者是问题的时候
首先要
想到的hlm他
要处理的就是说社会环境或者说高层次
的特征对个体行为产生的影响
比如说一个学校内部的学生会越来越相似
所以说当我想研究一个城市的学生的
学习时间对学习成绩的影响的时候
我们不必须要考虑到从学校
对学生成绩的影响
我们为什么一定要使用
hlm的方法
这样的话我们要考虑到就是说
如果不使用这个方法
他可能就会被
两种假设
一个是独立性的假设
因为样本之间可能会存在这个
相似性
第二个就会违背同方差的假设
通过使
从使用 h l m通过多层次
的一个数据来阐释不同层次之间的关系
然后进而可以帮助我们更好的
去分析变量之间的因果效应
选择之后
我们就要去考虑我们设置
的模型是否是合适的
我现在的第一步就是
我们可以去
进行假设检验
每一层的模型都应该去满足
方差齐性或者还有独立性
还有随机误差独立的假设
而两层模型之间的误差
不同层之间的变量
和随机误差项之间也要保持
独立 PPT蓝色的部分
假设关系到了第二层模型系数的准确性
然后黑色的部分关系到了第二
次模型技术标准物的准确性
因此如果说有一项假设不满足
然后都会影响模型的适切性
而哪条假设不会满足
我们就可以对应到左侧的三
点当中进行相应的调整
除了假设检验之外
我们也可以通过检验hlm
模型分析结果的稳健性
来去判断这个模型是否使用的合适
检验的方法就是选择其他的分析
方法这个数据去进行对比
将分析结果和基于hlm稳健
性标准物的结果来进行对比
这里强调的基于稳健性的标准误
是因为稳健标准误对于
模型中可能从
异方差或者是自相关
的问题是不敏感的
在样本量比较大的情况下
我们更相信稳健标准误下的技术估计
那么这里举了一个例子来去
说明如何去验证例子来
源于三篇参考文献
主要是
研究的问题是探讨新移民家庭子女和
父母的代际关系
因为使用的样本数据具有嵌套结构
同一个接受调查的老人可能
拥有多个存活的子女
所以他们会具有
一定的共同特征
所以选择了hlm的方法
对于数据的分析结果
我们可以从这个图里面看出来
主要是探讨左侧的这些自变量
对于子女提供经济支持 日常照料以及
情感知识可能性的影响
为了避免异方差性
这些技术的估计都是基于hlm的稳健性
稳健性的标准性
为了检验这一结果是否稳健
作者采用了二元probit回归的
回归检验
来检验经济支持和日常照料的研究结论
并采用了
os回归去检验情感知识的结论
就是右边这张图
右边这张图的结论与hlm的模型的分析
与
与右边这张图的结论与 hlm结果
的分析基本是一致的
所以进而就可以说明我们选择的模型它是
结果是具有稳定性
也就是说是比较合适的
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM