当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.20 HLM workshop 2
大家是不是就得到了这样的一个方程
我在
聊天区里面分享一下
也就是说
这个yij
它就等于γ00加上
γ01×vses
再加上 μ0j
εij
那么对应到咱们的第34行
大家看一下
management是我们的y
唯一的自变量
是
mean ses
不论它是第一层也好
还是第二层也好
它合并之后它就是一个
一个自变量就放在这儿
然后截距项了
没有其它的自变量了
接着就是我们的方差结构
就是有一个eij有一个μ0j
对吧
因此
我们用跟上面一样空模型一样
用 school冒号
来去做方差结构的这样的一个定义
那么大家就会去做这样的一个分析
所以这个就是34行
也就是大家注意到一点
不论你要加的自变量是
在第一层还是第二层
只要它只是一个变截距模型
合并之后它其实都在同一个方程里面
就是这样子的形式
所以大家跑一下第34行
跑到第34行来看一下这个结果
然后怎么去解读它
好 大家来看一下
估计你们都跑出来了
如果有困难的话就解开麦克说
大家来看一下
显然这个地方我们加入一个自变量以后
在 fix effect的model里面
我们就看到了多了一个变量的参数
那么就是 ses它的
系数是γ01就估算出来了
那么当然还有我们的γ00也在这
这个时候
下面方差结构
还是没有变化的
因为我们还是会对组间方差
和组内方差
分别进行估算
但它的值会发生变化
尤其是组间方差的值会变化
为什么
因为我们在第二层加入了变量了
那组间方差
它就残差的这部分肯定会变小了
那么这个就是在第二次加入
自变量的这样的一个效果
事实上大家看一下
咱们的 PPT
这个PPT里面我们这里
加的是第一层的变量
迪斯尼变量
把它合成
把这两个模型合到一起之后
其实跟刚才的形态是完全一样的
只不过刚才那个mean ses是第二层的变量
这里的IQ是第一层的变量
完全一样的
这里的待估参数是β
刚才是γ
不同层的参数而已
但实际上
我们写在一起它是
并不容易区分的
这就是一个变截距模型
那么我们接下来就来看变斜率模型怎么弄
变斜率模型显然更复杂
我们来看一下
首先后面第35行继续计算 IC
大家可以自己跑一下
IC会小一点点
因为我们加入了一个自变量
它会小一点点
同时用xt regression
来做同样的分析
只要我们定义好了
它用的是极大似然
估计它估算的结果跟前面是完全一样的
大家自己
去做练习
好
我们来看
变斜率模型,显然
会变形就更复杂一点
那么我们来看 PPT
大家应该是很熟悉了
当我们把
第二层
可以进行随机变化的β0j和β1j
分别带入第一层模型之后
我们得到的我们的reduce form也好
叫它一个整合的方程也好
大家可以看到
它残差结构就变得是这样子
首先自变量独立的自变量
其实刚才是一样的
就是一个截距项
还有一个自变量
因为是变斜率模型
它必须在第一层是有自变量
它才会有斜率
它们有可能在第二层就有变化
所以这个地方就变成第一层的自变量
不可能是第二层的自变量
再一个两层模型里
重点看到的是
它的残差
残差结构就变得很复杂
它就包括
μ
还有 ε
以及又跟第一层次变量的乘积项
我们带进去它就会出现这个东西
我们怎么样在stata里面把这个事说清楚
大家来一起来看一下
大家来看第42行
看第42行
这个里面我们用到的自变量
第一层的自变量就是c
s e s就是中心化之后的
学生个人的 s e s
它是一个group mean
它是中心化的group mean
我们来看 do file里我
提前写好了这样的一个公式
level 1
第一层的方程就是math
achievement
它是等于
α0j
加上αij
乘以c ses
再加上εij
那么第二层的
intercept as
outcome model now
α0j它是可以变化的
我们建模对它进行分析
在建模中
我加入了
ok第二步我们先不说这个
就先说前面二第二层我们先空着用μ1
先不加入这个
自变量,就是42行
那么这个方程大家看一下
就刚才说这个
一个是
43行
自变量以因变量math
achievement不
变
自变量是CSES
刚才我们说的第一层的自变量
然后双竖线
告诉data
school
是第二层的分组变量
在冒号后面
我们加入了CSes
也就是什么就是说
c s e s
它的斜率
需要在第二层变化的
告诉它这件事情
同时我们做了一个限定
就是说第一层跟第二层的
残差的相关性
它们是独立的不相关
uncorrelated
所以说43号命令
跟我们刚才在
PPT里面看到的这样的一个
reduced form才是非常一致
的
是这样的一个形式
可以说
截距项一个自变量
然后在残差里面
我通过在 school冒号后面加入
第一层的自变量Cses
来告诉对方
它在第二层它的斜斜率是可以变化的
是服从这样的一个
一个方差结构
那么大家把43行跑一下
42行我们不跑了
42行跟43行是一样的
是老的命令
好玩的大家就可以来看一下屏幕
希望你得到一个同样的结果
应该是同样的结果
我们来看固定效应部分
还是不变的
CSES的系数
当然这个是第一层的变量
以及截距它的γ00的估算
重点来看 random effect
这个地方
这个地方
它就增加了
增加了好几个随机的效应
哪些是没有变化的
第一个是residual
第一层的残差在这
第二层的残差μ也在这
但是这个地方我们就多了一个
c s e s的方差
它显然不是算的是变量的方差
而是这个变量的斜率
它的方差
就估算出来了
以及
协方差矩阵
它算了一个协方差在这里
那么也就是就是我们如何去在stata
里面去定义一个变斜率模型
并且
来去解读 output
当然我们来可以来看它到底是不是一个
显著的一个结果
你卡方检验来看
加上检验接着做就可以了
那么接下来我们再讨论一点
然后我们就
休息一下
接下来就是我们刚才说的怎么样
在第二层加入自变量
这个是在第二层次是空模型
那么一个full model
显然就是在第二层加入自变量
那么我们来看
在数据的模型里面
我们在第二层加入两个自变量
一个叫mean s e s刚才
用过了就是ses的均值
第二个就是sector
这个就是
一个dummy
那么这两个自变量没有特殊的理由的话
我们会
把它放到变斜率模型和变截距
模型里都放,是整齐的
那么
我们在48到
50行之间
来描述的分层模型
现在需要大家做的事情是什么
请你
把α0j和α1j
把它带入到第一层模型里面
变成一个combined model
就是我们只要一行
一行这个方程
一个方程一行命令
把 combined model写清楚
来看我如果在stata里面实现
对这样的一个两层full model的分析
好吧
显然我们就是要加入更多的
自变量
但是自变量的形态是什么样子的
你们先把 combined
model写出来
应该是比较清楚了
好吧 请大家写一下
写完之后因为都
就给你放这了 所以
鼓励大家写完之后直接贴到讨论区里面来
也就是说只要是我们在第二层的变斜率
变斜率模型里加入自变量
我们就需要把这些第二层的
自变量跟第一层的自变量
斜率会变的自变量
当然这里是唯一一个自变量
要做交互项对不对
也就是 mean s e s跟
这个sector都要跟第一层
的 c s e s做交互项
因为它是斜率
的一部分乘进去之后就有交互项产生
当然了变节距模型它不会出现交互
像它就是把这些自变量都
罗下来就可以罗列下来
所以大家来看一下
看下第58行 同学们
58行我们就要先生成两个自变量
一个是
meann s e s
和Cses的成绩项
一个是sector
跟Cses的成绩相这个就是交互项
然后看61行命令
math achievement是
然后是我们的三个自变量
其中两个来自第二层
一个来自第一层
这个是由便捷句模型带来的
接着是两个交互项
这个是由斜率模型带来的
之后我们用双竖线来去界定
random effect的
部分
分组变量是school
冒号之后是
斜率会变的自变量
就是Cses
然后后面是option
让它报告方差
而不包括标准差
然后我们说 covariance
是unspecified
那么61行其实就给大家展示了一个
怎么样去来做一个两阶段
两层的这样的一个
full model
大家可以把61行跑一下
先跑58行和59号
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM