当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.23 HLM workshop 5
咱们一起来看一下
虽然是一个三层模型
但是因为第三层的模型是空模型
大家想一下
其实我们在设置自变量的形态的时候
其实跟刚才是不是很类似
并没有一些额外的影响
那么这个是
要能够考虑到的
那么
第二层我们加入了一个自变量cc
他去解释第一层的截距跟斜率
刚才我们已经总结过这个规律了
当然你也可以把它带进去
那也就是说 fix effect
部分包括
单独的这三个自变量
其中两个是第一层的自变量
一个是第二次的自变量
以及第二层自变量cc
跟他所model的
这个斜率
α1,是 pre test
score
跟他的交互项
对不对
所以说,
所以大家想一下这个变量其实就这么几个
一个是第一层的自变量
pretest
和tv
以及第二层的自变量
cc这三个独立的自变量
以及cc和
pretest就是prethink
这样的一个交互项
因为我们只认为prethink
的斜率在第二层是变化的
并且
对它进行了model
我们并没有去model t v的斜率
这点要注意
所以说其实这么来看的话
就是这么有4个
有4个自变量
那么在
写 random effect
这一部分
那么在 class level
显然我们要增加
prethink这样的一个斜率
那么其他的
都没有变化
因为剩下的只有一个变斜率模型
其他全部是变截距模型
变截距模型在上面三层的空
模型里面已经设定好了
就是这样子的一个school 冒号
还有class 冒号就设定好了
所以其实写出来就是这样子
我们其实你可以生成新变量
我们之前也用过双井号
大家来看一下
根据刚才咱们讨论的
第三次就是我们fix effect
的一共有这么几个变量
一个是prethink
一个是cc
一个是tv
以及 cc和
ok这里应该不是tv应该是
prethink的这样的一个交互
项
因为我model的是α1
那么我们就把换一下
就可以了
因为cc双井号prethink
它就代表了
几个变量代表了三个变量
一个是cc 一个是prethink
还有一个是cc乘以pre所以
这个就可以不要了
所以说一共就是4个变量
我们用这样的一个形式就可以
比较简约的表示出来
当然你也可以生成变量
然后再把它放进去
后面
老师你好像没有共享
你们提醒的太好了 我说半天
因为可能刚才搞了一个
分
分组 好
可以看到我的do file了
可以了吗
可以
大家来看我在这里写的
四因变量不变是这个think y
自变量我们可以看到
第一层的两个自变量prethink
和tv
以及第二层的自变量cc
这三个我们放在这儿
t v c c和prethink
以及
cc它用来解释的α1就是在这里
会跟 prethink有个交互项
所以cc乘以αcc
乘以prethink
有这么一个交互项
所以用双井号它就代表着 cc
prethink以及cc
乘以prethink
我们之前用过
在dId的时候用过
所以我们也可以这么简单的写一下
那么
在后面 school level
是空模型
我们这里没有加任何东西
我们可以不用去
管他
当然这个地方我们是
都是变截距 对
所以说这里没有变斜率不用管它
在class level
因为增加了一个变斜率
所以我们要把 prethink
放在class 冒号后面
因为它的斜率是可以变化的
我们就要把它定义清楚
所以这个模型大概写出来是这个样子
同学们有没有什么问题
所以这里关键的地方就是
要在 fix effect部分
也就是双竖线的前面
写清楚到底有哪些
就是独立的自变量
也就是跟残差没有交互项的这些自变量
它就包括每一层的自变量
就是变截距模型的自变量
以及
变斜率模型中第二层的自
变量跟第一层的斜率
对应的变量的交互项把写清楚
那么在
这个随机效应模型这一部分
其实就是要把这个方差就是
把这些残差把它写清楚
主要的残差是靠方差结构来去定义的
就是school 帽号跟class 冒号
当我们在某一层出现变斜率的
方程的时候
我们要把这个斜率所对应的
变量也写到冒号的后面
咱们之前反复的前面都是这么来做的
应该比较熟练了
所以这个方程写出来就是这样的一个形态
同学们有没有什么问题
好 没有问题的话
或者说你还没有想明白的话
课后还可以接着再练习
你可以再找我讨论
我们这个时间又到了
后面还有几个没有做完
我跟大家简单的说一下
你们后面感兴趣可以练习
一个是
我们刚才讨论的
它是一个嵌套结构
嵌套结构其实还可以做的一件事情
我们叫 cross effect
model
也就是说
它在两个变量之间都可以做这种
分组的cluster
比如说时间他可以做cluster
个体也可以做cluster
我们上面做的其实只是个体的
cluster增长模型里面
个体内部
它有组内相似性
但是实际上大家想这个时间内部
可能也是有种类相似性的
比如说我们本来想用的一个例子就是猪
猪的体重在养猪
猪的体重会发生变化
那么大家想可能猪在不同的季节
体重增长的速度是不一样的
那么也就是时间这个概念
这个在某一个时间
节点上
他们所有的这些体重可能也
会有一定的组内的相似性
就叫cross set cross
effect
所以说我们残差结构就会出现
μ
μi和vj
以及εij
他就是横着纵着他都分组了
这种情况下我们怎么去在方程里面去设定
主要就是用到了all
以及 r.factor这样的一个
设定
这个大家可以去通过读 menu
我们
文件夹里的menu
来去理解
如果你有还是不懂有问题
的话可以再找我讨论
再刚才就是答疑部分的时候
同学们提到的软件 hlm
这个软件其实可以嵌套在stata里使用
前提是你把这些数据准备好
那么它是可以用hlm这样的命令来去做的
这个我们也就不再去讨论了
因为这样的一些
功能在前面其实都可以实现
都是一样的
所以咱们今天workshop
就到这里
希望大家对hm的
整体的思路有了一个
更加清晰的一个
深入的一个了解
后面最重要你要掌握起来
确实是要用定量分析
你不用
肯定是
不可能熟练掌握的
用一次做一个研究出来
你就会很熟练了
所以鼓励大家积极的去使用
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM