当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.16 Q&A 4
各位同学老师大家好
接下来我为大家带来我们
第二组负责的这三道题
其实我们
最后只解答两道题
因为第三道题的时候关于一个模型的推导
老师说有点超
所以说那道题就省略了
首先我们来看第4题
第4题的同学他问hlm的实现方式
除了stata的运算之外
是否还需要其他的应用
然后他说带着他自己的尝试过程
中发现人去下载其他的软件
我们想他这个问题主要是想问
一下的一个具体的操作过程
他问的应该是属于hlm
的一个数据的预处理以及
需要
准备那种
而且要模型能够识别文件的格式
的一个处理需要用到的软件
我们通过查找一些资料发现
在我们stata运算之前
我们是需要对 hlm
的数据进行一个处理
它有一个程序
叫做hlm多层线性模型的一个
小小程序
是一个软件
然后这个东西的话它主要
用来干嘛
刚刚能完成刚刚我说的上述的一些步骤
首先它这个软件需要的数据类型
就是spss的那种格式
然后当我们把在spss里面
首先要把数据
结构弄成那种嵌套数据的那种结构
要把每一层
他们之间的ID进行一个设置
然后以及它的下一层关联
的ID进行一个设置
然后把它们进行一个排序
相近的排在一起
然后第二步的话就是要创建 h l m
能够分析的数据文件格式叫mdm
然后他是
首先是要把这个东西给输进去
然后你要在里面输进去了之后
它会
提示你
怎么去点那些信息
然后你一步一步的点
然后把这个数据文件给整理好了之后
这个时候你要把 m d m给打开
然后在里面然后指定你的因变量是什么
你以及本的二层模型来讲的话
你要添加在里面同时添加一层的
这边有哪些二层的自变量哪些
这个时候你才完成了数据的一个预准备
然后可以用详细的系统的一个数据分析
然后详细的资料的话
大家可以参考网址
后面发给大家
就这个软件
打断一下**
这个软件如果没有错的话
应该是咱们用的教材的作者
他们自己开发的就软件其实
比stata的命令产生的要早
我当年读博的时候就是用
这个软件来做分析的
他稍微他的特点是什么
是窗口操作
还是很直观 对
但是
他不能写命令
不能写命令的话
就是每一次分析都得重新按
点那些按钮也挺麻烦的
这个软件现在应该还是可以下载的
但是现在stata的这些功能按说就
可以完全替代这个软件了
所以待会我们上面也会讨论一下
大家如果觉得说哪些你想做的分析
在stata不能跑的话 我们再讨论
行 老师
第5题的话主要是问了一就刚刚我们
的随堂小测也问到了一个题
在我们进行
中心化的时候
一般中心化的时候是要减轻一个均值
我们这个时候是要选择我们样本的均值
还是说选择我们组内的
均值
就问了一个
大致问了一个这样的问题
一第一个想问他问的是如果到我们
这边来问您是结局是有意义的
是否还需要考虑中心化
如果不考虑中性化
怎么去判断多重共线性问题是否严重
我们小组对这个问题提出一个解答是
首先我们要关注
关注的就是我们中心化的一个目的是什么
我们中心化的目的其实就是
使我们的第一层的解决项
把这个集体项目拿去作为
第二层的因变量的时候
让它有意义
如果你是有意义的话
我们就不需要再进行一种循环
其次
如果不中心化的话
怎么去判断多重共线性问题
这里需要意识到一个问题 就是
不仅是在hlm
模型之中
在传统的那种
回归模型之中
我们的
中心化它是一种能够减轻
多重多样性问题的手段
并不是说要用它去判断一个多重共线性
问题到底有多严重
你要判断多重共线性的问题的话
也是老师之前已经提到过很多的方法
去看他们相关信息的时候
有没有大于0.7
这个
第二个的话就是在选择
grand mean还是group mean的
时候
除了斜率相等和斜率不相等
这一衡量标准
还有其他的吗
到这个时候其实也是要注意到
我们在选择这两个它的时候
我们是依据学历相等的
学历不相等去选的
到底是要选grand还是group呢
要去看
我们的组间差异
如果我们斜率相等的话
就代表我们的组件差异其实是比较小的
这个时候我们就可以选择一个
grand mean
就是样本整体的一个均值
然后这个时候它绝对代表的一个含义
就是说在我们不同组别主要
就在第二个水平来看
在不同的组里面在不同的组别
然后在样本均值处的一个outcome
如果学历不相等的话
那就说明组间差异就比较大
反映在斜率不相等
解不相等
这个时候我们需要选要选择各个
组他组内的均值去进行一个
中心化处理
这个时候截距的意义就是
不同组别它的组内均值处
的一个outcome
以上就是我们组关于这
两个问题的一个解答
有同有
有问题的同学
有同学还有问题吗
也就是这个中心化
它也没有一个绝对的正确
完全是取决于研究兴趣
一个但是如果你认为他
它这个斜率是可以在向更高
的一层变化的时候
一定是用group mean去中心化
用grand mean显然把它固定的更死一点
就是更强的一个
假设
但它好处就是让估算更快,占用
更少的资源去做估算
你用group mean的时候就是给了他更多的自由
其实在估算的时候占用
的资源也会更多一点
这些都是要考虑的
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM