7.16 Q&A 4慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

各位同学老师大家好

接下来我为大家带来我们

第二组负责的这三道题

其实我们

最后只解答两道题

因为第三道题的时候关于一个模型的推导

老师说有点超

所以说那道题就省略了

首先我们来看第4题

第4题的同学他问hlm的实现方式

除了stata的运算之外

是否还需要其他的应用

然后他说带着他自己的尝试过程

中发现人去下载其他的软件

我们想他这个问题主要是想问

一下的一个具体的操作过程

他问的应该是属于hlm

的一个数据的预处理以及

需要

准备那种

而且要模型能够识别文件的格式

的一个处理需要用到的软件

我们通过查找一些资料发现

在我们stata运算之前

我们是需要对 hlm

的数据进行一个处理

它有一个程序

叫做hlm多层线性模型的一个

小小程序

是一个软件

然后这个东西的话它主要

用来干嘛

刚刚能完成刚刚我说的上述的一些步骤

首先它这个软件需要的数据类型

就是spss的那种格式

然后当我们把在spss里面

首先要把数据

结构弄成那种嵌套数据的那种结构

要把每一层

他们之间的ID进行一个设置

然后以及它的下一层关联

的ID进行一个设置

然后把它们进行一个排序

相近的排在一起

然后第二步的话就是要创建 h l m

能够分析的数据文件格式叫mdm

然后他是

首先是要把这个东西给输进去

然后你要在里面输进去了之后

它会

提示你

怎么去点那些信息

然后你一步一步的点

然后把这个数据文件给整理好了之后

这个时候你要把 m d m给打开

然后在里面然后指定你的因变量是什么

你以及本的二层模型来讲的话

你要添加在里面同时添加一层的

这边有哪些二层的自变量哪些

这个时候你才完成了数据的一个预准备

然后可以用详细的系统的一个数据分析

然后详细的资料的话

大家可以参考网址

后面发给大家

就这个软件

打断一下**

这个软件如果没有错的话

应该是咱们用的教材的作者

他们自己开发的就软件其实

比stata的命令产生的要早

我当年读博的时候就是用

这个软件来做分析的

他稍微他的特点是什么

是窗口操作

还是很直观对

但是

他不能写命令

不能写命令的话

就是每一次分析都得重新按

点那些按钮也挺麻烦的

这个软件现在应该还是可以下载的

但是现在stata的这些功能按说就

可以完全替代这个软件了

所以待会我们上面也会讨论一下

大家如果觉得说哪些你想做的分析

在stata不能跑的话我们再讨论

行老师

第5题的话主要是问了一就刚刚我们

的随堂小测也问到了一个题

在我们进行

中心化的时候

一般中心化的时候是要减轻一个均值

我们这个时候是要选择我们样本的均值

还是说选择我们组内的

均值

就问了一个

大致问了一个这样的问题

一第一个想问他问的是如果到我们

这边来问您是结局是有意义的

是否还需要考虑中心化

如果不考虑中性化

怎么去判断多重共线性问题是否严重

我们小组对这个问题提出一个解答是

首先我们要关注

关注的就是我们中心化的一个目的是什么

我们中心化的目的其实就是

使我们的第一层的解决项

把这个集体项目拿去作为

第二层的因变量的时候

让它有意义

如果你是有意义的话

我们就不需要再进行一种循环

其次

如果不中心化的话

怎么去判断多重共线性问题

这里需要意识到一个问题就是

不仅是在hlm

模型之中

在传统的那种

回归模型之中

我们的

中心化它是一种能够减轻

多重多样性问题的手段

并不是说要用它去判断一个多重共线性

问题到底有多严重

你要判断多重共线性的问题的话

也是老师之前已经提到过很多的方法

去看他们相关信息的时候

有没有大于0.7

这个

第二个的话就是在选择

grand mean还是group mean的

时候

除了斜率相等和斜率不相等

这一衡量标准

还有其他的吗

到这个时候其实也是要注意到

我们在选择这两个它的时候

我们是依据学历相等的

学历不相等去选的

到底是要选grand还是group呢

要去看

我们的组间差异

如果我们斜率相等的话

就代表我们的组件差异其实是比较小的

这个时候我们就可以选择一个

grand mean

就是样本整体的一个均值

然后这个时候它绝对代表的一个含义

就是说在我们不同组别主要

就在第二个水平来看

在不同的组里面在不同的组别

然后在样本均值处的一个outcome

如果学历不相等的话

那就说明组间差异就比较大

反映在斜率不相等

解不相等

这个时候我们需要选要选择各个

组他组内的均值去进行一个

中心化处理

这个时候截距的意义就是

不同组别它的组内均值处

的一个outcome

以上就是我们组关于这

两个问题的一个解答

有同有

有问题的同学

有同学还有问题吗

也就是这个中心化

它也没有一个绝对的正确

完全是取决于研究兴趣

一个但是如果你认为他

它这个斜率是可以在向更高

的一层变化的时候

一定是用group mean去中心化

用grand mean显然把它固定的更死一点

就是更强的一个

假设

但它好处就是让估算更快，占用

更少的资源去做估算

你用group mean的时候就是给了他更多的自由

其实在估算的时候占用

的资源也会更多一点

这些都是要考虑的

7.16 Q&A 4在线视频

7.16 Q&A 4课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

7.16 Q&A 4笔记与讨论

也许你还感兴趣的课程: