7.17 Q&A 5慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

第7题问的问题是广义阶层

线性模型的原理和一个应用的简介

在原理部分主要是为什么

要使用广义的线性模型

因为是因为信息模型有他的局限

他的因变量必须服从一个高斯分布

主要的

局限就是它的

y也是一个实数

具体来说它就有两个问题

第一个是y的取值范围和一些我们在应用

行径当中的实际情况是不匹配的

比如y的当他是游客人数的基数的时候

我们的统计结果是恒为正

这个时候就没有办法用

用普通的线性模型

然后还有第二个情况是 y

的方差是常数的时候

就有的地方是

方差可能会依赖于y的均值

所以我们就要使用广义的线性

模型来克服这个问题

所以广义的线性模型其实

本质上还是线性模型

它推广的是对于

往外的一个拓展的应用

也就是说它是在

glm是在y和连续

和非连续的时候都可以使用的

而一般的线性模型是在

y连续的时候使用的

在应用简介部分

我们主要是从它的一个

研究常见的应用情景

和他统计技术的一个发展上来说

常见的研究情景是我们在

教育研究当中收集的数据

经常呈现的是一个层级的特点

比如说最常见的是学生嵌套于班级

嵌套于学校

在这种的嵌套数据当中低层级的

水平的变量和高层级的水平

高层水平变量往往同时是我们的研究兴趣

所以我们是需要使用这个模型

在传统的统计传统的

线性模型到 h l m是一个

针对层级数据

的

方法

第一是高层级分解到第一层级

第二是低层级整合到高层级

这两种方式其实都会存在问题

在同一取向的个体和随机取样的个体相比

更高的相关性

而这个时候变量就没有

办法满足独立的假设

还有一种是二第二种处理方式

是忽略了个体水平的特征

因此就丢弃了一部分的

就去了所有的组内差异

所以就需要完善

所以这个时候就要用hlm

hlm就是之前说的

y的局限

我们再把 y的局限再

推广到比如当我们y是二分变量的时候

我们就使用glm

这里也有比较具体的案例

老师上课课上也讲到的案例

还有

有一个文献是二分数据的多层

线性模型原理与运用

讲的特别的详细

稍后我们会发到群里

然后接下来是张迅和文涛负责的部分

如果讲的有

错漏的地方

也请大家打断

元分析8.1的问题是原分析的一个

已发表的研究的结果倾向于好的一面

这里面是不是出现了一个

自选择偏误的问题

我们认为自选择偏误问题是一直存在的

然后个体的差异是在于是否得到处理

但是否得到处理

其实是个体的自选择形成的

即使样本包含了总体当中的全部

个体自选择的问题

其实仍然是不能够解决的

比如说研究者小明根据论文引用数据

对论文所得的系数进行加权

表面上看是核心刊物得到了加权

实际上是系数比较显著的

论文得到了加权

因为系数比较显著的论文其实是

更容易发表到核心刊物上的

所以自选择问题其实是一定

程度上是没有办法避免的

然后接下来是一个样本的选择偏误问题

研究者选择样本的时候没有做到完全随机

导致部分样本没有被考虑到

如果样本当中包含了总体的一个全部个体

样本选择篇入问题毕竟可以解决

比如说研究者小明在做元分析的时候

只选择了得到发表的论文

那么小明得出的数据其实是有偏的

因为数据比较明显的论文是更容易发表的

有的然后

接下来是一个补充语言分析

当中经常出现的偏误问题

为什么经常出现偏误

是因为

元分析本身是一种

对多个同类研究结果进行合并

汇总的一个分析方法

从统计角度来讲

分析达到增大样本量和

提高检验效能的目的

尤其是多个研究结果不一致

或者是都没有统计学意义的时候

采用语言分析可以得到更加接近真实

情况的一个综合的分析结果

但是它本身是属于观察性的研究

在设计和资料收集的一个全过程当中

必然是存在着偏移的

他的取舍也会发生偏移

最突出的是发表偏移

要控制发表评议唯一的办法就是

尽可能收集到全部的研究资料

由多人进行盲法评判

决定资料的取舍

然后对所有合格的资料进行合并分析

常见的偏移也可以分为选择偏移研究

偏移和

汇集偏移三类

选择偏移是根据原文献的纳入标准

选择符合要求的文献时候

发自然发生的一个偏移

然后研究内评也是在提取资料时候发生的

主要包括从纳入的研究当中提取的

是信息不准确时后所致的片体虚者偏移

以及对研究质量的评

评价不恰当产生的一个

便宜

汇集偏移

其中就包含以下的一个原因

一个是查找

还有语言引发的

还有一个是多重发表

还有一个是

发表建议

发表建议之前前面说到的

作者

作者是当这篇文章本身比较

比较具有显著意义的时候

它的

还才比较容易被发表

所以就导致原分析出现较大的一个

夸大的一个效应

第二个问题是需要对权威文章刊物加权吗

原分析是汇集了多个研究的结果

得到一个可靠的结论

但是不同的研究者之间的

水平差异是比较大的

搜索到的质量文献的质量也会参差不齐

所以

在进行

结果合并之前纳入的文献是

要进行一个质量评价的

对单个研究的设计实施结果

分析整个过程当中可能出现

的各种偏移都要进行评价

对

收入文献的一个质控和评价

是收入评收收入文献要求

符合一个研究目的是否

详细介绍研究设计情况

包括是否随机分组或随机分抽样等

统计分析方法是否合适等等

文献的质量和等刊物的等级

是有一定的关系的

但是我们还是要

着眼于文献的质量本身

各类的研究质量评价的工具

包括质量评价量表

研究报告清单以及规范指南

这些优这些都是各有优势的

针对某一个领域研究设计方法对象等

要专门制定的一个质量评价工具

需要

对号就是选择合适的方法

接下来第三问题是如何判断

原分析的结果是否准确

首先就是要关注分析所收录的入选的标准

对于干预性研究而言

非常关注的是基线的异质性

评价指标的应激性

可能的影响因素是否控制的比较好

敏感度分析和对应的敏感度

分析结果的讨论是否合理

同样也要关注发表偏移的问题

另外还要注意的是元分析收入的这些

研究对象中所属的种族和地区

因为不同的种族地区对结果可能有影响

对原分析的结果进行解读

首先可以要

可以通过森林图查看纳入

研究的一个异质性

其次要选择合适的模型进行分析

然后根据合并效应量可信

区间得出原分析的结论

最后利用漏斗图判断是否存在发表偏移

通过上述的步骤

可以让大家从不同的角度

对元分析的结果进行

进行解释得到一个

准确的结论

还有一个是同质性检验

通过同质性检验来判断效应量效应

值是否具有一个统计学的意义

以及能够在多大程度上

排除随机因素的作用

效应值就是进行效应检验z值

然后p是否

是否小于0.05

还有95%的置信区间内

它如果合并效应量

95%CI包含零则统差异

没有统计学的意义

还有一个偏移检验是用失效案

安全系数和一个漏斗图

而这部分是森林图

还有第9题问的是增长模型可以

使用hlm的原理是什么

h l m对数据的要求其实

是有一个嵌套和层级的关系

增长的速度

增长数据就是时间长度上的追踪数据

对一个固定的样本进行重复的测量

比如是一个历年的学生的升高

再一个学生的内部有多需要有多次成绩

历次成绩之间的相似性

这样的

就构成了层级

比如这里展示的是一个

有一个学学校班级和学生之间的层级关系

以上就是我们组的内容

7.17 Q&A 5在线视频

7.17 Q&A 5课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

7.17 Q&A 5笔记与讨论

也许你还感兴趣的课程: