当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.17 Q&A 5
第7题问的问题是广义阶层
线性模型的原理和一个应用的简介
在原理部分主要是为什么
要使用广义的线性模型
因为是因为信息模型有他的局限
他的因变量必须服从一个高斯分布
主要的
局限就是它的
y也是一个实数
具体来说它就有两个问题
第一个是y的取值范围和一些我们在应用
行径当中的实际情况是不匹配的
比如y的当他是游客人数的基数的时候
我们的统计结果是恒为正
这个时候就没有办法用
用普通的线性模型
然后还有第二个情况是 y
的方差是常数的时候
就有的地方是
方差可能会依赖于y的均值
所以我们就要使用广义的线性
模型来克服这个问题
所以广义的线性模型其实
本质上还是线性模型
它推广的是对于
往外的一个拓展的应用
也就是说它是在
glm是在y和连续
和非连续的时候都可以使用的
而一般的线性模型是在
y连续的时候使用的
在应用简介部分
我们主要是从它的一个
研究常见的应用情景
和他统计技术的一个发展上来说
常见的研究情景是我们在
教育研究当中收集的数据
经常呈现的是一个层级的特点
比如说最常见的是学生嵌套于班级
嵌套于学校
在这种的嵌套数据当中低层级的
水平的变量和高层级的水平
高层水平变量往往同时是我们的研究兴趣
所以我们是需要使用这个模型
在传统的统计传统的
线性模型到 h l m是一个
针对层级数据
的
方法
第一是高层级分解到第一层级
第二是低层级整合到高层级
这两种方式其实都会存在问题
在同一取向的个体和随机取样的个体相比
更高的相关性
而这个时候变量就没有
办法满足独立的假设
还有一种是二第二种处理方式
是忽略了个体水平的特征
因此就丢弃了一部分的
就去了所有的组内差异
所以就需要完善
所以这个时候就要用hlm
hlm就是之前说的
y的局限
我们再把 y的局限再
推广到比如当我们y是二分变量的时候
我们就使用glm
这里也有比较具体的案例
老师上课课上也讲到的案例
还有
有一个文献是二分数据的多层
线性模型原理与运用
讲的特别的详细
稍后我们会发到群里
然后接下来是张迅和文涛负责的部分
如果讲的有
错漏的地方
也请大家打断
元分析8.1的问题是原分析的一个
已发表的研究的结果倾向于好的一面
这里面是不是出现了一个
自选择偏误的问题
我们认为自选择偏误问题是一直存在的
然后个体的差异是在于是否得到处理
但是否得到处理
其实是个体的自选择形成的
即使样本包含了总体当中的全部
个体自选择的问题
其实仍然是不能够解决的
比如说研究者小明根据论文引用数据
对论文所得的系数进行加权
表面上看是核心刊物得到了加权
实际上是系数比较显著的
论文得到了加权
因为系数比较显著的论文其实是
更容易发表到核心刊物上的
所以自选择问题其实是一定
程度上是没有办法避免的
然后接下来是一个样本的选择偏误问题
研究者选择样本的时候没有做到完全随机
导致部分样本没有被考虑到
如果样本当中包含了总体的一个全部个体
样本选择篇入问题毕竟可以解决
比如说研究者小明在做元分析的时候
只选择了得到发表的论文
那么小明得出的数据其实是有偏的
因为数据比较明显的论文是更容易发表的
有的 然后
接下来是一个补充语言分析
当中经常出现的偏误问题
为什么经常出现偏误
是因为
元分析本身是一种
对多个同类研究结果进行合并
汇总的一个分析方法
从统计角度来讲
分析达到增大样本量和
提高检验效能的目的
尤其是多个研究结果不一致
或者是都没有统计学意义的时候
采用语言分析可以得到更加接近真实
情况的一个综合的分析结果
但是它本身是属于观察性的研究
在设计和资料收集的一个全过程当中
必然是存在着偏移的
他的取舍也会发生偏移
最突出的是发表偏移
要控制发表评议唯一的办法就是
尽可能收集到全部的研究资料
由多人进行盲法评判
决定资料的取舍
然后对所有合格的资料进行合并分析
常见的偏移也可以分为选择偏移研究
偏移和
汇集偏移三类
选择偏移是根据原文献的纳入标准
选择符合要求的文献时候
发自然发生的一个偏移
然后研究内评也是在提取资料时候发生的
主要包括从纳入的研究当中提取的
是信息不准确时后所致的片体虚者偏移
以及对研究质量的评
评价不恰当产生的一个
便宜
汇集偏移
其中就包含以下的一个原因
一个是查找
还有语言引发的
还有一个是多重发表
还有一个是
发表建议
发表建议之前前面说到的
作者
作者是当这篇文章本身比较
比较具有显著意义的时候
它的
还才比较容易被发表
所以就导致原分析出现较大的一个
夸大的一个效应
第二个问题是需要对权威文章刊物加权吗
原分析是汇集了多个研究的结果
得到一个可靠的结论
但是不同的研究者之间的
水平差异是比较大的
搜索到的质量文献的质量也会参差不齐
所以
在进行
结果合并之前纳入的文献是
要进行一个质量评价的
对单个研究的设计实施结果
分析整个过程当中可能出现
的各种偏移都要进行评价
对
收入文献的一个质控和评价
是收入评收收入文献要求
符合一个研究目的是否
详细介绍研究设计情况
包括是否随机分组或随机分抽样等
统计分析方法是否合适等等
文献的质量和等刊物的等级
是有一定的关系的
但是我们还是要
着眼于文献的质量本身
各类的研究质量评价的工具
包括质量评价量表
研究报告清单以及规范指南
这些优这些都是各有优势的
针对某一个领域研究设计方法对象等
要专门制定的一个质量评价工具
需要
对号就是选择合适的方法
接下来第三问题是如何判断
原分析的结果是否准确
首先就是要关注分析所收录的入选的标准
对于干预性研究而言
非常关注的是基线的异质性
评价指标的应激性
可能的影响因素是否控制的比较好
敏感度分析和对应的敏感度
分析结果的讨论是否合理
同样也要关注发表偏移的问题
另外还要注意的是元分析收入的这些
研究对象中所属的种族和地区
因为不同的种族地区对结果可能有影响
对原分析的结果进行解读
首先可以要
可以通过森林图查看纳入
研究的一个异质性
其次要选择合适的模型进行分析
然后根据合并效应量可信
区间得出原分析的结论
最后利用漏斗图判断是否存在发表偏移
通过上述的步骤
可以让大家从不同的角度
对元分析的结果进行
进行解释 得到一个
准确的结论
还有一个是同质性检验
通过同质性检验来判断效应量效应
值是否具有一个统计学的意义
以及能够在多大程度上
排除随机因素的作用
效应值就是进行效应检验z值
然后p是否
是否小于0.05
还有95%的置信区间内
它如果合并效应量
95%CI包含零则统差异
没有统计学的意义
还有一个偏移检验是用失效案
安全系数和一个漏斗图
而这部分是森林图
还有第9题问的是增长模型可以
使用hlm的原理是什么
h l m对数据的要求其实
是有一个嵌套和层级的关系
增长的速度
增长数据就是时间长度上的追踪数据
对一个固定的样本进行重复的测量
比如是一个历年的学生的升高
再一个学生的内部有多需要有多次成绩
历次成绩之间的相似性
这样的
就构成了层级
比如这里展示的是一个
有一个学学校班级和学生之间的层级关系
以上就是我们组的内容
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM