当前课程知识点:心理统计 > 14 完全随机单因素方差分析 > 14.2 方差分析的测量效应和事后检验 > 14.2 方差分析的测量效应和事后检验
同学们
你们好
今天我们继续学习第14章
完全随机单因素方差分析的第二节
方差分析的效应值和事后检验
先来看方差分析的效应值
方差分析中F比值的显著
并不意味着处理效应很大
比如说F比值显著它只能说H0假设
μ₁等于μ₂
等于μ₃
这是一个例子
它被推翻了
也就是说μ₁μ₂和μ₃并不完全相同
但是它们之间到底差异有多大
μ₁和μ₂和μ₃
它们的差异的程度是多少呢
在F比值显著这个问题回答上
它不能够提供这个答案
所以我们需要报告方差分析的效应值
大家还记得这样一个公式吗
r的平方等于处理间的平方和
比上总的离差平方和
我们在学习t检验的时候
在讲效应值的时候
在讲效应值的时候
我们也介绍了这个指标r的平方也叫解释率
那么它等于处理间的
离差平方和比上处理间离差平方和
再加上处理内的离差平方和
这一块等于总的平方和
这和t检验里面的
r的平方的解释率是一个意思
那么在方差分析里边
我们把r的平方仍然是来处理效应大小的
那么只是方差分析里边
r的平方一般被称为η的平方
这个地方是希腊字母η²
那么这个η²
它测量了因变量的得分之间的差异
有多少可以被处理之间的差异所解释
也就是说这是
因变量的离差平方和它们之间的差异
那么有处理间的离差平方和所占的比例
所以这是方差分析的效应值
效应值越大
说明自变量的影响是越大的
那么我们来看第二个概念
叫方差分析的事后检验
当出现以下情况的时候
需要用到事后检验
首先就是方差分析的结果是显著的
也就是说H0被推翻了
那么第二个就是因素之间存在三个或以上的
处理水平
比如说还是刚才那个例子
H0μ₁等于μ₂等于μ₃
方差分析的结果显著
H0被推翻了
我们想回答到底是μ₁和μ₂不同
还是μ₂和μ₃不同
或者是说μ₁和μ₃不同
或者是说三个干脆都不相同
当我们想需要知道
它们两两之间的差异性的关系的时候
我们需要用到事后检验
那么如果说研究当中只有两个水平是显著的
比如说我们的H0假设
只涉及两个总体平均数的检验
μ₁等于μ₂
那么我们的方差分析结果显著了
H0被推翻了
也就是说能证明μ₁就不等于μ₂了
我们就没有必要再进行事后检验
但是如果是对于零假设被推翻了
我们实际上需要进行三个检验
就是μ₁和μ₂是否相同
μ₂和μ₃是否相同
以及μ₁和μ₃是否相同
这个时候就要用到事后检验了
当我们进行虚无假设的检验
H0等于μ₁等于μ₂等于μ₃检验的时候
我们把它分成以下三个组
也就进行三个检验的时候
我们其实在13章的时候已经讲过
如果我们每一次的Ⅰ类错误既定为.95
也就是它的α值是.95
它的也是它的也是
那么三个假设全部被接受的概率
就会是.95的3次方等于.857
也就是说我们进行三次检验
它的一类错误会增加增大到多少
0.143
他远远地就高于了我们所界定的
0.05这样
的一个显著性水平
所以如果我们只是
简单的把H0假设
分解成三个假设来进行检验的话
它的Ⅰ类错误会增加的
这个时候我们怎么办
我们又想进行多重比较
也就是说又想去对这样的假设进行检验
我们就需要对α值进行校正
也就是说我们需要
采用一些新的方法来校正α值
那么它的方法有哪些
一个是Tukey的HSD
它的适用条件是组间的样本数相同
也就是说我们有多少个组
每一个组内的样本量是相同的
每一个组内的样本量是相同的
第二个是Scheffe的检验方法
他允许我们每一组有不相等的样本数
比如说我们有两个组
一个组是20个人
一个组是25个人
他们的样本量不相同
那么同样可以使用Scheffe的检验方法
但是它是各种方法当中最严格检验力最低的
一种多重比较
第三种方法叫Bonferroni的
检验方法
它的适用条件是每一组有不相等的样本数
这和Scheffe的检验方法是相同的
它的适用条件是一致的
但是他没有Scheffe的检验方法
那么严格
检验力相对较高
我们分别来介绍一下这三种方法
第一种叫Tukey的HSD
HSD它的计算公式是
qα乘以根号下MSw除以n
我们分别来看一下
这个计算公式的里面的各个元素
首先n是组内的人数
比如说我们有一个实验
它是有4个水平
也就是说我们自变量有4个水平
每一个水平
也就是每一个组内我们分了3个被试
我们这个是实验总共的被试量是12个
那么每一组是3个
那么这里的小n的意义就是3
好
那么我们来看一下
MSw这个叫组内均方
我们在做方差分析的时候
MSw是可以计算出来的
它等于
组内的离差平方和除以它的组内的自由度
下面我们来看一下q值
它是可以通过查表得到的
比如说我们这样的一张表
那么它2345它代表的是
处理的个数
也就是说k它的组数
那么在这个例子里边
我们自变量有4个水平
也就是说我们有4个组
所以这个k也就是4
我们对应的就是这一列的值
那么5678它代表的是什么
它代表的是残差的自由度
我们的残差的自由度在这里
他就等于这个地方
组内均方所对应的自由度
就是残差的自由度
那么在我们这个例子里边
我们是4个水平
3个被试
每个组3个被试我们一共是12个被试
我们的处理的自由度是3
那么我们的总自由度
是12个被试减去1等于11
那么11减去3等于8
也就这个地方是8
那么在这个例子里边
q的取值是多少
行
就是8对应的
然后列就对应的4
所以这个地方应该是4.53
好
我们下面来看具体的例子
我们具体来看一下计算的值
那么在这个例子里边n等于3
这个是组内均方
我们计算出来它等于10
q的临界值是4.53
我们刚才查表得到了
然后我们来看一下这样的一张表
因为我们是4个组
我们首先算一下每个组的平均数是多少
在这个例子里边平均数第1组是8
第2组是12
第3组10
第4组是22
然后我们这里也是1234
我们计算一下它们两两之间的差异
其实它是一个对角的一个阵
我们只写下对角阵就行了
所以你看第1组跟第2组之间差多少
就是第2组减去第1组12减去8等于4
这是4
那么这是第3组跟第1组之间差多少
就是10减去8是等于2
第4组跟第1组之间就是22和8
之间差14
这样我们两两比较的结果
就是均值之间的差异
都放在这张表里边
这张表跟谁比
就跟我们刚才已经算出来的HSD相比
那么这是一个比较的值
HSD大家可以看到
它其实是有临界值
然后还有均方
也就是除以n这其实相当于标准误了
所以HSD实际上是一个
已经算好的比较的值
比较方便比较
然后我们来看一下
对于这些值里边和4.53相比
哪些是显著的
那么很显然这三个值显著了
它代表的意义是什么
也就是说这是第4组
跟第1组之间有显著的差异
第四4组跟第2组之间有显著的差异
第4组和第3组之间有显著的差异
其他的比如说
第1组跟第2组之间是没有差异的
第2组和第3组之间也都是没有差异的
好
这是Tukey的HSD的检验方法
它的关键就是计算HSD这一个比较值
下面我们来看一下Scheffee的方法
它的检验公式大家可以看到他用的是F检验
是这样一个式
那么在这里边我们有一些值
刚才已经介绍过了
MSw就是在单因素的方差分析里边
我们计算出来的组内均方
那么这个k也就是组数
在我们刚才那个例子里边
我们的k是4也就是自变量有4个水平
那么我们说Xi的平均数
减去Xj的平均数它
代表什么
我们举个例子
比如说我们想比较
第1组跟第2组之间的均值
是否有差异
那么这个就是第1组的平均数
这个就是第2组的平均数
那么这个检验
就是来检验
第1组的平均数和第2组的平均数之间
是否有差异的
那么这个公式实际上大家可以看到
它仍然是有分母
有MSw那么分子
这一部分是谁呢
这一部分我们可以看到
它其实代表的是像刚才那个例子
第1组跟第2组的离差平方和
那么离差平方和还要除以K减1
我们说本来他的自由度就是1
他两个组自由度就是一
但是它除掉了K减1
所以这个分子部分
其实我们说它的值就非常小
所以我们说Scheffee的检验方法是
非常严格的
它不容易显著
也就是这个F值相对较小
它不容易显著
那么它做检验
因为它是基于F分布去做的
所以我们也是要找到
它的分子和分母的自由度
那么K减1
也就是说它的分子部分的自由度是K减一
它除以K减1了
那么也就是说它是你有多少个组
那么它的分子自由度就是K减1
比如说4组的话
那么分子自由度就是3
那么分母自由度就是
组内离差平方和所对应的自由度
就是dfw所以F的临界值等于4.07
和单因素方差分析的
整个的检验的F检验的临界值
其实是一样的
那么像刚才这个例子
我们还是有4组
我们有平均数
我们可以计算两两比较的F值
就是这个F值这是0.8
第1组跟第2组比较的是0.8
第1组的平均数
第2组的平均数
这是整个方差分析的组内均方
然后这是第1组的样本量
这是第2组样本量
你可以看到Scheffee允许
两个组的样本量是不相同的
所以你可以把不同的样本量放在这就行了
也可以相同也可以不同
那么K是在这个例子是4减1
所以我们依次带进去就得到这样的一个值
这些值也是和它的临界值相比较是4.07
我们看到还是这3个组
显著了
也就是说第4组和其他3个组有显著的差异
而123之间没有显著的差异
我们来看第三种检验方法
Bonferroni的检验方法
意大利的数学家Bonferroni
证明了
当α介于0与1之间是对任意一C值
这个不等式是成立的
这个式子大家是否看起来比较眼熟
大家想当我们做一个检验
μ₁等于μ₂等于μ₃的时候
我们要做多重比较
我们把它拆成了三个
零检验
μ₁等于μ₃
我写在这里H0
μ₂等于μ₃
好
我们要对他们三个进行假设检验
如果说他的错误
Ⅰ类错误界定成α的话
那么我们说当我们同时进行这三个检验的时候
那么它的Ⅰ类错误是多少呢
在13章我们讲过它的值
就是1减去1减α
然后这个C就是我们比较了几次
像这个例子我们比较了3次
那么依据这个不等式
它应该小于等于几
小于等于3乘以α
那么下面我们再想
如果我想让整体的假设检验
他的值限定成一个数
比如说1减去1减α的三次方
一定是在.05以内
也就是说我们限定它是.05
那么这个α会是多少呢
那就是0.05除以3就是这个α
我们来看一下
也就是说
如果我们希望在整个实验当中
Ⅰ型错误的最大概率是αw也就这一块
那么则可使用
等于αw除以C作为比较的
Ⅰ型错误的概率
也就是说让Cα我们限定成αw
比如说等于0.05
那么我们每一次比较的会是多少
就是0.05除以3等于0.017
也就是说我们限定
每一次比较的α等于0.017的时候
当我们进行完这三次检验
它的整体检验的Ⅰ类错误
会是小于等于0.05的
会是小于等于0.05
我们再举一个例子
如果我们有4个检验
就是μ₁等于μ₂等于μ₃等于μ4有4组
我们想检验它们的平均数是否相同
我们就要进行两两比较
μ₁是否等于μ₂
μ₂是否等于μ₃μ₃是否等于μ4
我们一共需要进行6次检验
那么这个时候我们就在想
如果我们整体检验的α水平
限定在0.05的时候
那么你每一次检验的α水平应该是多少呢
所以这个时候就是0.05除以6
就不再是3了
就是除以6了
我们可以看到我每一次所允许的Ⅰ类错误
就更低了
就非常低
所以Bonferroni证明了这个不等式
它有助于我们去
进行每次这种单个的检验的时候
我们去调整它的α
这样就是一个很有意义的一个调整了
我们看刚才这个例子
t检验统计量
t等于Bonferroni检验方法的
检验统计量
就*Yi减去*Yj这是
比如说像刚才那个例子
就是第1组跟第2组之间的差异
直接平均数差异
他用的是t检验
那么分母部分大家还熟悉
这个就是标准误MSE
也就是说是我们
组内均方它是总体方差的一个无偏估计量
那么ni分之1加上nj分之1
你要是做独立样本
t检验的时候
你其实很熟悉独立样本
t检验的时候这个地方叫合并方差
这个地方就是ni分之一加nj分之一
整个这一块除以开根号以后就叫标准误了
只是我们的合并方差用组内均方来代表
其实他们都是总体方差的无偏估计量
那么这个其实是代表的是
两组之间进行t检验
关键是在哪
大家可以看一下这个地方
那么地方它代表的是自由度
我们的自由度是多少
自由度实际上是MSE对应的自由度
就是误差的自由度
那么这个地方大家注意看没有
这是临界值
这是临界值
你看一下它的临界值用的是α除以2c
为什么是个2
因为它是双侧检验
所以我们除以2以前我们叫2分之α
只是这个地方多出了
除了一个C那么这个C是什么意思
就是你进行了几次比较
就是你进行了几次比较
比如说我们是3组平均数之间的两两比较
我们就进行了3次检验
这个地方要除以3
如果是4组平均数之间的两两比较
我们要进行6次检验
这地方就要除以6
它的t值就是在
α除以2C的这样校正的情况下
其实t值比较大
比较大
好
我们来看一下这个例子
像刚才t值
我们可以去计算两两之间的
t值检验的t值
你看这是1234组
我们每一组的这个t值可以算出来
然后这个就是我们的t的临界值
我们说像刚才这个例子
我们要进行6次比较
你看一下是不是6个平均数
之间的差异是吧
那么6次比较的时候
我们的α值等于谁
就是0.05除以6
等于0.004
好
那么自由度是8
也就是MSE所对应的自由度是8
我们每个组是三个人
然后4个水平
我们残差自由度是8
所以它的临界值我们可以查表去获得
等于3.36
那么这个5.42还有30.81和4.56
都是超过了3.36的
所以我们说它是显著的
也就是说通过Bonferroni的检验
其实和前两个检验的结果是一致的
也就是说第4组
和其他三个组之间有显著的差异
和其他三个组之间有显著的差异
和其他3个组之间有显著的差异
好
下面我们来看小结
这一节里边我们说F比值的显著并不意味着
处理效应很大
所以我们用η的平方来直接度量
它的效应值效应值的意义
它的效应值相值的意义
也就是说我们自变量所造成的
平均数之间的差异到底有多大
平均数之间的差异到底有多大
那么当方差分析的结果显著
并且因素存在3个或以上水平的时候
我们需要用到事后检验
多重检验的次数越多
越容易犯Ⅰ类错误
越容易犯Ⅰ类错误
因此会衍生出一些校正α的检验方法
我们这节课讲了Tukey的HSD方法
Scheffe的方法
和Bonferroni的方法
好
谢谢大家
感谢收看
-1.1 统计学的意义
-1.2 心理统计简介
-1.3 基本概念介绍1
-1.4 基本概念介绍2
-1.4 基本概念介绍2--作业
-1.5 研究方法
--1.5 研究方法
-2.1 统计表和统计图简介
--2.1 统计图表
-2.1 统计表和统计图简介--作业
-2.2 频数分布表
-2.2 频数分布表--作业
-2.3 频数分布图
-2.3 频数分布图--作业
-2.4 百分位数和百分等级
-2.4 百分位数和百分等级--作业
-3.1 平均数
--3.1 平均数
-3.1 平均数--作业
-3.2 中数
--3.2 中数
-3.2 中数--作业
-3.3 众数
--3.3 众数
-3.3 众数--作业
-4.1 全距和四分位距
-4.1 全距和四分位距--作业
-4.2 标准差和方差
-4.2 标准差和方差--作业
-4.3 差异系数
--4.3 差异系数
-4.3 差异系数--作业
-5.1 Z分数介绍
-5.1 Z分数介绍--作业
-5.2 Z分数的分布及转换
-5.2 Z分数的分布及转换--作业
-6.1 概率的基本概念
--6.1 概率与二项分布--作业
-6.2 概率与二项分布
-6.2 概率与二项分布--作业
-6.3 概率与正态分布
-6.3 概率与正态分布--作业
-6.4 抽样分布与推论统计
-6.4 抽样分布与推论统计--作业
-7.1 假设检验的一般原理
-7.1 假设检验的一般原理--作业
-7.2 假设检验的一般过程
-7.2 假设检验的一般过程--作业
-7.3 假设检验的不确定性和误差
-7.3 假设检验的不确定性和误差--作业
-7.4 有方向的假设与单侧检验
-7.4 有方向的假设与单侧检验--作业
-8.1 t统计量与t检验
-8.1 t统计量与t检验--作业
-8.2 单样本t检验的方法
-8.2 单样本t检验的方法--作业
-8.3 有方向的检验和单侧检验
-8.3 有方向的检验和单侧检验--作业
-9.1 独立样本t检验
-9.1 独立样本t检验--作业
-9.2 独立样本t检验的应用
-9.2 独立样本t检验的应用--作业
-10.1 相关样本t检验方法
-10.1 相关样本t检验方法--作业
-10.2 有方向的假设和单侧检验
-10.2 有方向的假设和单侧检验--作业
-11.1 效应量的测量
-11.1 效应量的测量--作业
-11.2 均值检验效应量
-11.2 均值检验效应量--作业
-11.3 统计检验力及其影响因素
-11.3 统计检验力及其影响因素--作业
-12.1 参数估计的基本内容
-12.1 参数估计的基本内容--作业
-12.2 用t统计量作参数估计
-12.2 用t统计量作参数估计--作业
-12.3 假设检验和参数估计
-12.3 假设检验和参数估计--作业
-13.1 方差分析的逻辑
-13.1 方差分析的逻辑--作业
-13.2 方差分析的计算
-13.2 方差分析的计算--作业
-14.1 完全随机单因素方差分析
-14.1 完全随机单因素方差分析--作业
-14.2 方差分析的测量效应和事后检验
-14.2 方差分析的测量效应和事后检验--作业
-15.1 重复测量单因素实验设计
-15.1 重复测量单因素实验设计--作业
-15.2 重复测量单因素方差分析的逻辑和计算
-15.2 重复测量单因素方差分析的逻辑和计算--作业
-16.1 完全随机两因素实验设计
-16.1 完全随机两因素实验设计--作业
-16.2 完全随机两因素方差分析的逻辑和计算
-16.2 完全随机两因素方差分析的逻辑和计算--作业
-16.3 简单效应检验
-16.3 简单效应检验--作业
-16.4 完全随机两因素方差分析的效应值和事后检验
-16.4 完全随机两因素方差分析的效应值和事后检验--作业
-17.1 相关概述
-17.1 相关概述--作业
-17.2.1 皮尔逊相关1
-17.2.1 皮尔逊相关1--作业
-17.2.2 皮尔逊相关2
-17.2.2 皮尔逊相关2--作业
-17.3 等级相关
-17.3 等级相关--作业
-17.4 点二列相关和二列相关
-17.4 点二列相关和二列相关--作业
-17.5 φ相关
--17.5 φ相关
-17.5 φ相关--作业
-18.1 简单线性回归
-18.1 简单线性回归--作业
-18.2 回归模型和回归系数
-18.2 回归模型和回归系数--作业
-18.3 线性回归的基本假设
-18.3 线性回归的基本假设--作业
-18.4 变异的分解
-18.4 变异的分解--作业
-18.5 回归方程的估计标准误
-18.5 回归方程的估计标准误--作业
-18.6 回归方差的有效性检验
-18.6 回归方差的有效性检验--作业
-19.1 二项检验
-19.1 二项检验--作业
-19.2 卡方检验
-19.2 卡方检验--作业
-19.3 四格表及列联表
-19.3 四格表及列联表--作业
-20.1 非参数检验概述
-20.1 非参数检验概述--作业
-20.2 单样本非参数检验
-20.2 单样本非参数检验--作业
-20.3 两独立样本非参数检验
-20.3 两独立样本非参数检验--作业
-20.4 多个独立样本非参数检验
-20.4 多个独立样本非参数检验--作业
-20.5 两个配对样本非参数检验
-20.5 两个配对样本非参数检验--作业
-20.6 多配对样本的非参数检验
-20.6 多配对样本的非参数检验--作业