当前课程知识点:心理统计 > 13 方差分析概述 > 13.1 方差分析的逻辑 > 13.1 方差分析的逻辑
同学们
你们好
今天我们进入第13到第16章
方差分析这一部分的学习
我们先来学习第13章方差分析概述
我们先来看第一节方差分析的逻辑
它包括两个部分
实验设计与t检验困境
方差分析的逻辑
先来看什么是实验设计
实验设计是研究中最为重要的一个环节
实验者需要有效的操纵实验变量
控制额外因素的影响
能在随机化原则基础上选择和分配被试
从而客观地反映实验处理的作用
比如说我们想研究学习努力
对学习成绩的影响
影响成绩的因素是非常多的
比如说智商
兴趣等等
当我们只去关心学习努力
对成绩的影响的时候
像其他的这些因素我们叫
无关变量我们需要对它进行控制
我们只有把它控制住
也就是说假设所有人在这些因素上都是相同的
而只去看学习努力的不同水平对成绩的影响
这个时候我们才能够
把学习成绩的差异
归因为是学习努力造成的
所以在实验设计里边
学习努力也就是说我们的实验变量
智商和兴趣
我们说叫无关变量我们需要控制它
也叫控制变量
成绩是因变量
那么你可能会问我们怎么能让
所有人的智商和兴趣是相同的
这是不可能的对不对
那么我们怎么让大家控制在一个水平
一个很重要的实验控制就是随机化原则
也就是说我们基于随机化的原则
来分配被试进入不同的实验组里边
那么这个时候由于他们是随机分配的
我们可以假定不同组的
他们的智商和兴趣大致是相同的
在实验设计里边
随机化原则是非常重要的一条
当然我们还有其他的方法来进行控制
比如说匹配组或者是一些统计控制的方法
但是大家要记住
我们在整个的实验设计里边
什么是自变量
什么是控制变量
什么是成绩
什么是因变量
这些大家都要清楚
实验设计是非常重要的
基于不同的实验设计
我们有不同的统计方法
我们来看一下
实验设计主要有几种
一种叫完全随机
我们这一章主要是学方差分析
它所对应的统计方法叫
One_Way Anova
也就是说单因素的方差分析
还有一个设计叫重复测量的实验设计
它所对应的方差分析叫重复测量的方差分析
还有一种设计叫析因设计
当我们有多个自变量的时候
这样的设计叫析因设计
它所对应的方差分析叫多因素方差分析
我们在整个方差分析这一章里边
会针对不同的实验设计
来介绍不同的方差分析的方法
好
下面我们来看t检验的困境
对独立样本的t检验
我们只能对两种实验处理进行差异性检验
比如说有两种教学方法
我们想去检验它们效果的差异
可以借用独立样本t检验来做
但是如果我们有三种实验处理
我们该怎么办
我们可以把它拆分成两两的检验
比如说
第一个检验
μ₁等于μ₂
第二个检验μ₁等于μ₃
第三个检验μ₂等于μ₃
也就是说我们进行
三种实验处理的差异性检验的时候
把它拆分成三个检验
那么如果我们有四种实验处理
我们又能拆分成多少个检验呢
任何两个的一个组合
所以应该是
C4²等于
6
六种检验
我们可以想
如果我们有五种实验处理
我们要进行多少次检验
所以这是一个非常大的困难
也就是说当自变量变化的水平比较多的时候
我们进行t检验的次数是增大的非常快的
这是非常效率不高的
我们来看困难二
如果每组的显著性水平皆为α
也就是说一类错误
比如说我们把它定义为0.05
这个也是0.05
这也是0.05
那么我们可以想在Ho成立的情况下
我们接受Ho的概率是多少呢
也就是说我们没有犯一类错误的概率是多少
就是一减去α
等于0.95
同理这个也是0.95
这个也是0.95
我们进行一个总的检验
μ₁等于μ₂等于μ₃
我们要对Ho进行假设检验的话
我们在这里把它拆分成了三个检验
在每个检验是0.05成立的情况下
它们各自接受Ho的概率是0.95
那么我们想在Ho成立的情况下
我们接受它的概率会是多少呢
也就是他们三个同时成立的情况下
接受的概率就是0.95的3次方
等于0.857
那一类错误是多少呢
就是1减去0.857
我们这里可以看等于0.143
也就是说在Ho成立的情况下
我们拒绝它的
概率也就是错误的概率
一类错误是多少0.143
它是远远大于0.05的
所以我们说如果我们有三种实验处理
我们进行这样的两两的t检验的话
那么它的一类错误会增大
会大于0.05
所以这也是说我们为什么
不能用t检验
去处理当实验处理多于两种的情况
我们看一下我们怎么来处理
当我们的实验处理多于两个的情况下
我们就要进行方差分析
在科学实验中
常常要探讨不同实验条件或处理方法
对实验结果的影响
方差分析可用于评价两个或多个处理条件
之间的平均数的差异
比如说我们可以研究几种疗法
对某种神经症的疗效
我们可以看自变量是什么
几种疗法
对吧
因变量就是对神经症的疗效
我们怎么来控制无关变量
那么随机分组
把被试分成若干组就可以了
那么这里不同的教学方法是自变量
学生的学习成绩是因变量
自变量对因变量的影响
我们的被试被随机分到
不同的教学方法组成当中去
那么我们可以看到
当我们的教学方法是多过两种的
有三种四种五种
疗法也是多过两种的时候
我们就可以用方差分析去做了
我们来看一下t检验的检验公式
分子部分是实验组与对照组
我们是两个组
他们的样本平均数之间的差异
分母部分
也就是随机因素造成的差异
我们说叫标准误
t值越大
说明实验处理造成两组之间的实际差异
是大于随机因素的
如果t值达到了显著性的水平
我们就可以拒绝Ho
说明实验处理的效应是显著的
类似我们可以写F检验
也就是说方差分析的时候
比如说因素水平
个样本的平均数之间的差异
然后分母还是随机因素造成的变异
大家可以看到
如果以同样的逻辑
我们来设计F值的计算公式的时候
我们会发现
对两个以上的样本平均数进行比较的时候
分子的平均数的差异很难定义
而且无法计算
大家可以看因素水平
个样本平均数之间的变异
我们怎么来做
我们来看样本平均数
当我们多过两个组的时候
怎么来表现这个差异呢
很难去设计
所以我们说这个时候需要方差分析来做
方差分析所基于的原理就是变异的可分解性
个体之间因变量的变异
也叫数据总变异的基本来源有两个
一个是随机误差
就是各种偶然因素造成的个体之间的差异
称为处理内的差异
一种是实验条件所造成的差异
称为处理前差异
也叫组间差异
我们来举一个例子
比如说学生之间的学习成绩是有差异的
人与人之间成绩的差异是比较大的
有的非常高
有的成绩非常低
我们来看为什么会造成他们之间有差异
我们把这个学生一看
把它分成了两组
第一组采用的是第一种教学方法
第一种教学方法
我们第二组采用的是第二种教学方法
一种是传统的
一种是新式的
那么我们看学生之间成绩有差异
你可以去想
是不是由于教学方法造成的
也就是说是不是由于我们的实验条件造成的
实验条件
也就是说不同的教学方法
我们可以看它体现在组间变异上
也就是这一个组
和这个组之间有差异
他们之间本身是有差异的
那么你可能还要问
你们都接受了相同的教学方法了
比如说你们都是这种传统的教学方法
为什么在组内还有差异呢
我们叫随机误差造成的差异
也叫组内差异
也就代表这些组内受偶然因素的影响
比如说他们自己的个性品质、失误等等
各种非实验条件所造成的差异
我们统一归为随机误差
那么这一组也是也会受到随机误差的影响
所以我们看我们个体与个体之间的这种差异
也叫变异
受什么因素影响一个是他们所在的组
也就是他们的处理之间是有差异的
不同的实验处理
一种是传统的
一种是新式的实验处理之间的差异
它所体现就是两个组之间有差异
还有一种叫随机误差
也就是他们的组内之间是有差异的
组内同样受一样的实验处理为什么还不一样
就是受到各种偶然因素造成的
或者是他们的个体之间的本身就有差异
这些差异我们统一称为组内变异
也叫处理内变异
所以我们说总变异学生与学生之间的变异
可以分解成两部分
一个是组间变异
一个是组内变异
组间变异也叫处理间变异
处理间变异分成两块
一个叫处理效应
一个是随机因素
也就是说我们组与组之间的差异
实际上除了受他们的实验处理的影响
也还是有随机因素的影响的
第二部分就是组内差异
这一部分我们说纯粹是随机因素的影响
比如说这是总变异
我看它代表什么含义
我们有三个实验组
比如说代表3种教学方法
我们一共是11个被试
这上面的数据点是他们因变量的取值
这11个被试因变量的平均数是多少
是 ̅x..
那么总变异是指什么
每一个被试距离
这个平均数的距离
大家可以看到有的长有的短
有的是正值
有的是负值
那么我们怎么来衡量
这些个体到平均数的这种
变异情况呢
我们用离差平方和来表示
也就是说每比如说这个点
就这一段距离
我求一个平方
平方
每一个点一旦求平方以后
它的符号就消掉了
那么总变异其实就代表的是每一个取值
到总变异的离差平方和这叫总变异
我们来看组间变异
我们是三个组
还是这十一个数据点
每一个组会有一个小组平均数
也叫组中心点
这个组中心点代表的是他处理的效应
我们来看这些点到总平均数之间会有差异
看到没有
这些差异
就这个点到平均数
总平均数
那么这些差异是什么呢
我们叫组间差异
它就是用各组的均值
与总体均值的离差平方和来表示
那么本实验中组建差异
为三个组的均值到总均值的差异
这个差异可能是由于不同的实验处理造成的
你可能会问
除了实验处理
它还可能是因为什么因素造成的
我们可以看
比如说这个组这些
平均数到总平均数之间的距离
我们说他们受到了不同的实验处理
所以他们之间会有差异
这个差异也可能是随机因素引起的
比如说这里这个组一和组二
我们组二也可能比组一的水平
本身的水平会高一点
那么我们当它接受了一种实验处理
它接受一种实验处理的时候
我们这个组的
平均数就会比这个组的平均数会高一些
但是这个之间的差异
就真正的两个组组中心的差异
也可能是因为它们的被试之间
本身的不平衡造成的
因为你随机分组
随机分组真是有可能
本身它会比它稍微高一点的
我们叫这种就是随机因素
是各种随机因素
这个小组的各种随机因素
那么我们说这种差异
就是这种组间的变异
组间的变异
很有可能是实验处理造成的
也有可能是随机因素造成的
我们再来看组内变异
也就是说我们每一个个体
跟自己的组中心点的差异
你本来都在这一个组内
你们之间为什么还有差异
你们的个体差异我怎么来衡量
就是用组内变异来衡量
也就是说同一组内由于随机误差的影响
每一个个体的取值跟他自己的平均数
会有一些差异
我们用这些还是这些差异的离差平方和
来表达组内变异
我们说这种是随机误差引起的
我们来看一下
F比值我们的总变异可以分为
组间变异与组内变异
也叫做处理间变异和处理内变异
我们可以进行F检验
F值是怎么定义的呢
F值等于组间变异
比上组内变异
我们刚才讲组间变异受什么因素影响呢
受处理效应和随机误差因素的影响
而组内变异是纯粹的随机变异
我们可以想
如果处理效应为零
那么我们的F值会是什么样子的
也就是唯一
我们进行方差分析的时候
首先是要进行写零假设的
比如说我们有三个组
我们的零假设是μ₁等于μ₂等于μ₃
在Ho成立的情况下
也就是μ₁等于μ₂等于μ₃
我们去构建F检验
实际上这个地方应该是平均的组间变异
这个是平均的组内变异
他们在Ho成立的情况下
都是总体方差的一个无偏估计量
也就是它的F的取值应该是一的
我们来看一下
对于这样的F检验
这是一个F分布
那么它的中心点就是一
是一在Ho成立的情况下
如果我们实际用样本计算出一个F值来
这个F值落在了临界值以外
也就落在了拒绝域内
所以我们其实是可以把F推翻的
把F分布推翻
也就是说在Ho成立的情况下
我们建立的F分布是可以推翻掉的
如果F值小于临界值
也就落在了非拒绝域内
那么我们是可以接受Ho的
实验处理效果是不显着的
如果大于这个临界值
那么也就落在拒绝域中
我们可以拒绝Ho
实验处理效应是显著的
这是方差分析的一个逻辑
好我们来看小节
当实验处理的水平数多于两个的时候
使用t检验会产生很多问题
我们可以采用方差分析
来进行平均数的差异性检验
实际上当实验处理的水平数是两个的时候
我们既可以用t检验去做
也可以用方差分析来做
二者的检验结果是一致的
方差分析是基于离差平方和的可分解性
也就是说变异的可分解性来做的
我们将总变异分解为处理间变异和处理内变异
处理间变异和除以内变异
我们也叫组间变异和组内变异构建F检验
实际上准确的说是平均的
处理间变异和平均的处理内便以构建F检验
当F值小于临界值的时候
接受Ho实验处理效应不显着
F值大于零界值的时候
拒绝Ho试验处理效应显着
好
这一节讲完了
感谢大家收看
-1.1 统计学的意义
-1.2 心理统计简介
-1.3 基本概念介绍1
-1.4 基本概念介绍2
-1.4 基本概念介绍2--作业
-1.5 研究方法
--1.5 研究方法
-2.1 统计表和统计图简介
--2.1 统计图表
-2.1 统计表和统计图简介--作业
-2.2 频数分布表
-2.2 频数分布表--作业
-2.3 频数分布图
-2.3 频数分布图--作业
-2.4 百分位数和百分等级
-2.4 百分位数和百分等级--作业
-3.1 平均数
--3.1 平均数
-3.1 平均数--作业
-3.2 中数
--3.2 中数
-3.2 中数--作业
-3.3 众数
--3.3 众数
-3.3 众数--作业
-4.1 全距和四分位距
-4.1 全距和四分位距--作业
-4.2 标准差和方差
-4.2 标准差和方差--作业
-4.3 差异系数
--4.3 差异系数
-4.3 差异系数--作业
-5.1 Z分数介绍
-5.1 Z分数介绍--作业
-5.2 Z分数的分布及转换
-5.2 Z分数的分布及转换--作业
-6.1 概率的基本概念
--6.1 概率与二项分布--作业
-6.2 概率与二项分布
-6.2 概率与二项分布--作业
-6.3 概率与正态分布
-6.3 概率与正态分布--作业
-6.4 抽样分布与推论统计
-6.4 抽样分布与推论统计--作业
-7.1 假设检验的一般原理
-7.1 假设检验的一般原理--作业
-7.2 假设检验的一般过程
-7.2 假设检验的一般过程--作业
-7.3 假设检验的不确定性和误差
-7.3 假设检验的不确定性和误差--作业
-7.4 有方向的假设与单侧检验
-7.4 有方向的假设与单侧检验--作业
-8.1 t统计量与t检验
-8.1 t统计量与t检验--作业
-8.2 单样本t检验的方法
-8.2 单样本t检验的方法--作业
-8.3 有方向的检验和单侧检验
-8.3 有方向的检验和单侧检验--作业
-9.1 独立样本t检验
-9.1 独立样本t检验--作业
-9.2 独立样本t检验的应用
-9.2 独立样本t检验的应用--作业
-10.1 相关样本t检验方法
-10.1 相关样本t检验方法--作业
-10.2 有方向的假设和单侧检验
-10.2 有方向的假设和单侧检验--作业
-11.1 效应量的测量
-11.1 效应量的测量--作业
-11.2 均值检验效应量
-11.2 均值检验效应量--作业
-11.3 统计检验力及其影响因素
-11.3 统计检验力及其影响因素--作业
-12.1 参数估计的基本内容
-12.1 参数估计的基本内容--作业
-12.2 用t统计量作参数估计
-12.2 用t统计量作参数估计--作业
-12.3 假设检验和参数估计
-12.3 假设检验和参数估计--作业
-13.1 方差分析的逻辑
-13.1 方差分析的逻辑--作业
-13.2 方差分析的计算
-13.2 方差分析的计算--作业
-14.1 完全随机单因素方差分析
-14.1 完全随机单因素方差分析--作业
-14.2 方差分析的测量效应和事后检验
-14.2 方差分析的测量效应和事后检验--作业
-15.1 重复测量单因素实验设计
-15.1 重复测量单因素实验设计--作业
-15.2 重复测量单因素方差分析的逻辑和计算
-15.2 重复测量单因素方差分析的逻辑和计算--作业
-16.1 完全随机两因素实验设计
-16.1 完全随机两因素实验设计--作业
-16.2 完全随机两因素方差分析的逻辑和计算
-16.2 完全随机两因素方差分析的逻辑和计算--作业
-16.3 简单效应检验
-16.3 简单效应检验--作业
-16.4 完全随机两因素方差分析的效应值和事后检验
-16.4 完全随机两因素方差分析的效应值和事后检验--作业
-17.1 相关概述
-17.1 相关概述--作业
-17.2.1 皮尔逊相关1
-17.2.1 皮尔逊相关1--作业
-17.2.2 皮尔逊相关2
-17.2.2 皮尔逊相关2--作业
-17.3 等级相关
-17.3 等级相关--作业
-17.4 点二列相关和二列相关
-17.4 点二列相关和二列相关--作业
-17.5 φ相关
--17.5 φ相关
-17.5 φ相关--作业
-18.1 简单线性回归
-18.1 简单线性回归--作业
-18.2 回归模型和回归系数
-18.2 回归模型和回归系数--作业
-18.3 线性回归的基本假设
-18.3 线性回归的基本假设--作业
-18.4 变异的分解
-18.4 变异的分解--作业
-18.5 回归方程的估计标准误
-18.5 回归方程的估计标准误--作业
-18.6 回归方差的有效性检验
-18.6 回归方差的有效性检验--作业
-19.1 二项检验
-19.1 二项检验--作业
-19.2 卡方检验
-19.2 卡方检验--作业
-19.3 四格表及列联表
-19.3 四格表及列联表--作业
-20.1 非参数检验概述
-20.1 非参数检验概述--作业
-20.2 单样本非参数检验
-20.2 单样本非参数检验--作业
-20.3 两独立样本非参数检验
-20.3 两独立样本非参数检验--作业
-20.4 多个独立样本非参数检验
-20.4 多个独立样本非参数检验--作业
-20.5 两个配对样本非参数检验
-20.5 两个配对样本非参数检验--作业
-20.6 多配对样本的非参数检验
-20.6 多配对样本的非参数检验--作业