13.1 方差分析的逻辑慕课视频播放-心理统计-MOOC慕课视频教程-柠檬大学

同学们

你们好

今天我们进入第13到第16章

方差分析这一部分的学习

我们先来学习第13章方差分析概述

我们先来看第一节方差分析的逻辑

它包括两个部分

实验设计与t检验困境

方差分析的逻辑

先来看什么是实验设计

实验设计是研究中最为重要的一个环节

实验者需要有效的操纵实验变量

控制额外因素的影响

能在随机化原则基础上选择和分配被试

从而客观地反映实验处理的作用

比如说我们想研究学习努力

对学习成绩的影响

影响成绩的因素是非常多的

比如说智商

兴趣等等

当我们只去关心学习努力

对成绩的影响的时候

像其他的这些因素我们叫

无关变量我们需要对它进行控制

我们只有把它控制住

也就是说假设所有人在这些因素上都是相同的

而只去看学习努力的不同水平对成绩的影响

这个时候我们才能够

把学习成绩的差异

归因为是学习努力造成的

所以在实验设计里边

学习努力也就是说我们的实验变量

智商和兴趣

我们说叫无关变量我们需要控制它

也叫控制变量

成绩是因变量

那么你可能会问我们怎么能让

所有人的智商和兴趣是相同的

这是不可能的对不对

那么我们怎么让大家控制在一个水平

一个很重要的实验控制就是随机化原则

也就是说我们基于随机化的原则

来分配被试进入不同的实验组里边

那么这个时候由于他们是随机分配的

我们可以假定不同组的

他们的智商和兴趣大致是相同的

在实验设计里边

随机化原则是非常重要的一条

当然我们还有其他的方法来进行控制

比如说匹配组或者是一些统计控制的方法

但是大家要记住

我们在整个的实验设计里边

什么是自变量

什么是控制变量

什么是成绩

什么是因变量

这些大家都要清楚

实验设计是非常重要的

基于不同的实验设计

我们有不同的统计方法

我们来看一下

实验设计主要有几种

一种叫完全随机

我们这一章主要是学方差分析

它所对应的统计方法叫

One_Way Anova

也就是说单因素的方差分析

还有一个设计叫重复测量的实验设计

它所对应的方差分析叫重复测量的方差分析

还有一种设计叫析因设计

当我们有多个自变量的时候

这样的设计叫析因设计

它所对应的方差分析叫多因素方差分析

我们在整个方差分析这一章里边

会针对不同的实验设计

来介绍不同的方差分析的方法

好

下面我们来看t检验的困境

对独立样本的t检验

我们只能对两种实验处理进行差异性检验

比如说有两种教学方法

我们想去检验它们效果的差异

可以借用独立样本t检验来做

但是如果我们有三种实验处理

我们该怎么办

我们可以把它拆分成两两的检验

比如说

第一个检验

μ₁等于μ₂

第二个检验μ₁等于μ₃

第三个检验μ₂等于μ₃

也就是说我们进行

三种实验处理的差异性检验的时候

把它拆分成三个检验

那么如果我们有四种实验处理

我们又能拆分成多少个检验呢

任何两个的一个组合

所以应该是

C4²等于

六种检验

我们可以想

如果我们有五种实验处理

我们要进行多少次检验

所以这是一个非常大的困难

也就是说当自变量变化的水平比较多的时候

我们进行t检验的次数是增大的非常快的

这是非常效率不高的

我们来看困难二

如果每组的显著性水平皆为α

也就是说一类错误

比如说我们把它定义为0.05

这个也是0.05

这也是0.05

那么我们可以想在Ho成立的情况下

我们接受Ho的概率是多少呢

也就是说我们没有犯一类错误的概率是多少

就是一减去α

等于0.95

同理这个也是0.95

这个也是0.95

我们进行一个总的检验

μ₁等于μ₂等于μ₃

我们要对Ho进行假设检验的话

我们在这里把它拆分成了三个检验

在每个检验是0.05成立的情况下

它们各自接受Ho的概率是0.95

那么我们想在Ho成立的情况下

我们接受它的概率会是多少呢

也就是他们三个同时成立的情况下

接受的概率就是0.95的3次方

等于0.857

那一类错误是多少呢

就是1减去0.857

我们这里可以看等于0.143

也就是说在Ho成立的情况下

我们拒绝它的

概率也就是错误的概率

一类错误是多少0.143

它是远远大于0.05的

所以我们说如果我们有三种实验处理

我们进行这样的两两的t检验的话

那么它的一类错误会增大

会大于0.05

所以这也是说我们为什么

不能用t检验

去处理当实验处理多于两种的情况

我们看一下我们怎么来处理

当我们的实验处理多于两个的情况下

我们就要进行方差分析

在科学实验中

常常要探讨不同实验条件或处理方法

对实验结果的影响

方差分析可用于评价两个或多个处理条件

之间的平均数的差异

比如说我们可以研究几种疗法

对某种神经症的疗效

我们可以看自变量是什么

几种疗法

对吧

因变量就是对神经症的疗效

我们怎么来控制无关变量

那么随机分组

把被试分成若干组就可以了

那么这里不同的教学方法是自变量

学生的学习成绩是因变量

自变量对因变量的影响

我们的被试被随机分到

不同的教学方法组成当中去

那么我们可以看到

当我们的教学方法是多过两种的

有三种四种五种

疗法也是多过两种的时候

我们就可以用方差分析去做了

我们来看一下t检验的检验公式

分子部分是实验组与对照组

我们是两个组

他们的样本平均数之间的差异

分母部分

也就是随机因素造成的差异

我们说叫标准误

t值越大

说明实验处理造成两组之间的实际差异

是大于随机因素的

如果t值达到了显著性的水平

我们就可以拒绝Ho

说明实验处理的效应是显著的

类似我们可以写F检验

也就是说方差分析的时候

比如说因素水平

个样本的平均数之间的差异

然后分母还是随机因素造成的变异

大家可以看到

如果以同样的逻辑

我们来设计F值的计算公式的时候

我们会发现

对两个以上的样本平均数进行比较的时候

分子的平均数的差异很难定义

而且无法计算

大家可以看因素水平

个样本平均数之间的变异

我们怎么来做

我们来看样本平均数

当我们多过两个组的时候

怎么来表现这个差异呢

很难去设计

所以我们说这个时候需要方差分析来做

方差分析所基于的原理就是变异的可分解性

个体之间因变量的变异

也叫数据总变异的基本来源有两个

一个是随机误差

就是各种偶然因素造成的个体之间的差异

称为处理内的差异

一种是实验条件所造成的差异

称为处理前差异

也叫组间差异

我们来举一个例子

比如说学生之间的学习成绩是有差异的

人与人之间成绩的差异是比较大的

有的非常高

有的成绩非常低

我们来看为什么会造成他们之间有差异

我们把这个学生一看

把它分成了两组

第一组采用的是第一种教学方法

第一种教学方法

我们第二组采用的是第二种教学方法

一种是传统的

一种是新式的

那么我们看学生之间成绩有差异

你可以去想

是不是由于教学方法造成的

也就是说是不是由于我们的实验条件造成的

实验条件

也就是说不同的教学方法

我们可以看它体现在组间变异上

也就是这一个组

和这个组之间有差异

他们之间本身是有差异的

那么你可能还要问

你们都接受了相同的教学方法了

比如说你们都是这种传统的教学方法

为什么在组内还有差异呢

我们叫随机误差造成的差异

也叫组内差异

也就代表这些组内受偶然因素的影响

比如说他们自己的个性品质、失误等等

各种非实验条件所造成的差异

我们统一归为随机误差

那么这一组也是也会受到随机误差的影响

所以我们看我们个体与个体之间的这种差异

也叫变异

受什么因素影响一个是他们所在的组

也就是他们的处理之间是有差异的

不同的实验处理

一种是传统的

一种是新式的实验处理之间的差异

它所体现就是两个组之间有差异

还有一种叫随机误差

也就是他们的组内之间是有差异的

组内同样受一样的实验处理为什么还不一样

就是受到各种偶然因素造成的

或者是他们的个体之间的本身就有差异

这些差异我们统一称为组内变异

也叫处理内变异

所以我们说总变异学生与学生之间的变异

可以分解成两部分

一个是组间变异

一个是组内变异

组间变异也叫处理间变异

处理间变异分成两块

一个叫处理效应

一个是随机因素

也就是说我们组与组之间的差异

实际上除了受他们的实验处理的影响

也还是有随机因素的影响的

第二部分就是组内差异

这一部分我们说纯粹是随机因素的影响

比如说这是总变异

我看它代表什么含义

我们有三个实验组

比如说代表3种教学方法

我们一共是11个被试

这上面的数据点是他们因变量的取值

这11个被试因变量的平均数是多少

是 ̅x..

那么总变异是指什么

每一个被试距离

这个平均数的距离

大家可以看到有的长有的短

有的是正值

有的是负值

那么我们怎么来衡量

这些个体到平均数的这种

变异情况呢

我们用离差平方和来表示

也就是说每比如说这个点

就这一段距离

我求一个平方

平方

每一个点一旦求平方以后

它的符号就消掉了

那么总变异其实就代表的是每一个取值

到总变异的离差平方和这叫总变异

我们来看组间变异

我们是三个组

还是这十一个数据点

每一个组会有一个小组平均数

也叫组中心点

这个组中心点代表的是他处理的效应

我们来看这些点到总平均数之间会有差异

看到没有

这些差异

就这个点到平均数

总平均数

那么这些差异是什么呢

我们叫组间差异

它就是用各组的均值

与总体均值的离差平方和来表示

那么本实验中组建差异

为三个组的均值到总均值的差异

这个差异可能是由于不同的实验处理造成的

你可能会问

除了实验处理

它还可能是因为什么因素造成的

我们可以看

比如说这个组这些

平均数到总平均数之间的距离

我们说他们受到了不同的实验处理

所以他们之间会有差异

这个差异也可能是随机因素引起的

比如说这里这个组一和组二

我们组二也可能比组一的水平

本身的水平会高一点

那么我们当它接受了一种实验处理

它接受一种实验处理的时候

我们这个组的

平均数就会比这个组的平均数会高一些

但是这个之间的差异

就真正的两个组组中心的差异

也可能是因为它们的被试之间

本身的不平衡造成的

因为你随机分组

随机分组真是有可能

本身它会比它稍微高一点的

我们叫这种就是随机因素

是各种随机因素

这个小组的各种随机因素

那么我们说这种差异

就是这种组间的变异

组间的变异

很有可能是实验处理造成的

也有可能是随机因素造成的

我们再来看组内变异

也就是说我们每一个个体

跟自己的组中心点的差异

你本来都在这一个组内

你们之间为什么还有差异

你们的个体差异我怎么来衡量

就是用组内变异来衡量

也就是说同一组内由于随机误差的影响

每一个个体的取值跟他自己的平均数

会有一些差异

我们用这些还是这些差异的离差平方和

来表达组内变异

我们说这种是随机误差引起的

我们来看一下

F比值我们的总变异可以分为

组间变异与组内变异

也叫做处理间变异和处理内变异

我们可以进行F检验

F值是怎么定义的呢

F值等于组间变异

比上组内变异

我们刚才讲组间变异受什么因素影响呢

受处理效应和随机误差因素的影响

而组内变异是纯粹的随机变异

我们可以想

如果处理效应为零

那么我们的F值会是什么样子的

也就是唯一

我们进行方差分析的时候

首先是要进行写零假设的

比如说我们有三个组

我们的零假设是μ₁等于μ₂等于μ₃

在Ho成立的情况下

也就是μ₁等于μ₂等于μ₃

我们去构建F检验

实际上这个地方应该是平均的组间变异

这个是平均的组内变异

他们在Ho成立的情况下

都是总体方差的一个无偏估计量

也就是它的F的取值应该是一的

我们来看一下

对于这样的F检验

这是一个F分布

那么它的中心点就是一

是一在Ho成立的情况下

如果我们实际用样本计算出一个F值来

这个F值落在了临界值以外

也就落在了拒绝域内

所以我们其实是可以把F推翻的

把F分布推翻

也就是说在Ho成立的情况下

我们建立的F分布是可以推翻掉的

如果F值小于临界值

也就落在了非拒绝域内

那么我们是可以接受Ho的

实验处理效果是不显着的

如果大于这个临界值

那么也就落在拒绝域中

我们可以拒绝Ho

实验处理效应是显著的

这是方差分析的一个逻辑

好我们来看小节

当实验处理的水平数多于两个的时候

使用t检验会产生很多问题

我们可以采用方差分析

来进行平均数的差异性检验

实际上当实验处理的水平数是两个的时候

我们既可以用t检验去做

也可以用方差分析来做

二者的检验结果是一致的

方差分析是基于离差平方和的可分解性

也就是说变异的可分解性来做的

我们将总变异分解为处理间变异和处理内变异

处理间变异和除以内变异

我们也叫组间变异和组内变异构建F检验

实际上准确的说是平均的

处理间变异和平均的处理内便以构建F检验

当F值小于临界值的时候

接受Ho实验处理效应不显着

F值大于零界值的时候

拒绝Ho试验处理效应显着

好

这一节讲完了

感谢大家收看

心理统计课程列表：

1 统计学入门

-1.1 统计学的意义

-1.2 心理统计简介

-1.3 基本概念介绍1

-1.4 基本概念介绍2

-1.4 基本概念介绍2--作业

-1.5 研究方法

--1.5 研究方法

2 统计图表和频数分布

-2.1 统计表和统计图简介

--2.1 统计图表

-2.1 统计表和统计图简介--作业

-2.2 频数分布表

--2.2 频数分布表

-2.2 频数分布表--作业

-2.3 频数分布图

--2.3 频数分布图

-2.3 频数分布图--作业

-2.4 百分位数和百分等级

--2.4 百分位数和百分等级

-2.4 百分位数和百分等级--作业

3 集中趋势

-3.1 平均数

--3.1 平均数

-3.1 平均数--作业

-3.2 中数

--3.2 中数

-3.2 中数--作业

-3.3 众数

--3.3 众数

-3.3 众数--作业

-3集中趋势--讨论

4 离散趋势

-4.1 全距和四分位距

--4.1 全距和四分位距

-4.1 全距和四分位距--作业

-4.2 标准差和方差

--4.2 标准差和方差

--4.2标准差和方差--讨论

-4.2 标准差和方差--作业

-4.3 差异系数

--4.3 差异系数

-4.3 差异系数--作业

5 Z分数

-5.1 Z分数介绍

--5.1 Z分数介绍

-5.1 Z分数介绍--作业

-5.2 Z分数的分布及转换

--5.2 Z分数的分布及转换

-5.2 Z分数的分布及转换--作业

-5Z分数--讨论

6 概率与抽样分布

-6.1 概率的基本概念

--6.1 概率的基本概念

--6.1 概率与二项分布--作业

-6.2 概率与二项分布

--6.2 概率与二项分布

-6.2 概率与二项分布--作业

-6.3 概率与正态分布

--6.3 概率与正态分布

-6.3 概率与正态分布--作业

-6.4 抽样分布与推论统计

--6.4 抽样分布与推论统计

-6.4 抽样分布与推论统计--作业

7 假设检验

-7.1 假设检验的一般原理

--7.1 假设检验的一般原理

-7.1 假设检验的一般原理--作业

-7.2 假设检验的一般过程

--7.2 假设检验的一般过程

-7.2 假设检验的一般过程--作业

-7.3 假设检验的不确定性和误差

--7.3 假设检验的不确定性和误差

--7.3假设检验的不确定性和误差--讨论

-7.3 假设检验的不确定性和误差--作业

-7.4 有方向的假设与单侧检验

--7.4 有方向的假设与单侧检验

-7.4 有方向的假设与单侧检验--作业

8 样本平均数的假设检验

-8.1 t统计量与t检验

--8.1 t统计量与t检验

-8.1 t统计量与t检验--作业

-8.2 单样本t检验的方法

--8.2 单样本t检验的方法

-8.2 单样本t检验的方法--作业

-8.3 有方向的检验和单侧检验

--8.3 有方向的检验和单侧检验

-8.3 有方向的检验和单侧检验--作业

9 独立样本t检验

-9.1 独立样本t检验

--9.1 独立样本t检验

-9.1 独立样本t检验--作业

-9.2 独立样本t检验的应用

--9.2 独立样本t检验的应用

-9.2 独立样本t检验的应用--作业

10 相关样本t检验

-10.1 相关样本t检验方法

--10.1 相关样本t检验方法

-10.1 相关样本t检验方法--作业

-10.2 有方向的假设和单侧检验

--10.2 有方向的假设和单侧检验

--10.2有方向的假设和单侧检验--讨论

-10.2 有方向的假设和单侧检验--作业

11 效应量和统计检验力

-11.1 效应量的测量

--11.1 效应量的测量

-11.1 效应量的测量--作业

-11.2 均值检验效应量

--11.2 均值检验效应量

-11.2 均值检验效应量--作业

-11.3 统计检验力及其影响因素

--11.3 统计检验力及其影响因素

-11.3 统计检验力及其影响因素--作业

12 参数估计

-12.1 参数估计的基本内容

--12.1 参数估计的基本内容

--12.1参数估计的基本内容--讨论

-12.1 参数估计的基本内容--作业

-12.2 用t统计量作参数估计

--12.2 用t统计量作参数估计

-12.2 用t统计量作参数估计--作业

-12.3 假设检验和参数估计

--12.3 假设检验和参数估计

-12.3 假设检验和参数估计--作业

13 方差分析概述

-13.1 方差分析的逻辑

--13.1 方差分析的逻辑

--13.1方差分析的逻辑--讨论

-13.1 方差分析的逻辑--作业

-13.2 方差分析的计算

--13.2 方差分析的计算

-13.2 方差分析的计算--作业

14 完全随机单因素方差分析

-14.1 完全随机单因素方差分析

--14.1 完全随机单因素方差分析

-14.1 完全随机单因素方差分析--作业

-14.2 方差分析的测量效应和事后检验

--14.2 方差分析的测量效应和事后检验

-14.2 方差分析的测量效应和事后检验--作业

15 重复测量单因素方差分析

-15.1 重复测量单因素实验设计

--15.1 重复测量单因素实验设计

-15.1 重复测量单因素实验设计--作业

-15.2 重复测量单因素方差分析的逻辑和计算

--15.2 重复测量单因素方差的逻辑和计算

--15.2重复测量单因素方差分析的逻辑和计算--讨论

-15.2 重复测量单因素方差分析的逻辑和计算--作业

16 完全随机两因素方差分析

-16.1 完全随机两因素实验设计

--16.1 完全随机两因素实验设计

-16.1 完全随机两因素实验设计--作业

-16.2 完全随机两因素方差分析的逻辑和计算

--16.2 完全随机两因素方差分析的逻辑和计算

-16.2 完全随机两因素方差分析的逻辑和计算--作业

-16.3 简单效应检验

--16.3 简单效应检验

-16.3 简单效应检验--作业

-16.4 完全随机两因素方差分析的效应值和事后检验

--16.4 完全随机两因素方差分析的效应值和事后检验

-16.4 完全随机两因素方差分析的效应值和事后检验--作业

17 相关分析与检验

-17.1 相关概述

--17.1 相关概述

-17.1 相关概述--作业

-17.2.1 皮尔逊相关1

--17.2.1 皮尔逊相关1

-17.2.1 皮尔逊相关1--作业

-17.2.2 皮尔逊相关2

--17.2.2 皮尔逊相关2

-17.2.2 皮尔逊相关2--作业

-17.3 等级相关

--17.3 等级相关

-17.3 等级相关--作业

-17.4 点二列相关和二列相关

--17.4 点二列相关和二列相关

-17.4 点二列相关和二列相关--作业

-17.5 φ相关

--17.5 φ相关

-17.5 φ相关--作业

18 回归与预测

-18.1 简单线性回归

--18.1 简单线性回归

--18.1简单线性回归--讨论

-18.1 简单线性回归--作业

-18.2 回归模型和回归系数

--18.2 回归模型和回归系数

-18.2 回归模型和回归系数--作业

-18.3 线性回归的基本假设

--18.3 线性回归的基本假设

-18.3 线性回归的基本假设--作业

-18.4 变异的分解

--18.4 变异的分解

-18.4 变异的分解--作业

-18.5 回归方程的估计标准误

--18.5 回归方程的估计标准误

-18.5 回归方程的估计标准误--作业

-18.6 回归方差的有效性检验

--18.6 回归方差的有效性检验

-18.6 回归方差的有效性检验--作业

19 计数数据的检验

-19.1 二项检验

--19.1 二项检验

-19.1 二项检验--作业

-19.2 卡方检验

--19.2 卡方检验

-19.2 卡方检验--作业

-19.3 四格表及列联表

--19.3 四格表及列联表

-19.3 四格表及列联表--作业

20 非参数检验

-20.1 非参数检验概述

--20.1 非参数检验概述

--20.1非参数检验概述--讨论

-20.1 非参数检验概述--作业

-20.2 单样本非参数检验

--20.2 单样本非参数检验

-20.2 单样本非参数检验--作业

-20.3 两独立样本非参数检验

--20.3 两独立样本非参数检验

-20.3 两独立样本非参数检验--作业

-20.4 多个独立样本非参数检验

--20.4 多个独立样本非参数检验

-20.4 多个独立样本非参数检验--作业

-20.5 两个配对样本非参数检验

--20.5 两个配对样本非参数检验

-20.5 两个配对样本非参数检验--作业

-20.6 多配对样本的非参数检验

--20.6 多配对样本的非参数检验

-20.6 多配对样本的非参数检验--作业

13.1 方差分析的逻辑在线视频