20.3 两独立样本非参数检验慕课视频播放-心理统计-MOOC慕课视频教程-柠檬大学

大家好

我们现在学习非参数检验中

两独立样本的非参数检验

我们将重点介绍一下

曼惠特尼U检验和中位数检验

首先来看一下曼惠特尼U检验

他是当违反了t检验的假设

比如说正态分布方差齐性

要求数据为等距或等比数据的时候

我们会用这个检验来替代t检验

我们会用检验来替代t检验

曼惠特尼U检验使用的是

从两个不同样本中得到的数据

来评估两个总体

或者说两种处理之间是否存在显著差异

如果说这两种处理存在显著差异

那么就会导致一个样本中的数据

普遍要大于另一个样本中的数据

我们通过一个图来看一下

图A是将浅色方块和深色方块

通过他们的一个大小排序

1是表示排序最低10表示排序最高

我们可以看到浅色方块

明显是排在了排序的高位

而深色方块明显是在排位的低位

因此我们可以认为

这两个深色方块和浅色方块

他们所来自的总体

应该是属于两个不同的分布

而与之相反

如果说这两个分布并不存在显著的差异

那么把它们放在一起进行排序的话

就会是一个比较均匀的混合如图B所示

在学习曼惠特尼U检验之前

我们先来了解几个名词

第一个叫秩次或者说秩统计量

它是指全部观察值

按照一定的顺序

通常是从小到大的顺序

它在一定程度上反映了等级的高低

秩合就是把同一组的秩次进行相加

它在一定程度上反映了

该组等级的一个分布位置

我们通过对等级的分析

把它转化为对秩次的分析

曼惠特尼U检验属于一种秩和检验

它是通过秩次排列来求出秩和

然后对之进行一个假设检验

其特点是检验的结果

对总体分布的形状并不敏感

只是对分布的一个位置差别敏感

那么具体应该怎么做

我们一一来看

首先我们假设

从两个未知总体一和总体二中

进行一个独立随机的抽样

抽取出来的两个样本容量分别为N₁和N₂

然后我们把它的数据

通过这样的方式来表示出来

样本1用X来表示样本二用Y来表示

接着我们把这两个样本进行一个混合

并按照数值从小到大来排列顺序

如果说混合样本中具有相同的数据

那么这时候我们会取它们排序的均值

作为他们的秩

第三步我们会分别计算两个样本的秩和

也就是把样本1中所有X的秩相加

然后得到他们的秩和记为R1

样本二中的秩和我们记为R2

接下来我们需要采取的是建立假设

虚无假设认为

两个总体具有相同的位置分布

而备择假设则认为

两个总体具有不同的位置分布

接下来就是非常重要的一步

我们要计算U统计量

公式如下

我们可以比较清楚地发现

U₁和U₂相加的话会等于N₁和N₂

也就是两个样本量的乘积

我们可以试想一下

如果说U₁和U₂是均匀分布的

那么他们算出来的值也会比较接近

如果说两个样本的总体分布是差异比较大的

U₁和U₂就会差别比较大

也就是一个值会偏大

另外一个值会偏小

那这个值到底有多小

我们才认为他们两个样本是具有显著差异的

这时候我们会选择U₁和U₂中较小的一个

记为U

然后根据显著性水平α和Uα临界值

来进行一个比较

如果说U它非常小甚至小于了临界值

那么这时候我们就应该拒绝零假设

但是如果它没有小于这个临界值

我们应该接受虚无假设

刚刚我们看到的是样本量较小的情况

但是如果样本量较大大于20的时候

U的值会近似的服从一个正态分布

这时候我们可以计算出正态分布的

均值和标准差

然后能计算出它的Z值

这个Z值是服从一个标准正态分布

如果说Z值介于正负1.96之间

那么我们就认为在0.05的显著性水平下

我们应该接受虚无假设

否则我们将拒绝虚无假设

现在我们通过一个例题进行学习

假设一共有19名学生参加了某测验

我们把成绩最好的记为1

成绩最差的记为19

其中一共有10名学生来自第一组

9名学生来自第二组

现在请问

第一组和第二组的成绩是否有显著差异

大家现在看到的这两行就是两组学生的名次

也就是他们的秩

我们的虚无假设时

两组学生的成绩无显著差异

备择假设是两组学生的成绩有显着差异

按照刚刚所说的

我们根据题意算出

第一组的秩和R₁等于76

第二组的秩和R₂等于114

然后带入U的公式可以算得U₁等于69

U₂等于21

那么我们选择的U统计量的话就是选择

69和21中较小的数值

也就是21

我们通过查表求得

在0.05显著性的水平下

样本量为10和9的情况下

它的临界值应该是20

我们现在计算的结果是21是大于20的

因此我们不能否定零假设

也就是我们最后得出的结论是

在0.05的显著性水平下

并不能认为两组学生的成绩有显著差异

接下来我们要学习的是中位数检验

中位数检验

是通过对两组独立的样本进行分析

然后我们来检验他们来自的

总体的中位数是否具有显着差异

他的虚无假设

就是两个独立的样本所来自的总体

它们的中位数没有显著差异

它的基本思想也比较好理解

就是如果说

两个总体的中位数是没有显着差异的

两个总体的中位数是没有显著差异的

或者说多个总体它们具有共同的中位数

那么共同的中位数

在我们每一个抽取出来的样本上

它也应该是处于一个比较中间的位置

因此每组样本中大于该中位数

或者说小于该中位数的样本

应该是大致相同的

具体计算步骤如下

第一步我们将两组的数据混合

并且按照大小顺序排至

第二步我们就算出混合排列的中数

第三步我们分别找出每一组中

大于混合中数和小于混合中数的个数

然后可以列出一个四格表

通过四格表的话

我们可以进行一个卡方检验

这个卡方检验

我们在上一章学过

是一个卡方检验下面的独立性检验

如果说卡方检验的结果显著的话

就说明两样本的集中趋势

也就是中位数它的差异是显著的

同样我们知道在卡方检验中

如果当任意单元格中的

理论频数小于5的时候

我们需要用一个精确概率法对他进行一个校正

我们通过一个例子来看一下

从甲乙两高校高一学生中

分别随机抽取一部分学生

然后这是他们的外语考试成绩

请用中位数检验法来检验

两校的外语成绩是否相同

它的解题步骤如下

首先我们将两组数据进行一个混合排列

求得它的中数为62

需要注意一下

在甲校中有一名学生的成绩也为62

和中数是相等的

这时候这名学生的成绩在后续将忽略不计

我们将两组数据分别按照

大于和小于62进行分类

作出这样一个四格表

接下来我们就要计算这个四格表的卡方值

采用的是第19章所学到的公式

最后得到的结果是1.222

然后这时候

我们需要把它和卡方临界值进行一个比较

当自由度为1

显著性水平为0.05的时候

我们可以查得临界值为3.84

是大于1.222的

因此我们认为

两校在外语成绩上并没有显着差异

现在我们来小结一下刚刚所学到的知识

曼惠特尼U检验是当

正态方差齐性的条件没有被满足

或者说测量数据为等级数据的两个独立样本

我们来推断

他们来自的总体分布是否有显著差异

曼惠特尼U检验属于一种秩和检验

它是利用秩次秩和进行分析

它的特点在于对总体分布的形态并不敏感

但是对总体分布的位置差别非常敏感

然后我们又学习了中位数检验

它是通过对两组独立样本

或者说可以做多组独立样本

来检验他们来自的总体的中位数

是否存在显著差异

本节内容到此结束

心理统计课程列表：

1 统计学入门

-1.1 统计学的意义

-1.2 心理统计简介

-1.3 基本概念介绍1

-1.4 基本概念介绍2

-1.4 基本概念介绍2--作业

-1.5 研究方法

--1.5 研究方法

2 统计图表和频数分布

-2.1 统计表和统计图简介

--2.1 统计图表

-2.1 统计表和统计图简介--作业

-2.2 频数分布表

--2.2 频数分布表

-2.2 频数分布表--作业

-2.3 频数分布图

--2.3 频数分布图

-2.3 频数分布图--作业

-2.4 百分位数和百分等级

--2.4 百分位数和百分等级

-2.4 百分位数和百分等级--作业

3 集中趋势

-3.1 平均数

--3.1 平均数

-3.1 平均数--作业

-3.2 中数

--3.2 中数

-3.2 中数--作业

-3.3 众数

--3.3 众数

-3.3 众数--作业

-3集中趋势--讨论

4 离散趋势

-4.1 全距和四分位距

--4.1 全距和四分位距

-4.1 全距和四分位距--作业

-4.2 标准差和方差

--4.2 标准差和方差

--4.2标准差和方差--讨论

-4.2 标准差和方差--作业

-4.3 差异系数

--4.3 差异系数

-4.3 差异系数--作业

5 Z分数

-5.1 Z分数介绍

--5.1 Z分数介绍

-5.1 Z分数介绍--作业

-5.2 Z分数的分布及转换

--5.2 Z分数的分布及转换

-5.2 Z分数的分布及转换--作业

-5Z分数--讨论

6 概率与抽样分布

-6.1 概率的基本概念

--6.1 概率的基本概念

--6.1 概率与二项分布--作业

-6.2 概率与二项分布

--6.2 概率与二项分布

-6.2 概率与二项分布--作业

-6.3 概率与正态分布

--6.3 概率与正态分布

-6.3 概率与正态分布--作业

-6.4 抽样分布与推论统计

--6.4 抽样分布与推论统计

-6.4 抽样分布与推论统计--作业

7 假设检验

-7.1 假设检验的一般原理

--7.1 假设检验的一般原理

-7.1 假设检验的一般原理--作业

-7.2 假设检验的一般过程

--7.2 假设检验的一般过程

-7.2 假设检验的一般过程--作业

-7.3 假设检验的不确定性和误差

--7.3 假设检验的不确定性和误差

--7.3假设检验的不确定性和误差--讨论

-7.3 假设检验的不确定性和误差--作业

-7.4 有方向的假设与单侧检验

--7.4 有方向的假设与单侧检验

-7.4 有方向的假设与单侧检验--作业

8 样本平均数的假设检验

-8.1 t统计量与t检验

--8.1 t统计量与t检验

-8.1 t统计量与t检验--作业

-8.2 单样本t检验的方法

--8.2 单样本t检验的方法

-8.2 单样本t检验的方法--作业

-8.3 有方向的检验和单侧检验

--8.3 有方向的检验和单侧检验

-8.3 有方向的检验和单侧检验--作业

9 独立样本t检验

-9.1 独立样本t检验

--9.1 独立样本t检验

-9.1 独立样本t检验--作业

-9.2 独立样本t检验的应用

--9.2 独立样本t检验的应用

-9.2 独立样本t检验的应用--作业

10 相关样本t检验

-10.1 相关样本t检验方法

--10.1 相关样本t检验方法

-10.1 相关样本t检验方法--作业

-10.2 有方向的假设和单侧检验

--10.2 有方向的假设和单侧检验

--10.2有方向的假设和单侧检验--讨论

-10.2 有方向的假设和单侧检验--作业

11 效应量和统计检验力

-11.1 效应量的测量

--11.1 效应量的测量

-11.1 效应量的测量--作业

-11.2 均值检验效应量

--11.2 均值检验效应量

-11.2 均值检验效应量--作业

-11.3 统计检验力及其影响因素

--11.3 统计检验力及其影响因素

-11.3 统计检验力及其影响因素--作业

12 参数估计

-12.1 参数估计的基本内容

--12.1 参数估计的基本内容

--12.1参数估计的基本内容--讨论

-12.1 参数估计的基本内容--作业

-12.2 用t统计量作参数估计

--12.2 用t统计量作参数估计

-12.2 用t统计量作参数估计--作业

-12.3 假设检验和参数估计

--12.3 假设检验和参数估计

-12.3 假设检验和参数估计--作业

13 方差分析概述

-13.1 方差分析的逻辑

--13.1 方差分析的逻辑

--13.1方差分析的逻辑--讨论

-13.1 方差分析的逻辑--作业

-13.2 方差分析的计算

--13.2 方差分析的计算

-13.2 方差分析的计算--作业

14 完全随机单因素方差分析

-14.1 完全随机单因素方差分析

--14.1 完全随机单因素方差分析

-14.1 完全随机单因素方差分析--作业

-14.2 方差分析的测量效应和事后检验

--14.2 方差分析的测量效应和事后检验

-14.2 方差分析的测量效应和事后检验--作业

15 重复测量单因素方差分析

-15.1 重复测量单因素实验设计

--15.1 重复测量单因素实验设计

-15.1 重复测量单因素实验设计--作业

-15.2 重复测量单因素方差分析的逻辑和计算

--15.2 重复测量单因素方差的逻辑和计算

--15.2重复测量单因素方差分析的逻辑和计算--讨论

-15.2 重复测量单因素方差分析的逻辑和计算--作业

16 完全随机两因素方差分析

-16.1 完全随机两因素实验设计

--16.1 完全随机两因素实验设计

-16.1 完全随机两因素实验设计--作业

-16.2 完全随机两因素方差分析的逻辑和计算

--16.2 完全随机两因素方差分析的逻辑和计算

-16.2 完全随机两因素方差分析的逻辑和计算--作业

-16.3 简单效应检验

--16.3 简单效应检验

-16.3 简单效应检验--作业

-16.4 完全随机两因素方差分析的效应值和事后检验

--16.4 完全随机两因素方差分析的效应值和事后检验

-16.4 完全随机两因素方差分析的效应值和事后检验--作业

17 相关分析与检验

-17.1 相关概述

--17.1 相关概述

-17.1 相关概述--作业

-17.2.1 皮尔逊相关1

--17.2.1 皮尔逊相关1

-17.2.1 皮尔逊相关1--作业

-17.2.2 皮尔逊相关2

--17.2.2 皮尔逊相关2

-17.2.2 皮尔逊相关2--作业

-17.3 等级相关

--17.3 等级相关

-17.3 等级相关--作业

-17.4 点二列相关和二列相关

--17.4 点二列相关和二列相关

-17.4 点二列相关和二列相关--作业

-17.5 φ相关

--17.5 φ相关

-17.5 φ相关--作业

18 回归与预测

-18.1 简单线性回归

--18.1 简单线性回归

--18.1简单线性回归--讨论

-18.1 简单线性回归--作业

-18.2 回归模型和回归系数

--18.2 回归模型和回归系数

-18.2 回归模型和回归系数--作业

-18.3 线性回归的基本假设

--18.3 线性回归的基本假设

-18.3 线性回归的基本假设--作业

-18.4 变异的分解

--18.4 变异的分解

-18.4 变异的分解--作业

-18.5 回归方程的估计标准误

--18.5 回归方程的估计标准误

-18.5 回归方程的估计标准误--作业

-18.6 回归方差的有效性检验

--18.6 回归方差的有效性检验

-18.6 回归方差的有效性检验--作业

19 计数数据的检验

-19.1 二项检验

--19.1 二项检验

-19.1 二项检验--作业

-19.2 卡方检验

--19.2 卡方检验

-19.2 卡方检验--作业

-19.3 四格表及列联表

--19.3 四格表及列联表

-19.3 四格表及列联表--作业

20 非参数检验

-20.1 非参数检验概述

--20.1 非参数检验概述

--20.1非参数检验概述--讨论

-20.1 非参数检验概述--作业

-20.2 单样本非参数检验

--20.2 单样本非参数检验

-20.2 单样本非参数检验--作业

-20.3 两独立样本非参数检验

--20.3 两独立样本非参数检验

-20.3 两独立样本非参数检验--作业

-20.4 多个独立样本非参数检验

--20.4 多个独立样本非参数检验

-20.4 多个独立样本非参数检验--作业

-20.5 两个配对样本非参数检验

--20.5 两个配对样本非参数检验

-20.5 两个配对样本非参数检验--作业

-20.6 多配对样本的非参数检验

--20.6 多配对样本的非参数检验

-20.6 多配对样本的非参数检验--作业

20.3 两独立样本非参数检验在线视频