当前课程知识点:心理统计 > 20 非参数检验 > 20.3 两独立样本非参数检验 > 20.3 两独立样本非参数检验
大家好
我们现在学习非参数检验中
两独立样本的非参数检验
两独立样本的非参数检验
我们将重点介绍一下
曼惠特尼U检验和中位数检验
首先来看一下曼惠特尼U检验
他是当违反了t检验的假设
比如说正态分布方差齐性
要求数据为等距或等比数据的时候
要求数据为等距或等比数据的时候
我们会用这个检验来替代t检验
我们会用检验来替代t检验
曼惠特尼U检验使用的是
从两个不同样本中得到的数据
来评估两个总体
来评估两个总体
或者说两种处理之间是否存在显著差异
如果说这两种处理存在显著差异
那么就会导致一个样本中的数据
普遍要大于另一个样本中的数据
我们通过一个图来看一下
图A是将浅色方块和深色方块
通过他们的一个大小排序
1是表示排序最低10表示排序最高
我们可以看到浅色方块
我们可以看到浅色方块
明显是排在了排序的高位
明显是排在了排序的高位
而深色方块明显是在排位的低位
因此我们可以认为
这两个深色方块和浅色方块
他们所来自的总体
他们所来自的总体
应该是属于两个不同的分布
而与之相反
如果说这两个分布并不存在显著的差异
那么把它们放在一起进行排序的话
就会是一个比较均匀的混合如图B所示
在学习曼惠特尼U检验之前
我们先来了解几个名词
第一个叫秩次或者说秩统计量
它是指全部观察值
按照一定的顺序
通常是从小到大的顺序
它在一定程度上反映了等级的高低
秩合就是把同一组的秩次进行相加
它在一定程度上反映了
该组等级的一个分布位置
我们通过对等级的分析
把它转化为对秩次的分析
曼惠特尼U检验属于一种秩和检验
它是通过秩次排列来求出秩和
然后对之进行一个假设检验
然后对之进行一个假设检验
其特点是检验的结果
对总体分布的形状并不敏感
只是对分布的一个位置差别敏感
那么具体应该怎么做
我们一一来看
首先我们假设
从两个未知总体一和总体二中
从两个未知总体一和总体二中
进行一个独立随机的抽样
抽取出来的两个样本容量分别为N₁和N₂
然后我们把它的数据
通过这样的方式来表示出来
通过这样的方式来表示出来
样本1用X来表示样本二用Y来表示
样本1用X来表示样本二用Y来表示
接着我们把这两个样本进行一个混合
并按照数值从小到大来排列顺序
如果说混合样本中具有相同的数据
那么这时候我们会取它们排序的均值
作为他们的秩
第三步我们会分别计算两个样本的秩和
也就是把样本1中所有X的秩相加
然后得到他们的秩和记为R1
然后得到他们的秩和记为R1
样本二中的秩和我们记为R2
接下来我们需要采取的是建立假设
虚无假设认为
两个总体具有相同的位置分布
而备择假设则认为
两个总体具有不同的位置分布
接下来就是非常重要的一步
我们要计算U统计量
公式如下
我们可以比较清楚地发现
U₁和U₂相加的话会等于N₁和N₂
也就是两个样本量的乘积
我们可以试想一下
如果说U₁和U₂是均匀分布的
那么他们算出来的值也会比较接近
如果说两个样本的总体分布是差异比较大的
U₁和U₂就会差别比较大
也就是一个值会偏大
另外一个值会偏小
那这个值到底有多小
我们才认为他们两个样本是具有显著差异的
这时候我们会选择U₁和U₂中较小的一个
记为U
然后根据显著性水平α和Uα临界值
来进行一个比较
如果说U它非常小甚至小于了临界值
那么这时候我们就应该拒绝零假设
但是如果它没有小于这个临界值
我们应该接受虚无假设
刚刚我们看到的是样本量较小的情况
但是如果样本量较大大于20的时候
U的值会近似的服从一个正态分布
这时候我们可以计算出正态分布的
均值和标准差
均值和标准差
然后能计算出它的Z值
这个Z值是服从一个标准正态分布
如果说Z值介于正负1.96之间
那么我们就认为在0.05的显著性水平下
我们应该接受虚无假设
否则我们将拒绝虚无假设
现在我们通过一个例题进行学习
假设一共有19名学生参加了某测验
我们把成绩最好的记为1
成绩最差的记为19
其中一共有10名学生来自第一组
9名学生来自第二组
9名学生来自第二组
现在请问
第一组和第二组的成绩是否有显著差异
大家现在看到的这两行就是两组学生的名次
也就是他们的秩
我们的虚无假设时
两组学生的成绩无显著差异
备择假设是两组学生的成绩有显着差异
按照刚刚所说的
我们根据题意算出
第一组的秩和R₁等于76
第二组的秩和R₂等于114
然后带入U的公式可以算得U₁等于69
U₂等于21
U₂等于21
那么我们选择的U统计量的话就是选择
69和21中较小的数值
也就是21
我们通过查表求得
在0.05显著性的水平下
样本量为10和9的情况下
它的临界值应该是20
我们现在计算的结果是21是大于20的
因此我们不能否定零假设
也就是我们最后得出的结论是
在0.05的显著性水平下
并不能认为两组学生的成绩有显著差异
接下来我们要学习的是中位数检验
中位数检验
是通过对两组独立的样本进行分析
然后我们来检验他们来自的
总体的中位数是否具有显着差异
总体的中位数是否具有显着差异
他的虚无假设
就是两个独立的样本所来自的总体
它们的中位数没有显著差异
它的基本思想也比较好理解
就是如果说
两个总体的中位数是没有显着差异的
两个总体的中位数是没有显著差异的
或者说多个总体它们具有共同的中位数
那么共同的中位数
在我们每一个抽取出来的样本上
它也应该是处于一个比较中间的位置
它也应该是处于一个比较中间的位置
因此每组样本中大于该中位数
或者说小于该中位数的样本
应该是大致相同的
具体计算步骤如下
第一步我们将两组的数据混合
并且按照大小顺序排至
第二步我们就算出混合排列的中数
第三步我们分别找出每一组中
大于混合中数和小于混合中数的个数
然后可以列出一个四格表
然后可以列出一个四格表
通过四格表的话
我们可以进行一个卡方检验
这个卡方检验
我们在上一章学过
是一个卡方检验下面的独立性检验
是一个卡方检验下面的独立性检验
如果说卡方检验的结果显著的话
就说明两样本的集中趋势
也就是中位数它的差异是显著的
同样我们知道在卡方检验中
如果当任意单元格中的
理论频数小于5的时候
我们需要用一个精确概率法对他进行一个校正
我们通过一个例子来看一下
从甲乙两高校高一学生中
分别随机抽取一部分学生
然后这是他们的外语考试成绩
请用中位数检验法来检验
两校的外语成绩是否相同
它的解题步骤如下
首先我们将两组数据进行一个混合排列
求得它的中数为62
需要注意一下
在甲校中有一名学生的成绩也为62
和中数是相等的
这时候这名学生的成绩在后续将忽略不计
我们将两组数据分别按照
大于和小于62进行分类
作出这样一个四格表
作出这样一个四格表
接下来我们就要计算这个四格表的卡方值
采用的是第19章所学到的公式
最后得到的结果是1.222
然后这时候
我们需要把它和卡方临界值进行一个比较
当自由度为1
显著性水平为0.05的时候
我们可以查得临界值为3.84
是大于1.222的
因此我们认为
两校在外语成绩上并没有显着差异
现在我们来小结一下刚刚所学到的知识
曼惠特尼U检验是当
正态方差齐性的条件没有被满足
正态方差齐性的条件没有被满足
或者说测量数据为等级数据的两个独立样本
我们来推断
他们来自的总体分布是否有显著差异
他们来自的总体分布是否有显著差异
曼惠特尼U检验属于一种秩和检验
它是利用秩次秩和进行分析
它的特点在于对总体分布的形态并不敏感
但是对总体分布的位置差别非常敏感
然后我们又学习了中位数检验
它是通过对两组独立样本
或者说可以做多组独立样本
来检验他们来自的总体的中位数
来检验他们来自的总体的中位数
是否存在显著差异
本节内容到此结束
-1.1 统计学的意义
-1.2 心理统计简介
-1.3 基本概念介绍1
-1.4 基本概念介绍2
-1.4 基本概念介绍2--作业
-1.5 研究方法
--1.5 研究方法
-2.1 统计表和统计图简介
--2.1 统计图表
-2.1 统计表和统计图简介--作业
-2.2 频数分布表
-2.2 频数分布表--作业
-2.3 频数分布图
-2.3 频数分布图--作业
-2.4 百分位数和百分等级
-2.4 百分位数和百分等级--作业
-3.1 平均数
--3.1 平均数
-3.1 平均数--作业
-3.2 中数
--3.2 中数
-3.2 中数--作业
-3.3 众数
--3.3 众数
-3.3 众数--作业
-4.1 全距和四分位距
-4.1 全距和四分位距--作业
-4.2 标准差和方差
-4.2 标准差和方差--作业
-4.3 差异系数
--4.3 差异系数
-4.3 差异系数--作业
-5.1 Z分数介绍
-5.1 Z分数介绍--作业
-5.2 Z分数的分布及转换
-5.2 Z分数的分布及转换--作业
-6.1 概率的基本概念
--6.1 概率与二项分布--作业
-6.2 概率与二项分布
-6.2 概率与二项分布--作业
-6.3 概率与正态分布
-6.3 概率与正态分布--作业
-6.4 抽样分布与推论统计
-6.4 抽样分布与推论统计--作业
-7.1 假设检验的一般原理
-7.1 假设检验的一般原理--作业
-7.2 假设检验的一般过程
-7.2 假设检验的一般过程--作业
-7.3 假设检验的不确定性和误差
-7.3 假设检验的不确定性和误差--作业
-7.4 有方向的假设与单侧检验
-7.4 有方向的假设与单侧检验--作业
-8.1 t统计量与t检验
-8.1 t统计量与t检验--作业
-8.2 单样本t检验的方法
-8.2 单样本t检验的方法--作业
-8.3 有方向的检验和单侧检验
-8.3 有方向的检验和单侧检验--作业
-9.1 独立样本t检验
-9.1 独立样本t检验--作业
-9.2 独立样本t检验的应用
-9.2 独立样本t检验的应用--作业
-10.1 相关样本t检验方法
-10.1 相关样本t检验方法--作业
-10.2 有方向的假设和单侧检验
-10.2 有方向的假设和单侧检验--作业
-11.1 效应量的测量
-11.1 效应量的测量--作业
-11.2 均值检验效应量
-11.2 均值检验效应量--作业
-11.3 统计检验力及其影响因素
-11.3 统计检验力及其影响因素--作业
-12.1 参数估计的基本内容
-12.1 参数估计的基本内容--作业
-12.2 用t统计量作参数估计
-12.2 用t统计量作参数估计--作业
-12.3 假设检验和参数估计
-12.3 假设检验和参数估计--作业
-13.1 方差分析的逻辑
-13.1 方差分析的逻辑--作业
-13.2 方差分析的计算
-13.2 方差分析的计算--作业
-14.1 完全随机单因素方差分析
-14.1 完全随机单因素方差分析--作业
-14.2 方差分析的测量效应和事后检验
-14.2 方差分析的测量效应和事后检验--作业
-15.1 重复测量单因素实验设计
-15.1 重复测量单因素实验设计--作业
-15.2 重复测量单因素方差分析的逻辑和计算
-15.2 重复测量单因素方差分析的逻辑和计算--作业
-16.1 完全随机两因素实验设计
-16.1 完全随机两因素实验设计--作业
-16.2 完全随机两因素方差分析的逻辑和计算
-16.2 完全随机两因素方差分析的逻辑和计算--作业
-16.3 简单效应检验
-16.3 简单效应检验--作业
-16.4 完全随机两因素方差分析的效应值和事后检验
-16.4 完全随机两因素方差分析的效应值和事后检验--作业
-17.1 相关概述
-17.1 相关概述--作业
-17.2.1 皮尔逊相关1
-17.2.1 皮尔逊相关1--作业
-17.2.2 皮尔逊相关2
-17.2.2 皮尔逊相关2--作业
-17.3 等级相关
-17.3 等级相关--作业
-17.4 点二列相关和二列相关
-17.4 点二列相关和二列相关--作业
-17.5 φ相关
--17.5 φ相关
-17.5 φ相关--作业
-18.1 简单线性回归
-18.1 简单线性回归--作业
-18.2 回归模型和回归系数
-18.2 回归模型和回归系数--作业
-18.3 线性回归的基本假设
-18.3 线性回归的基本假设--作业
-18.4 变异的分解
-18.4 变异的分解--作业
-18.5 回归方程的估计标准误
-18.5 回归方程的估计标准误--作业
-18.6 回归方差的有效性检验
-18.6 回归方差的有效性检验--作业
-19.1 二项检验
-19.1 二项检验--作业
-19.2 卡方检验
-19.2 卡方检验--作业
-19.3 四格表及列联表
-19.3 四格表及列联表--作业
-20.1 非参数检验概述
-20.1 非参数检验概述--作业
-20.2 单样本非参数检验
-20.2 单样本非参数检验--作业
-20.3 两独立样本非参数检验
-20.3 两独立样本非参数检验--作业
-20.4 多个独立样本非参数检验
-20.4 多个独立样本非参数检验--作业
-20.5 两个配对样本非参数检验
-20.5 两个配对样本非参数检验--作业
-20.6 多配对样本的非参数检验
-20.6 多配对样本的非参数检验--作业