当前课程知识点:心理统计 > 19 计数数据的检验 > 19.1 二项检验 > 19.1 二项检验
同学们好
今天我们来讲第19章内容
计数数据的检验
首先我们讲第一节二项检验
当我们使用如Z检验t检验
还有方差分析来进行组均值差异的检验时
对于总体分布的形态
还有总体参数之间的关系都有一定的假设
那么这些假设要求
我们的数据来自如等距量表
我们的数据来自如等距量表
或者等比量表
可是在心理还有教育的研究中
实际得来的数据通常会出现
称名量表或者顺序量表
由于数据不能满足上述分析方法的使用条件
所以不能使用参数检验的方法
那么我们就会介绍一种叫做非参数检验的方法
它可以在研究的总体分布为非正态
或者分布形态不清楚的时候
通过检验及分布情况来实现
由样本信息推断总体的这一检验过程
由样本信息推断总体的这一检验过程
在计数数据的检验中
我们会介绍两种方法
第一种是二项检验
也叫百分数检验
是一种适用于称名
或者顺序数据的推断检验方法
那么主要是基于
对不同分类情况下百分数之间的差异检验
那么还有对于计数数据
统计学家Pearson也提出过一种
使用非常广泛的
检验方法
叫做卡方检验
卡方检验是检验样本的观测次数
或者它的百分比
与理论的总体次数
或者百分比之间的差异性检验的
一种推断检验方法
今天我们主要来介绍的就是二项检验
在心理和教育的研究中
研究者通常会使用二分变量
如被试的性别
可以选择男或女
在人事的研究中有被雇佣或者没有被雇佣
那么在教育测量中还有回答正确与回答错误
这些都是二分变量
那么二项检验
就是基于二项分布来检验实际的
就是基于二项分布来检验实际的
百分数和假设的百分数之间
是否相同这样一种推断统计方法
有关二分变量的研究
可以通过二项分布来检验
如果你的样本量小于50的时候
就可以通过直接查
二项分布临界值表来查到
拒绝虚无假设的临界值
我们来看一个例子
例一
研究者认为农村中百分之25的儿童
达到了学习障碍的临床标准
达到了学习障碍的临床标准
为了验证这一事实
研究者就随机在某农村抽取了20个儿童
组成了一个样本
那么临床诊断的结果发现
其中有八个儿童存在了学习障碍
那么想问的是
农村中学习障碍的儿童
是否要明显高于正常水平呢
这里的α设定为0.05
那么解法如下
虚无假设就是认为这个概率p
小于等于百分之25
也就是0.25
对于显著性水平α等于0.05的单侧检验
我们设定p就等于百分之25是0.25
那么q等于1减p等于0.75
我们的样本量n等于20
通过查二项分布表可以得到临界值等于9
通过我们的样本量得到的值为8
小于临界值
因此我们接受虚无假设
认为农村中学习障碍儿童的比例
没有明显高于正常水平
那么还有其他情况
比如说p大于0.5
或者是n大于等于50
或者说总体上np大于等于10的时候
二项分布会近似的看作正态分布
那么此时我们可以计算均值
μ等于n乘以p标准差
等于n乘以p乘以q再开根号
那么接下来我们就可以使用
下述公式来计算Z值
下述公式来计算Z值
那么对于二项分布的
某随机事件发生次数的检验
某随机事件发生次数的检验
它对应的Z统计量计算公式
等于m减去n乘p
等于m减去n乘p
在除以根号下n乘p乘q
那么其中m指的是
随机事件
命名为A它发生的实际次数
那么p为随机事件A发生的理论概率
n乘p就是n次实验中
随机事件A发生的理论次数
随机事件A发生的理论次数
那么q等于1减p
然后我们计算出统计量之后
根据正态分布
确定显著性水平
查标准正态分布表得到临界值
然后用统计量
与实际得到临界值进行比较解释结果
我们再举一个例子
例二
随机抽取50名学生
其中有30名男生
20名女生
那么想问的是这个差异
是由于抽取男生的概率高于
还是是由于统计误差所造成的
虚无假设H0
p等于0.5
H1就是p不等于0.5
α水平设为0.05
使用双侧检验
这时候的临界值Z等于1.96
那么通过上述的公式
计算的Z统计量的值等于
计算的Z统计量的值等于
1.4142
小于我们的临界值
小于我们的临界值
那么就此我们就可以接受虚无假设
认为实际抽取的30名男生与期望值
如果两个相等
应该等于25之间的差异
是由于抽样误差造成的
接下来我们介绍第三种情况
如果当两个样本中的比率
p₁和p₂
分别代表2个样本中之间
同一事件发生的比率
而且n₁乘p₁n₂乘p₂都大于等于10
这里的n₁和n₂分别代表两样本的样本量
那么这个时候两样本比例的差异
也可以看作是接近正态分布的
那么就可以用下述公式来计算其标准误
然后再代入这个公式计算Z统计量
那么同样可以确定显著性之后
通过查标准正态分布表
然后来下结论
差异是否显着
对结果进行解释
我们再举个例子
例三
有一个调查
随机抽取甲乙两个班
甲班一百人
对问题持肯定态度的有60人
乙班有50人
对这个问题持肯定态度的有35人
现在想问的是两个班对这个问题持肯定态度的
比率差异是否显著
α等于0.05
虚无假设H0
p₁和p₂概率相等
通过计算可以得到p₁等于0.6
p₂等于0.7
n₁等于60
n₂等于35
我们计算标准误等于0.08347
然后代入公式计算出Z统计量的值
等于1.198
那么临界值等于1.96
Z的值小于我们查到的临界值
所以我们接受原假设认
为两个班对于这个问题
持肯定态度的比率
其中差异不显著
我们来总结一下这节我们学到的
首先
非参数检验的方法
可以在检验的总体分布为非正态
或者分布形态不确定的时候
通过检验其分布情况
来实现由样本信息
推断总体的这一过程
二项检验是基于二项分布
来检验实际的百分数
来检验实际的百分数
与假设的百分数是否相同的
一种推断检验方法
一种推断检验方法
那么在三种不同的情况下
二项检验的它的流程是比较相似的
但是需要注意的是
具体的计算公式略有差别
尤其是最后算Z统计量的时候
注意区分辨别
正确使用
本节的内容就到此结束
谢谢大家
-1.1 统计学的意义
-1.2 心理统计简介
-1.3 基本概念介绍1
-1.4 基本概念介绍2
-1.4 基本概念介绍2--作业
-1.5 研究方法
--1.5 研究方法
-2.1 统计表和统计图简介
--2.1 统计图表
-2.1 统计表和统计图简介--作业
-2.2 频数分布表
-2.2 频数分布表--作业
-2.3 频数分布图
-2.3 频数分布图--作业
-2.4 百分位数和百分等级
-2.4 百分位数和百分等级--作业
-3.1 平均数
--3.1 平均数
-3.1 平均数--作业
-3.2 中数
--3.2 中数
-3.2 中数--作业
-3.3 众数
--3.3 众数
-3.3 众数--作业
-4.1 全距和四分位距
-4.1 全距和四分位距--作业
-4.2 标准差和方差
-4.2 标准差和方差--作业
-4.3 差异系数
--4.3 差异系数
-4.3 差异系数--作业
-5.1 Z分数介绍
-5.1 Z分数介绍--作业
-5.2 Z分数的分布及转换
-5.2 Z分数的分布及转换--作业
-6.1 概率的基本概念
--6.1 概率与二项分布--作业
-6.2 概率与二项分布
-6.2 概率与二项分布--作业
-6.3 概率与正态分布
-6.3 概率与正态分布--作业
-6.4 抽样分布与推论统计
-6.4 抽样分布与推论统计--作业
-7.1 假设检验的一般原理
-7.1 假设检验的一般原理--作业
-7.2 假设检验的一般过程
-7.2 假设检验的一般过程--作业
-7.3 假设检验的不确定性和误差
-7.3 假设检验的不确定性和误差--作业
-7.4 有方向的假设与单侧检验
-7.4 有方向的假设与单侧检验--作业
-8.1 t统计量与t检验
-8.1 t统计量与t检验--作业
-8.2 单样本t检验的方法
-8.2 单样本t检验的方法--作业
-8.3 有方向的检验和单侧检验
-8.3 有方向的检验和单侧检验--作业
-9.1 独立样本t检验
-9.1 独立样本t检验--作业
-9.2 独立样本t检验的应用
-9.2 独立样本t检验的应用--作业
-10.1 相关样本t检验方法
-10.1 相关样本t检验方法--作业
-10.2 有方向的假设和单侧检验
-10.2 有方向的假设和单侧检验--作业
-11.1 效应量的测量
-11.1 效应量的测量--作业
-11.2 均值检验效应量
-11.2 均值检验效应量--作业
-11.3 统计检验力及其影响因素
-11.3 统计检验力及其影响因素--作业
-12.1 参数估计的基本内容
-12.1 参数估计的基本内容--作业
-12.2 用t统计量作参数估计
-12.2 用t统计量作参数估计--作业
-12.3 假设检验和参数估计
-12.3 假设检验和参数估计--作业
-13.1 方差分析的逻辑
-13.1 方差分析的逻辑--作业
-13.2 方差分析的计算
-13.2 方差分析的计算--作业
-14.1 完全随机单因素方差分析
-14.1 完全随机单因素方差分析--作业
-14.2 方差分析的测量效应和事后检验
-14.2 方差分析的测量效应和事后检验--作业
-15.1 重复测量单因素实验设计
-15.1 重复测量单因素实验设计--作业
-15.2 重复测量单因素方差分析的逻辑和计算
-15.2 重复测量单因素方差分析的逻辑和计算--作业
-16.1 完全随机两因素实验设计
-16.1 完全随机两因素实验设计--作业
-16.2 完全随机两因素方差分析的逻辑和计算
-16.2 完全随机两因素方差分析的逻辑和计算--作业
-16.3 简单效应检验
-16.3 简单效应检验--作业
-16.4 完全随机两因素方差分析的效应值和事后检验
-16.4 完全随机两因素方差分析的效应值和事后检验--作业
-17.1 相关概述
-17.1 相关概述--作业
-17.2.1 皮尔逊相关1
-17.2.1 皮尔逊相关1--作业
-17.2.2 皮尔逊相关2
-17.2.2 皮尔逊相关2--作业
-17.3 等级相关
-17.3 等级相关--作业
-17.4 点二列相关和二列相关
-17.4 点二列相关和二列相关--作业
-17.5 φ相关
--17.5 φ相关
-17.5 φ相关--作业
-18.1 简单线性回归
-18.1 简单线性回归--作业
-18.2 回归模型和回归系数
-18.2 回归模型和回归系数--作业
-18.3 线性回归的基本假设
-18.3 线性回归的基本假设--作业
-18.4 变异的分解
-18.4 变异的分解--作业
-18.5 回归方程的估计标准误
-18.5 回归方程的估计标准误--作业
-18.6 回归方差的有效性检验
-18.6 回归方差的有效性检验--作业
-19.1 二项检验
-19.1 二项检验--作业
-19.2 卡方检验
-19.2 卡方检验--作业
-19.3 四格表及列联表
-19.3 四格表及列联表--作业
-20.1 非参数检验概述
-20.1 非参数检验概述--作业
-20.2 单样本非参数检验
-20.2 单样本非参数检验--作业
-20.3 两独立样本非参数检验
-20.3 两独立样本非参数检验--作业
-20.4 多个独立样本非参数检验
-20.4 多个独立样本非参数检验--作业
-20.5 两个配对样本非参数检验
-20.5 两个配对样本非参数检验--作业
-20.6 多配对样本的非参数检验
-20.6 多配对样本的非参数检验--作业