当前课程知识点:概率论与数理统计 > 第十六周 假设检验 > 假设检验问题的两类错误和P值 > 16.2假设检验问题的两类错误和P值
因为随机性的存在
假设检验的结果总会有出错的可能
例如
利用一份20道选择题的试卷
进行选拔考试
无论分数线定得多高
一道题都不会的学生只靠随机地蒙答案
也都有通过的可能
这个可能性可能非常的小
但总是存在的
这个选拔考试
就是针对学生的掌握情况所做的假设检验
考试成绩就是检验统计量
分数线的意义就对应着显著性水平
不会答的学生通过了
以及掌握的很好的学生失手了
都是在检验中犯了错误
具体地考虑假设检验问题
可能出现的结果
按照原假设是否成立
原假设下拒绝或是接受
共有4种可能出现的结果
其中原假设成立时
接受原假设
原假设不成立时
拒绝原假设
都是正确的
而原假设成立时
拒绝了原假设
原假设不成立时
接受了原假设
这都是错误的
原假设成立时
拒绝了原假设的概率
就是假设检验的显著性水平
就是原假设成立时
检验统计量落入拒绝域的概率
这一类错误称为第一类错误
也称为拒真概率
而原假设不成立时
检验统计量没有落入拒绝域
结果接受了原假设的情形
称为第二类错误
直观地称为受伪
假设检验中
犯两类错误的概率不可能同时减小
二者是相互制约的
犯第一类错误的概率越小
则犯第二类错误的概率就越大
反之
犯第二类错误的概率越小
则犯第一类错误的概率就越大
例如20道选择题考试的例子
希望掌握的好的同学
尽量不要因为发挥不充分而落选
这样的话
分数线就要定的低一些
分数线越低
学得好的学生就越不会被漏掉
但是同时
分数线降低
靠运气好而入选的学生比例也会增加
反之
如果要降低靠运气入选的可能
那么就要提高分数线
学得好的同学就更加的不容失误了
也就增加他们落选的可能
特别要注意的是
在假设检验中
原假设和备择假设各有各的作用
不能随意互换位置
比如判断女士是否有鉴别力
原假设有鉴别力
备择假设为没有鉴别力
和原假设是没有鉴别力
备择假设是有鉴别力
这是两个不一样的问题
结论也会有差异
我们下一节会专门举一个例子
通过具体的计算加以说明
原假设一般设定的是
人们经验上认为正常的假设
在品茶问题上
通常的情况
具有这种鉴别力是很特别的
所以人们的经验是没有鉴别力是正常的
因此原假设就设定为没有鉴别力
在技术革新的检验中
因为真正的创新改进不是轻易能够获得的
所以总是假定技术没有提高作为原假设
将有显著提高作为备择假设
关于原假设和备择假设的设定
希望同学们在学习过程中注意体会
一个较理想的检验
应该是在控制犯第一类错误的基础上
尽量降低犯第二类错误的概率
犯第一类错误的概率
就是检验的显著性水平
由于显著性检验首要关心的是
控制犯第一类错误的概率
所以显著性检验天然地
具有保护零假设的特点
另一方面
因为两类错误相互制约
显著性水平也不是简单地越小越好
尽量地兼顾两种错误
首先保证第一类错误较小
即保证参数为真时
拒绝原假设的概率尽可能小
固定了第一类错误的发生概率之后
可以通过增加样本量来降低犯第二类错误的概率
某厂生产一种标准长度35毫米的螺钉
实际生产的产品长度服从正态分布
期望为mu
方差为3的平方
设定假设检验问题
产品长度的期望mu
等于35毫米为原假设
mu不等于35作为备择假设
拒绝域已经给出
样本均值的观测值大于36
小于34时拒绝
此时样本均值偏离35的标准值较大
拒绝长度均值为35的原假设
第一问
求犯第一类错误的概率
也就是此时选取的显著性水平
检验统计量X一拔服从期望为mu
方差为2分之1平方的正态分布
第一类错误为原假设成立时
X一拔落入拒绝域的概率
即为mu等于35条件下
X一拔减35的绝对值大于1的条件概率
等于1减去mu等于35条件下
X一拔减35的绝对值
小于等于1的条件概率
将X一拔变换为标准正态分布计算概率
最终计算得到犯第一类错误的概率
alpha等于0.0455
再看第二问
计算当mu等于36时
犯第二类错误的概率
此时mu不等于35
原假设不成立
如犯错误
一定是第二类错误
第二类错误的概率beta
等于mu等于36条件下
检验统计量X一拔落入接受范围的概率
即X一拔减35的绝对值
小于等于1的条件概率
仍然将X一拔变换为标准正态分布
其中φ 4的值非常接近于1
计算得到此时犯第二类错误的概率beta
等于0.5
p值是统计检验中非常常用的概念
在一个假设检验问题中
利用观测值能够做出的
拒绝原假设的最小显著性水平
称为检验的p值
这个定义说起来有点绕口
但是很实用
或者换一种说法
在原假设下
出现比观测值更极端情况的概率
就是p值
p值是相对于某一次
具体的观测结果而言的
利用p值做检验往往会比较方便
例如我们看到体检表
自己的验血结果中的一项
转氨酶的指标达到了120
这意味着什么
医生告诉你
正常人中
转氨酶高于120的可能性是千分之5
则120这个检验统计量观测值的p值
就是千分之5
有了p值
对照显著性水平
如果p值小于显著性水平
则拒绝原假设
p值大于等于原假设
则接受原假设
仍然看上一个例题的问题
求样本均值的观测值
为36.5mm时的p值
此时
偏离35越远越特殊
所以出现比观测值更极端情况
就是X一拔减35的绝对值
大于等于36.5与35的偏差
为1.5
所以p值等于mu为35条件下
X一拔减35的绝对值
大于等于1.5的概率
计算得此概率为0.0027
p值非常小
此时要拒绝原假设
样本均值与35的偏离是非常显著的
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题