当前课程知识点:概率论与数理统计 > 第八章 假设检验 > 第1节 假设检验的基本概念 > 8.1.1 假设检验的思想和方法
大家好
这一章我们来介绍假设检验
假设检验是不同于参数估计的
另一类重要的统计推断问题
其基本原理是先对总体的特征做出假设
然后根据样本的信息
对假设的真伪作出判定
下面我们开始第一讲假设检验的基本概念
根据研究对象的不同
假设检验分为两类
一类参数假设检验,另一类非参数假设检验
参数假设检验是指总体分布类型已知
对总体的参数及其性质做出判断
非参数假设检验是指总体的分布类型未知
对总体的分布类型做出判断
这里我们仅介绍参数假设检验
下面我们通过一个例题来介绍一下
假设检验的思想和方法
某工厂生产的螺栓在正常生产的情况下
其长度服从正态分布
均值等于54,
方差等于0.45。
为了解检修后机器生产是否正常
任取5只螺栓
测得长度如下
已知总体的方差不变
依上述数据判断机器生产是否正常
我们可以假设
经过检修之后
生产的螺栓的长度服从正态分布
N(μ,σ²),由题目的条件
总体的方差不变
也就是
σ²=0.45
要判断机器生产是否正常
就转化成判断未知参数
μ与已知的常数54
是否相等的问题
因此我们就不妨假设 μ=54
这个假设我们就称之为原假设
第一步 提出检验的假设
把它记为
H₀: μ=μ0=54
已知的常数我们记为μ0.
H₀这个假设称之为原假设
或者叫零假设
与之对立的μ≠μ0 记为H₁
称为备择假设或者对立假设
假设检验的原理就是
在原假设H₀成立的条件下
我们来确定一个法则
根据样本的信息来对假设的真伪做出判定
那如何判断呢
由于我们对总体的均值做检验
那自然要考虑样本均值
我们知道样本均值为总体均值
μ的无偏估计量
样本均值的观测值的大小
在一定程度上反映了μ的大小
因此问题的关键是判断Xbar
减掉μ0的绝对值的大小
如果原假设H₀为真时
即 μ=μ0
那么偏差Xbar减μ0的绝对值
一般不应太大
如果偏差Xbar减μ0的绝对值
过分的大
那么我们就怀疑原假设H₀的正确性
就拒绝原假设H₀
否则就不拒绝原假设H₀
那么大到什么程度算是过分的大呢
我们需要确定一个临界值
考虑到总体它是服从正态分布的
那么样本均值Xbar依然服从正态分布
均值为μ,
方差等于n分之σ²
下面我们由样本均值的分布出发
把Xbar标准化
来构造合适的检验统计量
U等于Xbar减μ0
比上σ
除以根下n
这是假设检验的第二步
构造检验统计量
在原假设H₀:μ=μ0
成立的条件下
它是服从标准正态分布的
衡量Xbar与μ0的偏差的大小
可归结为衡量U 的大小
基于上面的想法
我们可以选定一个常数K
使得当样本值满足一定条件时
我们就做出拒绝
或者接受H₀的判断
即
若检验统计量 |U|>=K
我们就认为偏差过分的大
因此就拒绝原假设H₀
否则
检验统计量 |U|小于K
那么我们就接受原假设H₀
现在问题的关键是如何确定临界值K
依据是小概率原理
那么什么是小概率原理呢
小概率原理就是小概率事件
在一次试验中几乎不可能发生
我们判断的依据是以概率意义的反证法
如果小概率事件在一次试验中发生了
那么与我们的小概率原理就是矛盾的
我们就以很大的把握或者概率否定原假设
下面看一个例题
介绍一下小概率原理
某箱中有红球
白球共100个
已知两球所占的比例是99比1
但不知道是红球99个
还是白球99个
怎么判断呢
现在我们从箱中任取一个球来进行判断
我们也可能取到一个红球
也可能取到一个白球
如果我们的实验结果是取到一个红球
那么我们更倾向于认为这个箱子中有
红球99个
为什么可以做出这样的判断
下面我们分析一下
假设用H₀表示箱中有99个白球
那么在原假设H₀为真的条件下
从箱中任取一个球是红球
这个事情发生的概率就是一百分之一
也就是0.01
这是一个小概率事件
试验的结果表明
我们从箱中任取一个球
发现它是红球
这就说明了小概率事件
在一次试验当中发生了
这与我们的小概率原理是相矛盾的
因此我们就认为所给的原假设
H₀不成立更加合理
因此就拒绝原假设H₀
就认为这个箱中有99个红球
这就是我们的小概率原理的思想
接下来我们把对应的小概率记为α
称之为显著性水平
下面我们就借助于检验统计量的分布
构造小概率事件
由于标准正态分布是关于y轴对称的
我们选择的分位数点是标准正态分布
关于二分之α的上分位数
u 1减二分之α
以及它的对称点
负u 1减二分之α
大家来看服从标准正态的变量
落在这两个点左右两侧的面积
分别都是二分之α
因此
统计量
|U|>=u 1减二分之α的概率是
两部分面积之和α
从这里可以看出
统计量的绝对值大于等于
u 1减二分之α
这个事件是一个小概率事件
如果它在一次试验当中发生了
那么我们就拒绝原假设H₀
因此
H₀的拒绝域是这样的形式
统计量U的观测值
我们记为u 它满足
|u|>=u 1减二分之α
这是第三步
确定了拒绝域
接下来 最后一步就是由给定的
显著性水平以及数据做出判断
第四步
根据样本值作出判断
如果检验统计量的观测值
满足
|u|>=u 1减二分之α
这说明小概率事件发生了
那么我们就有充分的理由
拒绝原假设H₀
否则
如果 |u|小于u 1减二分之α
我们没有充分的理由拒绝
就只好接受原假设H₀
这就是假设检验的思想方法
下面我们给出具体的数据
做出判断
取显著性水平 α=0.05
我们的临界值取成了
u 1减二分之α
也就是u 0.975
查正态分布表可以得到
u 0.975=1.96
那么接下来 我们求出
样本值
Xbar=53.24
n=5 代入检验统计量
|u|=53.24-54
比上
σ除以根下n
合在一块儿去的话
就是根号下 0.45/5
求出之后
它的绝对值=2.53
明显大于临界值1.96
这说明检验统计量的观测值
落在拒绝域之内
因此我们就有充分的理由
拒绝原假设H₀
从而认为机器生产是不正常的
基于上述过程
我们可以得到假设检验的步骤
假设检验问题一般分为四步走
第一
根据实际问题提出原假设和备择假设
第二步
构造合适的检验统计量
要求分布的类型已知
除了检验的参数之外
不能含有其它的未知参数
第三
对于给定的显著性水平α
我们要由统计量的分布
确定拒绝域
第四
根据实际的样本值来决定原假设的取舍
好 下面总结一下本节所讲的内容
以上我们介绍了假设检验的思想和方法
小概率原理以及假设检验的步骤 四部曲
好 这一讲的内容就到这里
谢谢大家
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试