当前课程知识点：概率论与数理统计 > 第八章假设检验 > 第八章练习题 > 8.1 假设检验

返回《概率论与数理统计》慕课在线视频课程列表

8.1 假设检验在线视频

返回《概率论与数理统计》慕课在线视频列表

8.1 假设检验课程教案、知识点、字幕

大家好，欢迎来到我的课堂！

今天开始

我们学习第八章

假设检验的内容。

统计推断有两类问题，

前面我们介绍了估计问题。

现在，我们讨论的假设检验问题

是另一类重要的统计推断问题。

它根据样本的信息，

检验关于总体的某个假设是否正确。

它又分为参数检验和非参数检验，

对分布类型的检验，是非参数检验；

假定总体分布类型已知，对参数进行检验，

就是参数检验。

我们先来学习

假设检验的基本概念。

我们先看一个例子。

由经验知，某零件重量X服从均值为15，

方差为0.05²的正态分布。

对生产工艺革新以后，抽取6个零件重量如下。

假定方差不变，

推断零件重量的均值是否仍然是15克？

这里，我们先设工艺革新后零件重量为正态分布，

均值为μ，方差为σ²，其中σ等于0.05。

第一步，我们提出假设。

H0：μ=μ0，

H1：μ≠μ0，

其中μ0=15。

下面，我们要给出一个合理的决策方法，

来判定是拒绝假设H0，还是接受假设H0。

在H0成立的情况下，μ=μ0。

由于样本均值X¯是总体均值μ的无偏估计，

因此，当H0成立的时候

样本均值X¯-μ0应该在0的附近。

因此，

考察其绝对值，

当这个绝对值大于等于一个较大的数，

我们有理由相信H0是不成立的，

即拒绝H0。

那么，考察|X¯-μ0|

也可以改成考察这样的一个形式。

我们把这个形式称为假设的拒绝域。

即，如果样本满足这个式子

那么我们就拒绝H0，

否则我们就接受H0。

这就是我们的决策。

注意，这里绝对值内部

这个量我们把它记成Z，

这个Z是样本的函数，

不含有未知参数，

是一个统计量。

我们的拒绝域即：|Z|≥k。

那么，由正态分布抽样分布的结论

我们知道，

当H0为真时，Z恰好是一个标准正态分布。

有了决策，

我们还需要知道我们的决策是否可靠。

要注意，我们接受H0

并不意味着H0为真，

我们拒绝H0也并不意味着来H0一定为假。

因此，我们需要控制犯错误的概率。

我们考察下述条件概率，

当H0为真的时候

我们拒绝H0的概率，

我们将它记成这样的一个形式。

下标H0表示条件“当H0为真”，

拒绝H0即|Z|≥k。

由于Z的分布

当H0为真的时候是已知的，

因此这个概率我们可以进行计算。

要想得到可靠的决策，

这个概率应该加以控制。

我们通常令它等于α，

并且将α取得较小

（比如，取α=0.05）

以此保证：当H0为真时，

我们拒绝H0的概率较小。

那么，

根据H0为真时Z的分布

我们可以看出这个k

应该取做标准正态分布的上α/2分位点。

由此，

我们得到拒绝域应该为：Z观察值

z的绝对值≥z_α/2，

其中z_α/2为标准正态分布的上α/2分位点。

最后，

我们将例题中的数据代入，

我们取α为0.05，

将分位点z_α/2查表计算，

代入样本数据，计算得到样本均值14.9。

统计量的值|z|=4.9，

是大于1. 96的，

也就是说我们的样本落在了拒绝域内。

故应该拒绝H0，

也就是认为均值不是15克。

刚刚的例题

我们得到了：方差已知情况下

正态总体均值的假设检验。

在这个过程当中，

我们用到了一些基本概念。

H0,H1我们常称为原假设和备择假设，

它们是一对对立的、矛盾的假设。

在我们决策的过程中，

我们构造了统计量Z，

称之为检验统计量。

检验统计量是样本的函数，

且当H0为真的时候，

检验统计量的分布是已知、或近似已知的。

有了检验统计量，我们构造了拒绝域。

拒绝域的形式与Z有关，

其中有临界值k。

这个k的计算是通过H0为真的情况下

Z的分布推断出来的。

题目当中的四个步骤

就是假设检验的基本步骤。

一、提出原假设H0，提出备择假设H1。

二、构造统计量。

在H0为真时

这个统计量的分布已知、或近似已知，

同时确定拒绝域的形式。

第三，

对于给定的α，计算拒绝域，

也就是计算拒绝域当中的临界值点k。

第四，

对于实际问题，代入样本值，

如果样本值落在拒绝域内

则拒绝原假设，

否则就接受原假设。

注意，

假设检验当中我们关注了其中的一类错误，

也就是H0为真时拒绝原假设的概率。

前面我们记作α，

我们常称α为显著性水平。

假设检验当中的另一类错误是，

H0为假的时候我们接受了H0，

这类错误记作β。

在样本容量固定时，

不可能同时控制两类错误的概率。

前面，我们只控制第一类错误概率，

即控制显著性水平，

而不对β加以控制的做法是显著性检验。

那么，假设检验的思想

实际上利用了实际推断原理，

即小概率事件在一次试验中几乎不可能发生。

以α=0.05为例，

在1000次实验当中，

根据伯努利大数定理，

H0为真，

但我们错误拒绝H0的次数大约是50次。

下面，我们考察方差已知情形下

正态总体均值的假设检验。

前面，我们已经讨论了这种类型的假设检验，

它称之为双边检验。

对应的，我们还有右边检验和左边检验。

右边检验和左边检验统称为单边检验。

以右边检验为例，

我们来看一下拒绝域是怎样计算的。

怎样构造统计量呢？

当H0为真的时候，

μ≤μ0。

由于样本均值X¯是μ的无偏估计，

因此，X¯-μ0应该较小。

所以，当H0成立时

Z的值应该较小。

反之，Z如果较大就应该拒绝H0。

所以拒绝域的形式为Z≥K。

此外，当H0为真时

我们知道Z小于等于这样一个量，

而它是正态总体的一个抽样分布。

因此，我们这里构造的统计量

虽然分布未知，

但可以看成近似已知。

下面，我们利用这一信息继续计算。

第二步，

我们控制第一类错误的概率，

也就是当H0为真时拒绝H0的概率，

将它控制在α、或者小于α的水平。

但是，根据上面的信息

我们知道当Z≥k的时候，

(X¯-μ)/(σ/sqrt(n))≥k，

因此，这两个事件之间存在这样的包含关系，

于是，对应的概率

第一个的概率小于后面一个事件的概率，

也就是我们得到这样一个式子。

因此，要想控制第一个概率，

我们只需要将第二个概率让它得α。

第二个概率当中，涉及到标准正态分布。

根据标准正态分布概率密度的图像，

我们知道，k这个临界点

可以取做标准正态的上α分位点。

因此，我们得到拒绝域是

z大于等于标准正态的上α分位点z_α

同样，

我们可以推导出左边检验的拒绝域。

在方差已知情况下，

正态总体均值的这个检验

利用了Z统计量，

我们将这类检验统称为Z检验法。

例2，

通过测定牛奶的冰点可以检测牛奶是否掺水。

天然牛奶的冰点温度近似正态分布，

均值μ0=-0.545，

标准差σ。

牛奶掺水以后可以使冰点温度升高，

而接近水的冰点温度。

测得生产商提交的5瓶牛奶冰点温度，

其均值为-0.535。

是否可以认为牛奶商在牛奶中掺了水？

这里取α=0.05。

按题意，我们要做右边检验，

即H0为μ≤μ0，

H1为μ＞μ0，

其中μ0=-0.545。

该检验问题的拒绝域上页已经给出，

为z≥z_α。

我们代入题中的数据，进行计算。

这里z_α即z_0.05，查表知

它等于1.645。

代入题中的数据，计算得到

z统计量的值等于2. 7951，

大于1.645。

因此，观测值落在拒绝域内，

所以我们要拒绝原假设，

认为牛奶中掺了水。

下面，我们再来看方差未知情形下

正态总体均值的假设检验。

首先，考察双边检验。

第一步，构造统计量。

T=(X¯-μ0)/(S/sqrt(n))。

当H0为真的时候μ=μ0，

由于X¯是μ无偏估计，

此时X¯-μ0的值会较小。

如果|T|较大，

意味着H0应该被拒绝。

所以，拒绝域的形式是|T|≥k。

当H0为真时，T的分布已知，

是自由度为n-1的t分布。

第二步，控制第一类错误的概率，

即H0真时拒绝H0的概率，令为α。

由t分布的概率密度图，我们知道

临界值点k可以取作

自由度为n-1的t分布上α/2分位点，

由此得到拒绝域。

第三步，代入样本计算T的取值，

如果落在拒绝域则拒绝原假设。

类似地，我们可以去推导

左边检验的拒绝域和右边检验的拒绝域。

在方差未知情形下，

正态总体均值的这个假设检验

用到了T统计量，

我们称这类检验是T检验法。

例3，

化工厂用自动包装机包装化肥。

每包重量服从正态分布，

额定重量为100公斤。

某日开工后，

为了确定包装机这天的工作是否正常，

随机抽取9袋化肥

称得平均重量标准差。

能否认为这片的包装机工作正常？

这里α取0.1。

设当日化肥重量X服从正态分布，

σ²未知，

现在需要对μ进行检验。

这里应作双边检验，

μ0=100。

该检验问题的拒绝域由上页已知，

是|T|≥t_α/2(n-1)。

代入题中数据，

其中，t分布的分位点查表可得。

最后，计算得到|t|小于1.86，

即观测值落在接受域内。

因此，我们应该接受原假设，

认为包装机工作正常。

今天，我们学习了假设检验的基本内容，

包括假设检验的基本概念、步骤、思想和两类错误。

我们还学习了正态总体均值的假设检验，

分为方差已知和方差未知两种情形。

好，今天的课就到这儿。

谢谢大家！

概率论与数理统计课程列表：

第一章随机事件与概率

-1.1 随机试验

-1.2 样本空间随机事件（上）

-1.3 样本空间，随机事件（下）

-1.4 频率与概率

-1.5 等可能概型

-1.6 条件概率（上）

-1.7 条件概率（中）

-1.8 条件概率（下）

-1.9 独立性（上）

-1.10 独立性（下）

-第一章练习题

第二章随机变量及其分布

-2.1 随机变量、离散型随机变量

-2.2 常见的离散型随机变量（上）

-2.3 常见的离散型随机变量（下）

-2.4 随机变量的分布函数

-2.5 连续型随机变量

-2.6 常见的连续型随机变量（上）

-2.7 常见的连续型随机变量（中）

-2.8 常见的连续型随机变量（下）

-2. 9 随机变量函数的分布（上）

-2.10 随机变量函数的分布（下）

-第二章作业题

第三章多维随机变量及其分布

-第三章作业题

-3.1 二维随机变量（上）

-3.1 二维随机变量（下）

-3.2 边缘分布（上）

-3.2 边缘分布（下）

-3.3 条件分布

-3.4相互独立的随机变量

-3.5 多维随机变量函数的分布（上）

-3.5多维随机变量函数的分布（下）

第四章随机变量的数字特征

-4.1 数学期望（上）

-4.2 数学期望（下）

-4.4 协方差和相关系数（上）

-4.5 协方差和相关系数（下）

-第四章练习题

第五章大数定律和中心极限定理

-5.1 大数定律（上）

-5.2 大数定律（下）

-5.3 中心极限定理（上）

-5.4 中心极限定理（下）

-第五章练习题

第六章样本及抽样分布

-6.1 总体、样本与统计量

-6.2 抽样分布

-第六章练习题

第七章参数估计

-7.1 矩估计法

-7.2 最大似然估计法

-7.3 估计量的评选标准

-7.4 区间估计

-7.5 正态总体均值与方差的区间估计

-第七章练习题

第八章假设检验

-8.1 假设检验

-8.2 正态总体均值与方差的假设检验

-8.3 非正态总体参数的假设检验

- 第八章练习题

8.1 假设检验笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航课程版权归原始院校所有，
本网站仅通过互联网进行慕课课程索引，不提供在线课程学习和视频，请同学们点击报名到课程提供网站进行学习。