当前课程知识点:概率论与数理统计 > 第七章 参数估计 > 第2节 区间估计 > 7.2.1 区间估计的概念和术语
大家好
今天我们来学习第七章第二节,区间估计
在给出区间估计的概念之前,先通过一个例题
来回顾一下前面讲到的点估计
设某大学全体男生的身高
服从正态分布
其中,总体方差是已知的
现在随机抽取10个学生测得数据如下
求男生身高μ的估计值
根据前面我们讲过的点估计的知识,
μ的点估计值为样本均值
即这10个数据求和除以10
等于175
我请大家思考这样的一个问题
175是不是总体均值μ的真实值呢
如果不是,那么这个误差到底有多大呢
由点估计是无法计算误差的
因此我们就想,
是否可以从点估计出发
构造一个区间
并且以较大的概率保证该区间
包含未知参数的真值
这样对未知参数的估计是不是就
更具有实际意义呢
接下来,我们就来介绍参数估计的
另一种方法
区间估计法
首先我们来看区间估计的定义
设(𝑿𝟏,𝑿𝟐,⋯,𝑿𝒏)是取自总体的样本
θ为总体分布的一个未知参数
θ1和θ2是两个统计量
如果对于一个给定的数字𝟏−𝜶,有
这个式子成立
即,θ位于θ1和θ2
之间的概率为𝟏−𝜶
我们就称随机区间(θ1,θ2)为
未知参数θ的一个置信度为
𝟏−𝜶的置信区间
其中θ1称为置信下限
θ2称为置信上限
𝟏−𝜶称为置信度或置信水平
关于这个定义我做两点注释
一
随机区间(θ1,θ2)
以𝟏−𝜶的概率,包含
待估参数θ的真实值
置信度𝟏−𝜶反映了
区间估计的可靠程度
例如
当𝜶等于0.05时,置信度
为0.95
那么这里的置信度为0.95
是什么意思呢
我们可以这样理解
如果重复抽样100次,会得到
100个具体的区间
那么
其中包含真值的
有95个左右
一个区间估计的置信度越大就越可靠
但是构造一个置信度很大的区间
并不是一件很困难的事
比如,在刚才的例子中
将大学生平均身高估计为一米到两米之间
这个估计可靠度非常高
但是它的范围太大
没有任何意义
所以,一个好的区间估计
还需要有一个精度的要求
区间的
精度的标准
不止一个,常用的标准是区间长度
即区间的范围不能太大
区间长度θ2-θ1反映了
区间估计的精度,长度越小精度越高
在实际问题中
我们自然希望区间估计的
精度和置信度都很大
那么
能否同时提高精度和置信度呢
事实上
在给定样本容量之后
如果置信度变高
𝟏−𝜶就会变大,相应的区间变长
精度变低
反之,如果
精度高的话就会导致区间长度变短
从而𝟏−𝜶变小,置信度也就变低了
因此
置信度与精度
两者相互制约
那么该怎样来解决这样的矛盾呢
统计学家Neyman给出了这样的建议
先保证置信度,再在这个前提下
尽量提高精度
也就是说
我们先给定置信度𝟏−𝜶
再尽量缩小区间长度
下面我们来看具体的例子
设总体X
服从正态分布
其中σ²已知,μ未知
(𝑿𝟏,𝑿𝟐,⋯,𝑿𝒏)是取自总体X样本
X表示样本均值,求总体均值μ的
置信度为𝟏−𝜶的置信区间
我们来分析一下这个问题
我们要寻找一个以𝟏−𝜶的概率
包含μ的区间,需要构造一个
含有μ的统计量
并且这个统计量的分布
要求已知,根据前面的抽样分布定理
我们知道
样本均值
服从正态分布
期望不变方差变为原来的1/N
从而
U等于X减μ除以σ比上根号n
这个统计量就服从标准正态分布
我们做区间估计就是寻找
a和b
使得U这个统计量在ab之间的
概率为𝟏−𝜶
我们画出U这个统计量的
分布密度函数图
我们要使得中间阴影部分的
面积为𝟏−𝜶
还要尽量保证
这个区间的长度最小
由于统一量U的密度图形为单峰对称
要保证中间的面积为𝟏−𝜶
而且长度尽量短,很显然
我们应该对称着取区间端点
也就是说
使得中间阴影部分的面积为𝟏−𝜶,
而两边空白部分的面积都为α/2
这时a和b关于原点对称
当b等于负a时,置信区间的长度最短
这时我们可以根据分位数的概念
得到a等于uα/2
又等于负的u𝟏−𝜶/2
而b等于负a等于u𝟏−𝜶/2
由此我们得到
u这个统计量绝对值小于
u𝟏−𝜶/2的概率,等于𝟏−𝜶
我们将绝对值去掉
并从中解出
未知参数μ
就可以得到μ位于这个区间的
概率为𝟏−𝜶
因此
我们就得到了总体均值μ的置信度
为𝟏−𝜶的置信区间
为下面这个式子
那么我们回到刚才的例题
我们来求一下男生身高μ的置信度
为0.95的置信区间
根据我们刚才分析的结果
置信度为𝟏−𝜶的置信区间
是这个式子,我们只需要代入数据
就可以求得
男生身高的置信度为0.95的
置信区间
为(168.8,181.2)
这节课我们从点估计的不足出发
引出了置信区间的概念
同时给出了单个正态总体
均值的置信区间为
下次课我们讨论正态总体参数估计的
其它情况
这节课就讲到这里,谢谢大家
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试