当前课程知识点:概率论与数理统计 > 第十五周 参数的区间估计 > 区间估计的构造方法 > 15.2 区间估计的构造方法
置信系数为0.95的估计区间为7.282到7.393
参数区间估计的两个基本要求
一个是未知参数 theta
要以尽可能大的概率落在随机区间I中
另一个是在达到一定的置信水平的前提下
要求区间的长度尽可能小
也就是置信水平尽可能高
置信区间尽可能短
例如
估计某个人年龄在20至60岁之间
置信水平会接近100%
但是这么宽的范围
给出的估计没有实际意义
如果估计区间只有1、2岁的差异
而准确度能够达到90%以上
相比之下
这样的估计是更受欢迎比较有效
参数区间估计的标准做法是所谓的
枢轴量法
下面以双侧置信区间为例
给出区间估计的枢轴量法的具体实现步骤
第1步
构造枢轴量G
G是一个随机变量
是样本X1、X2、Xn和被估参数theta的函数
而且
随机变量G的分布为确定的已知分布
不能依赖于任何未知参数
第2步
适当地选取两个常数c和d
使得对给定的大于0小于1的常数alpha
有随机变量落在c和d之间的概率
不小于1减alpha
这一步是保证区间估计的置信水平
达到1减alpha
第3步
求解不等式
关于X1、X2、Xn与参数theta的函数G
大于等于c小于等于d
解出用X1、X2、Xn表示的theta的不等式关系
即解出使得G落在c和d之间的
参数theta的取值范围
theta的上下限是两个统计量
是X1、X2、Xn的函数
都是随机变量
也就是参数theta落在这个随机区间的概率
不小于1减alpha
就得到了
参数theta的置信水平1减alpha的置信区间
看一个例题
总体服从正态分布
方差sigma方已知
期望mu未知
X1、X2、Xn是简单随机样本
求参数mu的1减alpha置信区间
先构造枢轴量
点估计量往往是区间估计的基础
区间估计的随机区间
常常是依据点估计量展开的
被估参数mu的一个点估计量为样本均值
样本均值X一拔服从期望是mu
方差是n分之sigma方的正态分布
这一分布包含了未知参数
进一步考虑将其标准化
即可得到标准正态分布
就是一个不依赖被估参数的已知分布
可做枢轴量
具体地
将X一拔标准化
用X一拔减mu再除以标准差
根号n分之sigma方
经过整理得到根号n倍的X一拔减mu除以sigma
服从标准正态分布
显然G是样本和被估参数mu的函数
而且G的分布不依赖任何未知参数
所以G可作为枢轴量
选取了枢轴量G
再选取适当的常数c和d
使得枢轴量在c和d之间的概率
不小于1减alpha
因为区间长度越短越好
所以只要有可能
人们就取枢轴量在c和d之间的概率
恰好等于1减alpha
可取d等于标准正态分布的
1减2分之alpha分位点
c等于标准正态分布的2分之alpha分位点
由于对称性u、2分之alpha
就等于负的u 1减2分之alpha
这样就得到了参数mu的1减alpha置信区间
mu大于等于X一拔减u
1减2分之alpha乘sigma分之根号n
小于等于X一拔加
u 1减2分之alpha乘sigma分之根号n
介绍一下枢轴量不等式中c和d的取法
c和d的取值应该使得置信区间的长度
尽可能短
使得置信区间达到最小的c和d的取值
为其最优值
当枢轴量的密度函数为对称函数时
即枢轴量为对称分布时
可以证明
c和d的最优取值分别是
枢轴量G的分布函数的2分之alpha分位点
和1减2分之alpha分位点
证明这个结论要用到的方法已经
超出了本课程适用的范围
所以我们只给出结论
而当枢轴量的分布为非对称分布时
比如卡方分布
F分布
通常也取枢轴量分布的
2分之alpha分位点和1减2分之alpha分位点
置信区间长度往往也会接近于可能达到的
最短的置信区间长度
在上一个例子
例15.2.1中
c和d分别取正负标准正态分布的
1减2分之alpha分位点
就采用的是c、d的最佳取值
第13周的第4讲介绍卡方分布时
列出了三个重要结论
这个定理也称为统计抽样定理
我们在下面构造区间估计的枢轴量的时候
要用到这几个结论
所以在这里面再复习一下
正态总体的样本均值和样本方差相互独立
样本均值服从期望为mu
方差为n分之sigma方的正态分布
n-1倍的S方除以sigma方
服从自由度n-1的卡方分布
正态总体
期望和方差均未知
X1、X2、Xn是来自于该总体的样本
求方差sigma方的1减alpha置信区间
正态总体的样本方差满足
n-1倍的样本方差除以总体方差sigma方
服从n-1个自由度的卡方分布
n-1个自由度的卡方分布
不依赖任何未知参数
而且n-1倍的样本方差除以
总体方差sigma方本身就是样本
和被估参数sigma方的函数
所以这是一个现成的枢轴量
以此为枢轴量
得到枢轴量大于等于n-1自由度的
卡方分布的2分之alpha分位点
小于等于1减2分之alpha分位点的概率
等于1减alpha
从枢轴量不等式解出置信区间的上下限
得到
总体方差sigma方的
1减alpha置信区间
n-1倍的S方
除以n-1自由度的卡方分布的
1减2分之alpha分位点
到n-1倍的S方
除以n-1自由度的卡方分布的
2分之alpha分位点
正态总体
期望和方差均未知
X1、X2、Xn是来自该总体的样本
求期望mu的1减alpha置信区间
首先考虑样本均值
样本均值服从参数为mu
方差为n分之sigma方的正态分布
将样本均值变换为标准正态分布
得到根号n倍的X一拔减mu
除以sigma
总体方差已知时
这个量即可作为枢轴量
但是
现在总体方差未知
这个标准正态分布中除了被估参数
还有其他未知量
不能作为枢轴量
需要进一步想办法来构造枢轴量
正态总体方差未知时
估计期望的枢轴量可通过t分布构造
刚才已经得到了
根号n倍的X一拔减mu
除以sigma服从标准正态分布
另外
对正态总体
n-1倍的样本方差
除以sigma方服从n-1个自由度的卡方分布
同时考虑这两个结果
并且注意到
正态总体的样本均值和样本方差是相互独立的
而现在考虑的标准正态分布和
n-1个自由度的卡方分布
分别是通过样本均值和样本方差构造的
所以它们也是相互独立的
相互独立的标准正态分布
与卡方分布除以自由度后开平方
它们相除
即得到t分布随机变量
而在相除过程中
分母中的sigma方开方后
正好与分子中的sigma约掉了
未知的参数sigma被约掉了
剩下根号n乘X一拔减mu
除以样本标准差S
服从n-1个自由度的t分布
显然
这个t分布随机变量是样本和被估参数mu的函数
而且分布不依赖任何未知参数
所以可作为枢轴量
利用刚才构造的t分布枢轴量
确定方差未知时
期望mu的1减alpha置信区间
枢轴量根号n乘X一拔减mu
除以样本标准差S大于等于
n-1自由度的t分布2分之alpha分位点
小于等于n-1自由度的t分布
1减2分之alpha分位点的概率
等于1减alpha
求解不等式
得到参数mu的1减alpha置信区间为
X一拔减根号n分之S乘
n-1自由度的t分布1减2分之alpha分位数
到X一拔加根号n分之S乘
n-1自由度的t分布1减2分之alpha分位数
假设工厂生产的产品的质量服从正态分布
为了估计所生产的产品的平均质量
现在呢从所生产的产品中随机的抽取9件
用一台天平测量
测得结果分别为7.32克、7.37克,、7.24克等等
试求产品平均质量的0.95置信区间
下面进行估计
假设产品的质量服从期望为mu
方差为sigma方的正态分布
mu和sigma方的值都未知
我们把正态总体方差未知时
对期望进行区间估计的
枢轴量的构造再写一遍
这个t分布的构造过程
希望同学们熟练的掌握
这个过程反映了t分布的构造方法
还蕴含的一般意义
是很巧妙的
由正态总体的样本均值和样本方差
分别可以构造出标准正态分布和卡方分布
并且都含有sigma
这就启发人们利用这两个式子
将未知的sigma相互抵消掉
事实上
将卡方开平方再和标准正态分布相除
就可以做到
所以用正态分布除以卡方的开平方
而且分子分母是相互独立的
两个相互独立的已知分布相除
其分布也必然可以确定
即使确定的过程比较复杂
也是值得的
因为这样的构造将sigma未知
这个本质的困难克服掉了
只要肯花力气
t分布的分布函数总是可以得到的
而且费力气的工作只需要做一次
算出来后编成表格
以后就都可以方便的使用了
t分布的概念是戈赛特提出的
他是20世纪初几个最重要的统计学家之一
他为人很谦虚
一直使用student作为笔名
t分布的名称就是从这个笔名得来的
同时
这也是t分布有时被称为学生氏分布的原因
构造出了枢轴量
具体的区间估计式就很容易得到了
参数mu的1减alpha置信区间为
X一拔加减根号n分之S乘以
n-1自由度t分布的1减2分之alpha分位点
有了区间估计的具体公式
下面只要算出此次抽样的样本均值
和样本方差的取值即可
样本均值在这组观测值下的取值为7.338
样本方差在这一组观测值下的取值
为5.19乘10的-3次方
样本标准差得观测值小s等于0.072
代入公式得到参数mu的
置信系数为0.95的估计区间为7.282到7.393。
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题