9140793

当前课程知识点:概率论与数理统计 >  第十五周 参数的区间估计 >  大样本置信区间 >  15.4 大样本置信区间

返回《概率论与数理统计》慕课在线视频课程列表

15.4 大样本置信区间在线视频

15.4 大样本置信区间

下一节:讲义

返回《概率论与数理统计》慕课在线视频列表

15.4 大样本置信区间课程教案、知识点、字幕

对于参数估计的问题

大样本容量时的处理情况

往往比小样本时要方便的多

因为样本容量足够大时

根据中心极限定理

可以利用渐近正态分布来构造枢轴量

而且样本容量越大

近似的精度越好

由此得到精度有一定保证的

近似的置信区间

这也和我们的常识经验是一致的

更多的数据

可能得到更好的估计效果

传统上

样本容量大于30时

往往就看做大样本

现在数据的收集能力和计算的处理能力

都大大提高了

对大样本的概念也有所变化

样本容量达到100、1000

也没有觉得有多大

总之 样本容量越大

大样本的近似处理就越精确

首先看看大样本情况下的

贝伦斯-费舍尔问题

X1、X2、Xn和Y1、Y2、Yn

是分别来自两个总体X、Y的样本

且假设两个样本相互独立

两正态总体的期望mu1、mu2

和方差sigma1方、sigma2方

均未知

求mu2减mu1的

1减alpha置信区间

总体X和总体Y的样本均值分别服从

期望为mu1、mu2

方差为m分之sigma1方

和n分之sigma2方的正态分布

X一拔和Y一拔相互独立

所以X一拔减Y一拔服从

期望为mu2减mu1

方差为m分之sigma1方

加n分之sigma2方的正态分布

将X一拔减Y一拔变换为标准正态分布

因为sigma1方和sigma2方未知

所以这个标准正态分布的构造

不能直接用来做枢轴量

大样本容量时

也就是当m和n都较大时

样本方差Sx方和Sy方会越来越接近于

两个总体方差

sigma1方和sigma2方

可得到如下的近似

用样本方差Sx方和Sy方替换

上面标准正态分布构造式中的

两个总体方差

sigma1方和sigma2方

就得到近似服从标准正态分布的分布

作为近似的枢轴量

得到mu2减mu1的

1减alpha置信水平的近似估计区间

样本X1、X2、Xn

来自参数为1和p的二项分布

也就是取值为0、1的两点分布

总体取值为1的概率等于p

求参数p的区间估计

样本均值的期望、方差分别等于

p和n分之p乘1-p

当样本容量n较大时

由中心极限定理

样本均值近似服从以X一拔的期望为期望

以X一拔的方差为方差的正态分布

所以X一拔减p除以根号n分之p乘1-p

近似服从标准正态分布

可作为枢轴量

X一拔减p

除以根号n分之p乘1-p的绝对值

小于等于标准正态分布

1减2分之alpha分位数的概率

等于1减alpha

即得到二次不等式

X一拔减p的平方

小于等于标准正态分布

1减2分之alpha分位数的平方

乘以n分之p乘1减p

解得p的范围

表达式非常的复杂

其中c等于n分之

u 1减2分之alpha平方

当n较大时

表达式中的c取值很小可略去

得到参数p的1减alpha置信水平的

近似估计区间

看这样一个具体应用的例子

一个网络产品的运营商

希望了解该产品在某个城市的用户占有率

进行了随机抽样调查

样本容量为500

调查结果有84人是该产品的用户

求这个网络产品在该城市占有率的一个

95%置信水平的置信区间

先设定总体

对城市中的任何一个人

或者是这个产品的用户

或者不是

所以 这个例子

和判断一个盒子里的黑球比例

是完全一样的

总体是0、1分布

也就是参数为1和p的二项分布

我们的任务是估计分布参数p

抽样的样本容量是500

所以样本均值X一拔等于X1

到X500的算术平均

样本均值的期望等于p

方差等于500分之p乘1-p

根据中心极限定理

500个独立同分布的

0、1分布随机变量的求和

可以很好的用正态分布近似

得到

根号500分之p乘1-p分之X一拔减p

近似服从标准正态分布

因为标准正态分布随机变量

在正负0.975分位数之间的概率

为0.95

所以置信水平为0.95的

近似估计区间为

X一拔加减u0.975

乘以根号500分之X一拔乘1减X一拔

计算样本均值

在这一组观测下的取值为0.168

查表得到u0.975等于1.96

代入公式得到

这个网络产品在该城市占有率的一个

95%水平的置信区间为0.135到0.201

进一步考虑刚才的例子

其他条件不变

根据抽样调查的信息

运营商希望得到

参数p的95%置信水平的区间估计

而且估计区间的长度不超过0.02

问至少需要多大的样本容量

先写出参数p的1减alpha置信区间

估计区间的长度不超过0.02

就是满足u 1减2分之alpha

乘根号n分之小x一拔

乘1减小x一拔小于0.01

其中小x一拔是样本均值的观测值

解出n应大于等于0.01分之

u 1减2分之alpha的平方

乘x一拔再乘1减x一拔

代入分位数和x一拔的取值

得到样本容量应该不少于5370

对这个占有率调查的例子

再变化一点条件

如果运营商还没有进行抽样调查

在没有任何先验知识的情况下

仍然希望得到参数p的

95%置信水平的置信区间

且估计区间长度不超过0.02的区间估计

问至少需要多大的样本容量

还是先写出参数p的

1-alpha置信区间

现在对p和X一拔没有任何先验知识

无法对X一拔的取值有具体的判断

那么注意到

X一拔的取值在0到1之间

X一拔的任何观测值

小x一拔乘1减x一拔

均小于等于4分之1

考虑刚才例题算出的样本容量

n的下界表达式

无论x一拔为何值

只要n大于等于0.01分之

u 1减2分之alpha的平方

乘4分之1

则n就一定会大于等于0.01分之

u、1减2分之alpha的平方

乘x一拔再乘1减x一拔

代入分位数 得到

此时样本容量至少需要达到9604

才能保证达到所希望的估计精度

问题没有变

可是现在这个情况下我们所估计的

所需样本容量数比上一题多了不少

因为本题中先验信息少于上一题

所以得到估计不如上一题精确

也是很自然的

一般而言

得到的信息越多

越有可能得到更好的估计

概率论与数理统计课程列表:

第一周:随机事件及其概率运算

-随机试验与随机事件

--1.1 随机试验与随机事件

-古典概型

--1.2 古典概型

--第一周:古典概型

-事件间的关系与事件的运算

--1.3 事件间的关系与事件的运算

--第一周:事件间的关系与事件的运算

-两个著名的例子

--1.4 两个著名的例子

--第一周:两个著名的例子

-讲义

第二周:条件概率和独立性

-条件概率

--2.1 条件概率

--第二周:条件概率

-有关条件概率的三个重要计算公式

--2.2 条件概率的三个重要计算公式

--第二周:有关条件概率的三个重要计算公式

-事件的独立性

--2.3 事件的独立性

--第二周:事件的独立性

-应用实例

--2.4 应用实例

--第二周:应用实例

-网球比赛胜率的计算

--Video

-讲义

第三周:随机变量

-随机变量及分布函数

--3.1.随机变量及分布函数

--第三周:随机变量及分布函数

-离散型与连续型随机变量

--3.2 离散型随机变量

--第三周:离散型与连续型随机变量

-分布函数的性质与特殊的例子

--3.3 分布函数的性质与特殊的例子

--第三周:分布函数的性质与特殊的例子

-概率论所需微积分要点回顾

--3.4 概率论所需微积分要点回顾

--第三周:概率论所需微积分要点回顾

-讲义

第四周:常见随机变量

-二项分布与负二项分布

--4.1 二项分布与负二项分布

--第四周:二项分布与负二项分布

-泊松分布

--4.2 泊松分布

--第四周:泊松分布

-几何分布与指数分布

--4.3 几何分布与指数分布

--第四周:几何分布与指数分布

-正态分布

--4.4 正态分布

--第四周:正态分布

-讲义

第五周:随机变量函数的分布及随机变量的数字特征

-随机变量函数的分布

--5.1 随机变量函数的分布

--第五周:随机变量函数的分布

-随机变量的数学期望

--5.2 随机变量的数学期望

--第五周:随机变量的数学期望

-随机变量的方差

--5.3 随机变量的方差

--第五周:随机变量的方差

-原点矩与中心矩

--5.4 原点矩与中心矩

--第五周:原点矩与中心矩

-期望和方差的一些补充性质

--5.5 期望和方差的一些补充性质

--第五周:期望和方差的一些补充性质

-讲义

第六周:常见随机变量的期望方差和应用实例

-二项分布与泊松分布的期望与方差

--6.1二项分布与泊松分布的期望与方差

--第六周:二项分布与泊松分布的期望与方差

-几何分布的期望与方差

--6.2 几何分布的期望与方差

--第六周:几何分布的期望与方差

-均匀、指数和正态分布的期望与方差

--6.3 均匀、指数和正态分布的期望与方差

--第六周:均匀、指数和正态分布的期望与方差

-随机变量数学期望的应用实例

--6.4 随机变量数学期望的应用实例

--第六周:随机变量数学期望的应用实例

-快速排序算法的平均计算量分析

--Video

-讲义

第七周:多维随机变量,独立性

-多维随机变量

--7.1. 多维随机变量

-第七周:多维随机变量

-常见多维随机变量举例

--7.2. 常见多维随机变量举例

--第七周:常见多维随机变量举例

-随机变量的独立性

--7.3 随机变量的独立性

--第七周:随机变量的独立性

-独立随机变量期望和方差的性质

--7.4 独立随机变量期望和方差的性质

--第七周:独立随机变量期望和方差的性质

-讲义

第八周:条件分布与条件期望

-条件分布

--8.1条件分布

--第八周:条件分布

-条件期望

--8.2 条件期望

--第八周:条件期望

-全期望公式(上)

--8.3 全期望公式(上)

--第八周:全期望公式(上)

-全期望公式(下)

--8.4 全期望公式(下)

--第八周:全期望公式(下)

-讲义

第九周 协方差与相关系数

-随机变量函数的期望

--9.1. 随机变量函数的期望

--第九周:随机变量函数的期望

-协方差

--9.2 协方差

--第九周:协方差

-相关系数

-- 9.3 相关系数

--第九周:相关系数

-相关与独立

--9.4 相关与独立

--第九周:相关与独立

-讲义

第十周 独立随机变量和的分布与顺序统计量

-独立随机变量和的分布

--10.1. 独立随机变量和的分布

--第十周:独立随机变量和的分布

-独立正态分布和的分布

--10.2 独立正态分布和的分布

--第十周:独立正态分布和的分布

-最大值、最小值分布

--10.3 最大值、最小值分布

--第十周:最大值、最小值分布

-顺序统计量

--10.4 顺序统计量

--第十周:顺序统计量

-讲义

第十一周 正态分布专题

-正态分布的相关与独立

--11.1 正态分布的相关与独立

--第十一周:正态分布的相关与独立

-边缘密度均为正态,联合分布不是二元正态的例子

--11.2 边缘密度均为正态,联合分布不是二元正态的例子

--第十一周:边缘密度均为正态,联合分布不是二元正态的例子

-二项分布的正态近似

--11.3 二项分布的正态近似

--第十一周:二项分布的正态近似

-正态近似计算实例

--11.4 正态近似计算实例

--第十一周:正态近似计算实例

-讲义

第十二周 大数定律和中心极限定理

-大数定律

--12.1大数定律

--第十二周:大数定律

-中心极限定理

--12.2 中心极限定理

--第十二周:中心极限定理

-蒙特卡洛(Monte Carlo)算法

--12.3 蒙特卡洛(Monte Carlo)算法

-伪随机数和随机模拟

--12.4 伪随机数和随机模拟

-讲义

第十三周 统计学基本概念

-统计学实例

--13.1 统计学实例

-总体与样本

--13.2.总体与样本

-常用统计量

--13.3 常用统计量

--第十三周:常用统计量

-三种重要的统计分布和分位数

--13.4 三种重要的统计分布和分位数

--第十三周:三种重要的统计分布和分位数

-讲义

第十四周 参数点估计

-参数的矩估计

--14.1参数的矩估计法

--第十四周:参数的矩估计

-参数的极大似然估计

--14.2参数的极大似然估计法

--第十四周:参数的极大似然估计

-参数点估计的无偏性和有效性

--14.3 参数点估计的无偏性和有效性

--第十四周:参数点估计的无偏性和有效性

-参数点估计应用实例

--14.4 参数点估计应用实例

--第十四周:参数点估计应用实例

-讲义

第十五周 参数的区间估计

-区间估计的基本思想

--15.1 区间估计的基本思想

--第十五周:区间估计的基本思想

-区间估计的构造方法

--15.2 区间估计的构造方法

--第十五周:区间估计的构造方法

-两个正态总体的区间估计

--15.3 两个正态总体的区间估计

--第十五周:两个正态总体的区间估计

-大样本置信区间

--15.4 大样本置信区间

--第十五周:大样本置信区间

-讲义

第十六周 假设检验

-假设检验问题的提示和标准步骤

--16.1假设检验问题的提示和标准步骤

--第十六周:假设检验问题的提示和标准步骤

-假设检验问题的两类错误和P值

--16.2假设检验问题的两类错误和P值

--第十六周:假设检验问题的两类错误和P值

-单个正态总体参数的假设检验

--16.3 单个正态总体参数的假设检验

--第十六周:单个正态总体参数的假设检验

-拟合优度检验

--16.4拟合优度检验

--第十六周:拟合优度检验

-讲义

应用实例

-利用条件概率计算网球比赛胜率

--利用条件概率计算网球比赛胜率

-利用期望的计算性质分析快速排序算法的平均计算量

--利用期望的计算性质分析快速排序算法的平均计算量

-讲义

习题课一

-事件

--事件

-分布函数

--分布函数

-正态

--正态

-指数与二项

--指数与二项

习题课二

-随机变量函数的分布

--随机变量函数的分布

-指数分布期望

--指数分布期望

-切比雪夫不等式

--切比雪夫

-二元离散

--二元离散

-协方差

--协方差

-二元特征

--二元特征

习题课三

-统计量

--统计量

-无偏估计

--无偏估计

-点估计

--点估计

-假设检验

--假设检验

习题课四

-选择

--选择

-填空

--填空

-大题

--大题

15.4 大样本置信区间笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。