当前课程知识点:概率论与数理统计 > 第五章 大数定律和中心极限定理 > 第2节 中心极限定理 > 5.2.2 De Moivre-Laplace 中心极限定理
大家好
今天我们继续学习中心极限定理
在介绍一个常用的中心极限定理
De Moivre-Laplace中心极限定理
首先我们来看这样一个简单的实验
高尔顿钉板实验
高尔顿钉板是由英国生物统计学家高尔顿
设计的,用来研究随机现象的一个简单
装置
在一块木板上,钉上一排排互相平行
且水平间隔相等的铁钉
每一排的钉子数比上一排多一个,下一排中
每个钉子恰好对着上面一排中
两个相邻的钉子的正中央
在最后一排钉子的下面放好一排隔板
最后盖上一块玻璃
这就是高尔顿钉板
从这个装置的顶端放入直径略
小于两颗钉子间隔的小球
当小球下落时
它碰到钉子后,会随机地向左或向右滚动
当它碰到下一枚钉子之后又会面临同样的
向右或向左的等可能的选择
一直到它最后到达底部
落入对应的一排格子中
利用大量的小球来做实验
结果很明显
最左边和最右边的格子都最难落入
因为它们都要求小球从一开始
就向同一个方向滚动
所以只有一种完成方式
小球最容易落入中间的格子中
因为有很多不同的路径可以滚动到此处
随着放入的小球的增加
我们发现小球在容器中堆积的
结果和正态分布的密度曲线
钟形曲线类似
如果我们用柱状图表示落入各格子
中的小球的数目,会发现它与正态分布的
曲线很好的吻合
下面
我们从随机变量的角度来
分析一下这个实验
设Xk=0表示某个小球第
k次碰到钉子后向左落下
Xk=1表示小球第k次
碰到钉子后向右落下
则Xk服从两点分布,其分布列为
Xk
等于0和1的概率均为1/2
k从1一直到无穷
假设这些随机变量Xk相互独立
令
Yn=∑k从1到nXk
则Yn表示
这个小球第n次碰到钉子后的位置
显然Yn是由n个相互独立的
且服从相同的两点分布的随机变量的和
从而它服从二项分布
高尔顿钉板实验
说明这个二项分布与正态分布近似
那么这个结果是否说明二项分布
都可以用正态分布来近似呢
法国数学家De Moivre在研究抛币试验时
也发现了类似的结果
它在1733年发表的论文中就用
正态分布去估计大量抛硬币时出现
正面的次数
但是,这个超越时代的成果
并没有得到人们广泛的认识
而且还险些被历史遗忘
所幸
法国科学家Laplace在1812年
发表的巨著“概率的解析理论”中拯救了
这个默默无闻的理论,并推广了它
指出二项分布可用正态分布逼近
从而,这个中心极限定理就被命名为
De Moivre-Laplace中心极限定理
它是历史上最早被提出来的中心极限定理
下面我们具体的来看一下这个定理
设随机变量Xn
服从参数是(n,p)的二项分布
n=1,2,3,一直到无穷,p大于0小于1
则对任意的实数x有
Xn减去np比上根号下
np乘上(1减p)小于等于x的
概率,当n趋向于无穷时的极限是
这个积分
负无穷到x对根号下2π分之1乘上
e的负的2分之t方的积分
这个就是De Moivre-Laplace中心极限定理
定律说明
对于随机变量Xn减去np比上根号下
np乘上(1减p)
实际上就是Xn的标准化随机变量
它的分布函数
我们将其记为大Fn(x)
对于任意的实数x都有,当n趋于无穷时
Fn(x)的极限就是标准正态分布的
分布函数Φ(x)
下面我们给出这个定理的简单的证明
因为Xn服从的是参数是n,p的二项分布
所以Xn可以看作是n重伯努利试验中
成功出现的次数
并且每次试验成功出现的概率为p
令Yk表示
第k次试验成功出现的次数
当第k次试验成功的时候
Yk取值为1,第k次试验失败的时候
Yk取值为0,k是从1一直到无穷的
这样我们就会得到一列服从参数
为p的0-1分布的
这样的随机变量
而Xn恰好是n个
这样的随机变量的和
它等于Y₁加Y₂一直加到Yn
对于每个随机变量Yk来讲
它的期望等于p,方差等于p乘上(1减p)
Xn作为独立同分布的随机变量的和
由独立同分布的中心极限定理
我们就可以得到上面的这个结论
Xn减去np
这是Xn的期望比上它的标准差根号下
np乘上(1减p)
小于等于x的概率,当n趋向于无穷时的
极限,是标准正态分布的分布函数
由此可见
De Moivre-Laplace中心极限定理是独立同
分布的中心极限定理的一个特例
这个定理说明二项分布以正态分布为极限
若X服从参数为n,p的二项分布
则当n很大的时候
一般n大于等于50的时候,随机变量X
减去np比上根号下np乘上
(1减p),就近似的服从标准正态分布
或者说当n很大的时候
X会近似的服从参数为np和
np乘上(1减p)的正态分布
可见
De Moivre-Laplace中心极限定理揭示了
离散型随机变量与连续型随机变量之间的
内在的联系
因此
如果X服从参数为n,p的二项分布
则当n很大的时候
我们就可以利用正态分布去近似计算
这样的概率,X大于a小于等于b的概率
就约等于Φ(b减去np
比上根号下
np乘上(1减p))减去
Φ(a减np比上根号下
np乘上(1减p))
其中Φ(x)为标准正态分布的分布函数
De Moivre-Laplace中心极限定理告诉
我们可以用正态分布近似计算二项分布的
相关概率
一般来说
当n比较大
而p不是接近于0
或者是1的时候,利用中心极限
定理近似效果会比较好
在计算的时候注意到二项分布的
取值与正态分布的随机变量的取值
范围是不同的
X如果要是服从参数是n,p的
二项分布的时候
X的可能的取值为0,1,2,一直到n
而正态分布的取值范围是从负无穷
到正无穷的
所以对于常数m
利用中心极限定理去近似计算X
小于等于m的概率的时候
实际上我们应该计算的是X大于
等于零小于等于m的概率
也就是说
X小于等于m的概率等于X大于
等于0小于等于m的概率
它约等于Φ(m减np比上根号下
np乘上(1减p))减去Φ(0减去np
比上根号下np乘上(1减p))
当然
如果X小于等于m的概率与X大于等于0小于
等于m的概率相差不大的话
或者为了方便计算
我们可以直接计算X小于等于m的
概率
它约等于Φ(m减去np比上
根号下np乘上(1减p))
前面我们还学习过二项分布的
一种近似计算方法
就是用泊松分布去近似计算
在n较大p较小的情况下
利用泊松分布去近似计算二项分布
其效果会比较好
此时
对于任意的一个实数x
X小于等于x概率约等于
∑k从0到x
K的阶乘分之λ的
k次方乘上e的负
λ次方
其中λ是等于np的
下面
我们通过一个具体的例题来看一下
如何应用De Moivre-Laplace中心极限
定理计算有关二项分布的概率问题
设一所学校有在校生一万名
假设每个人都以80%的
概率去图书馆自习
问,图书馆至少应该设多少个座位才能
以99%的概率保证去上自习的
同学都有座位
下面我们利用De Moivre-Laplace中心极限
定理来解决这个座位问题
假设X表示
同时去图书馆上自习的人数并
设图书馆至少设n个座位
若想以99%的概率保证去
上自习的同学都有座位
则n需要满足X小于等于n的
概率大于等于0.99
为此
我们需要计算X小于等于n的概率
注意到对于每个同学来讲
它可能去图书馆上自习
也可能不去
这个可以看作是一个伯努利试验
如果用成功表示去图书馆上自习
这个事件
那么这个事件的概率是0.8
假设每个同学去图书馆上
自习都是相互独立的
因此,一万名学生上自习的情况可以看做
是一个一万重的伯努利试验
X就是一万重伯努利试验中
成功出现的次数
从而它服从参数是一万和
0.8的二项分布
下面我们需要计算X小于等于n的概率
根据
De Moivre-Laplace中心极限定理
这个概率就约等于Φ(n减去
10000乘上0.8比上根号下10000乘
0.8乘0.2)
此处不需要考虑X大于等于0
小于等于n的概率
因为X大于等于0
这个条件对于本题来讲是没有影响的
那么经过计算
我们得到X小于等于n的概率
它等于Φ(n减去8000比上40)
需要让它大于等于0.99
通过查标准正态分布的分布表
我们就会得到
需要n减去8000比上40大于等于
2.33才能满足这个不等式
从这里边我们解出来n应该大于
等于8093.2
因此
图书馆至少应设8094个座位
好,我们下面简单的总结一下本讲的
内容De Moivre-Laplace中心极限定理
给出了用正态分布去近似计算二项分布的
概率的方法
一般来说
当二项分布的参数p不是太接近于0
或者是1,而n又比较大的时候
这时候np会比较大
用中心极限定理去近似计算二项分布的
概率会比较好
而当p很小,n比较大的时候用泊松分布去
近似计算二项分布效果会比较好
好,今天我们就讲到这里,谢谢大家
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试