当前课程知识点:概率论与数理统计 > 第四周:常见随机变量 > 泊松分布 > 4.2 泊松分布
对给定的大于零的常数λ
如果随机变量X取值为
全体非负整数
X=k的概率为e的负λ次方
乘以k阶乘分之λ的k次方
则称此随机变量服从
参数为λ的泊松分布
泊松分布常用字母P表示
首先验证一下泊松分布的定义
给出了一个恰当的分布
显然所有pk都大于0
下面验证对所有的pk求和等于1
这里用到了e的x次幂的
泰勒展开式
即e的x次幂
等于k阶乘分之x的k次方
k从0到无穷求和
如图给出的是参数1,4,10对应的
泊松分布的分布列和分布函数
可以看出泊松分布的分布列
有一个最大值
随着λ的不同
峰值的高度和位置均有不同
达到峰值后
随着k的增大概率值Pk迅速减小
虽然泊松分布的取值范围
是全体非负整数
但对较大的k
X=k的概率非常小
几乎为0
泊松分布与二项分布
有密切的关联
参数为n,p的二项分布
如果p很小n很大
则B(n,p)与以np为参数的
泊松分布非常相似
可相互近似
这里 相似、可相互近似的意思是
如果随机变量X
服从参数n,p的二项分布
而随机变量Y
服从参数为np的泊松分布
则对于任意k
X=k的概率都与
Y=k的概率非常接近
我们对这一性质做一简单说明
考虑n很大
p很小的二项分布
令np等于λ
计算二项分布等于k的概率Bk
和等于k-1的概率Bk-1的比值
因为p很小,k为常数
所以分子中的(k-1)p近似为0
分母中的1-p近似为1
所以得到比值近似为k分之λ
利用基本的极限结果
推出二项分布等于0的概率
近似等于e的负λ次方
注意这里需要在n很大
n分之λ很小的情况下
才近似符合极限条件
近似才有意义
进而利用Bk比B(k-1)
近似为常数k分之λ
得到B1,B2到Bk等的近似式
而这些近似式恰好就是
参数为λ泊松分布对应取值的概率
假设一个射箭外行
射箭射中靶心的概率是0.0001
虽然命中率非常之低
但只要重复的次数足够多
相信总还是有几次会射中的
比如重复三万次
此时射中次数服从
参数为3万和万分之1的二项分布
3万乘以万分之一等于3
则这个二项分布近似等于
参数是3的泊松分布
考虑此时射中3次概率
用泊松分布近似计算得
射中3次的概率大约是0.224
这个概率如果直接用
二项分布律计算
则相当的麻烦
而用泊松分布近似计算
就简洁得多了
实际上
泊松分布刻画了小概率事件
或是说稀有事件
多次重复时
其发生概率的规律
下面我们给出泊松分布
与二项分布严格意义下的相互关系
设随机变量Xn
服从参数为n,pn的二项分布
其中pn依赖于n
当n趋于无穷时
n乘pn收敛
极限是一个与n无关的常数
记为λ
则对任意固定的非负整数k
当n趋于无穷时
Xn等于k的概率的极限存在
该极限就等于参数为λ的泊松分布
取值为k的概率
这个结论首先由法国数学家泊松发现
并以他的名字命名为泊松定理
看定理的证明
首先写出Xn等于k的概率
并进行展开
尽可能将n乘pn
作为一个整体提取出来
然后令这个乘积npn等于λ
因为k为常数
而n分之λn是趋于0的量
所以1-n分之λn的-k次方趋于1
1-n分之λn的n-k次方的极限
即等于1-n分之λn的n次方的极限
同样是因为k为常数
所以n趋于无穷时1-1/n
直至1-(k-1)/n是有限项趋于1的量
它们乘积的极限为1
带入到Xn=k的概率展开式中
即得到结论
卢瑟福和盖革
都是获得过诺贝尔奖的著名学者
他们在1910年共同
观察了放射性物质放出
alpha粒子的数目的情况
他们共进行了2608次观察
每1次观察就是记录在7.5秒间隔内
到达某指定区域的alpha粒子的个数
在2608次观察中
共记录下10094个粒子
数据中的Nk表示这2608次观察中
恰好记录下k个粒子的观察次数
例如N2等于383
就表示有383次观察
记录的粒子数是2个
现在建立一个泊松分布模型
来解释观测数据
假设一个粒子出现在2608次
观察中的每1次是等可能的
即落入1次观察的概率是1/2608
共有10094个粒子到达
则对1次观察而言
相当于概率1/2608的小概率事件
重复了10094
所以1次观察中
记录到的粒子数服从
参数为10094
和2608分之1的二项分布
10094乘以2608分之一约等于3.87
则X近似服从
参数为3.87的泊松分布
2608乘以泊松分布随机变量
等于k时的概率pk
即得到2608次观察中
有多少次恰好记录下
k个粒子的理论估计值
对比表中的理论估计值
和实际发生数Nk
两者有较好的吻合
二战时伦敦遭到很多次炸弹袭击
有人将轰炸区域的整个面积分为
567小块
其中发现k枚炸弹的小块数为Nk
从数据表中可以看到
共有7个小块区域发现有4枚炸弹
而有一个小块区域遭到了
超过5次的炸弹袭击
总共发现炸弹537枚
则如果炸弹是等可能的落入
每一个小块区域
则每1小块区域落入的炸弹个数
就服从重复537和
1/567的二项分布
此二项分布近似服从参数为
为0.9323的泊松分布
利用泊松分布近似X取值
分别为0,1,2等的概率
p0,p1,p2等
pk就表示一个小块区域
落入k枚炸弹的概率
用567乘以pk即得到
Nk的理论估计值
对比表中数据 说明
观测值较好地服从于泊松分布
图中给出我们做的一项
模拟试验的结果
将400个点随机地投入到一个
10乘10等分的
包含100个小正方形的
正方形区域中
右侧图中横坐标表示点数
彩色点表示落入相应点数的
小正方形的比例
黑色点则表示参数为4的
泊松分布的相应概率值
有数据记载
自1875年至1955年
中间的某63年里
上海市5月—9月间的夏季里
共发生了180次暴雨
考虑每年5月-9月之间
共有153天
每次暴雨如果以一天计算
则每天发生暴雨的概率p
大约为等于180
除以63年间5月到9月的总天数
这是个非常小的数
而每年雨季的天数
153又是个较大的数
假设暴雨在雨季的每一天是
等可能发生的
则一年中的雨季153天中
下暴雨的次数
就大约服从参数是153
和p的二项分布
又近似服从参数是
153乘以p
约等于2.9的泊松分布
计算此泊松分布的分布概率
p0,p1等等
pk就表示一年中
下暴雨k次的概率
再将pk乘以63年
即可得到63年中
有几年下暴雨次数
恰好为k次的理论估计值
表中列出了实际下暴雨k次的
年份数和理论估计数
总体看来
符合情况较好
1898年一位英国学者
给出了一个应用泊松分布的
经典的例子
这个例子今天说起来多少有些荒诞
他列出一组数据表明
一年中被马踢死的骑兵人数
近似服从泊松分布
这也是一个典型的小概率事件
被大量重复的例子
一个士兵在一年中
被马踢死这是一个小概率事件
但是士兵的人数又很多
所以 一年中被马踢死的骑兵数
是服从一个n很大p很小的二项分布
因此泊松分布对这些数据
给出一个很好的描述
泊松分布刻画了稀有事件
多次重复时的发生规律
书籍的印刷错误
在给定时间内某耐用设备
大批量使用时的故障次数等等
都近似服从泊松分布
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题