当前课程知识点:概率论与数理统计 > 第四周:常见随机变量 > 二项分布与负二项分布 > 4.1 二项分布与负二项分布
这一周我们介绍几种常见的
随机变量
我们希望
能够从各种随机变量
产生的机理角度进行说明
从而使它们的性质展开
更加自然
同时也能更深入地
理解它们之所以常见的内在原因
本周学习的分布包括
二项分布、泊松分布
几何分布、负二项分布
指数分布和正态分布
如果一个随机试验
只有“成功”和“失败”
两种可能的结果
出现“成功”的概率为p
这里p大0且小于1
则称这个随机试验为
一个参数为p的伯努利试验
伯努利试验是构造许多
离散型随机变量的基石
通过伯努利试验
我们定义一个随机变量
当伯努利试验成功时
随机变量等于1
否则即试验失败时
随机变量等于0
则称此随机变量为
参数为p的伯努利随机变量
也称随机变量服从
参数为p的伯努利分布
伯努利分布即为0-1分布的别称
抛一颗均匀的色子
如果出现偶数点称为试验“成功”
出现奇数点为试验“失败”
定义随机变量X
当抛出的点数为偶数时X=1
当抛出的点数为奇数时X=0
因为均匀的色子
投出1至6点的概率均为6分之一
偶数点和奇数点各3个
所以得到偶数点
和奇数点的概率都是2分之一
随机变量X
是一个参数为2分之一的
伯努利随机变量
将参数为p的伯努利试验
独立地重复n次
记成功的次数为X
则X为一随机变量
n次试验可能都没有成功
此时X=0
也可能全部都成功
此时X=n
X的取值从0到n
一共n+1种可能
若n次伯努利试验恰好成功k次
则成功的k次
可能出现在n次试验的
不同位置共有Cnk种情况
每种情况都是k次成功
n-k次不成功
所以每种情况发生的概率
都是p的k次方乘以
(1-p)的n-k次方
对所有大于等于0
小于等于n的整数k
X=k的概率等于
Cnk乘以p的k次方乘以
(1-p)的n-k次方
这一分布律称为二项分布
记为X服从B(n,p)
B是二项分布的缩写
也称X服从参数为
(n,p)的二项分布
利用二项式定理可验证
二项分布全部取值
对应的概率和为1
这也是这一分布
被命名为二项分布的原因
比如连续投掷n次硬币
出现正面的次数
连续n次射击命中的次数等等
都常常用二项分布
随机变量来刻画
甲、乙两位棋手
约定进行10局比赛
每局棋甲获胜的概率是0.6
乙获胜的概率为0.4
如果各局比赛独立进行
试问甲获胜
战平和失败的概率分别是多少
设X表示甲获胜的局数
每1局棋的胜负
都是1次甲的成功概率为
0.6的伯努利试验
独立地重复10局
所以甲获胜的局数
这一随机变量服从参数为
10,0.6的二项分布
甲获胜意味着
甲赢得10局中的5局以上
即为X取值大于5
乙获胜则意味着
甲获胜局数X小于5
甲乙战平
则甲、乙恰好各获胜5局
即对应X=5的情况
分别利用二项分布律进行计算
得到三个所求概率
一个通讯系统由n个部件组成
每个部件独立工作
且能正常运行的概率均为p
如果构成系统的部件中
至少有一半以上能正常运行
则称系统是“有效”的
试问当p取何值时
由5个部件组成的系统
要比由3个部件
组成的系统更有效
设n个部件能正常运行的数目为
随机变量Xn
则Xn服从参数为n,p的二项分布
则由5个部件组成的系统
正常运行的部件数服从参数为5
p的二项分布
因此
由5个部件组成的系统
是“有效”的概率为
参数(5,p)的
二项分布随机变量
X5取值大于2的概率
即为X5分别等于
3,4,5的概率和
由3个部件组成的系统
是“有效”的概率为
参数(3,p)的二项分布随机变量
X3取值大于1的概率
即为X3分别等于
2,3的概率和
当X5分别等于3,4,5的概率和
大于X3分别等于2,3的概率和时
由5个部件组成的系统
要比由3个部件组成的系统更有效
整理后得
p应满足(p-1)平方乘以
(2p-1)大于0
即p大于二分之一时
5个部件组成的系统要更有效些
某人将一枚均匀的硬币
随机抛了10次
已知有6次抛出正面
问他是在前6次抛出正面的概率
因为硬币是均匀的
所以每次抛掷得的
正面的概率都是1/2
10次抛掷中
正面出现的次数
即为1个参数为10
1/2的二项分布随机变量
设为X
再记事件A为
"前6次抛出正面且后4次抛出反面”
则由题意
要计算10次中有6次抛出
正面这个条件下
这6六次正面恰好出现在
前6次抛掷的概率
即随机变量X=6条件下
事件A发生的概率
按照条件概率的定义展开
其中事件X等于6包含事件A
所以两事件的积事件为A
最后得到概率约为C10,6分之一
连续不断且独立地重复进行一个
参数为p的伯努利试验
记X为第r次“成功”出现时
所需的试验次数
则事件X等于k等价于
第k次试验“成功”且
前k-1次试验中恰好“成功”r-1次
根据独立性条件
事件X等于k的发生的概率
等于第k次试验“成功”的概率p
乘以前k-1次试验中
恰好“成功”r-1次的概率
而前k-1次试验中
恰好“成功”r-1次的概率
即为参数为k-1
p的二项分布随机变量
取值为r-1的概率
整理得
X等于k的概率
等于C(k-1)(r-1)
乘以p的r次方乘以q的k-r次方
其中q=1-p
k取大于等于r的全体整数
我们定义服从此分布律的
随机变量为参数
r、p的负二项分布
缩写为NB
甲、乙两人进行比赛
直到某一人先赢到5局为止
假设每局比赛相互独立
且每局甲胜的概率为0.58
乙胜的概率为0.42
求比赛在第7局结束的概率
以及比赛在第7局结束的条件下
获胜方为甲的概率
设随机变量X为
甲赢5局时所需的比赛局数
Y为乙赢5局时所需的比赛局数
显然X和Y分别服从
参数为5,0.58和
参数为5,0.42的负二项分布
设事件A为“甲最终获的比赛胜利”
事件B为”比赛在第7局结束“
第(1)问
计算比赛在第7局结束的概率
此时或者是甲获胜
甲获胜意味着甲在第7局时
获胜首次达到了5局
就是事件X等于7
或者是乙获胜
就是事件Y等于7
所以事件B
是两个互斥事件
X=7和Y=7的和事件
而X,Y服从负二项分布
带入分布律计算即可
第(2)问为条件概率
B条件下A的概率
其中A,B同时发生
即为甲在第7局获得胜利
并结束比赛
也就是甲赢得5局
恰好用了7局比赛
即为X等于7
P(B)等于两个互斥事件
X=7和Y=7的和事件的概率
上一问已算出等于0.24
计算得条件概率为24分之17
约为0.71
负二项的名称来自
广义的牛顿二项式公式
广义的牛顿二项式公式
给出1加t的a次幂的关于
变量t的展开式
其中次数a可以是任意实数
t的绝对值小于1
对整数k定义了广义的组合数Cak
将参数r,p的负二项随机变量
X的分布律进行整理
对于所有非负整数k
写出负二项分布随机变量X
等于r+k的概率
令q=1-p
经过整理
可以表示为广义组合数
C(-r)k乘以p的r次方
乘以(-q)的k次方
而广义组合数C(-r)k
乘以(-q)的k次方
k从0取到无穷
就是(1-q)的
(-r)次方的全部展开项
由此也验证了
负二项分布列的全部概率和等于1
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题