当前课程知识点:概率论与数理统计 > 第六周:常见随机变量的期望方差和应用实例 > 随机变量数学期望的应用实例 > 6.4 随机变量数学期望的应用实例
二战期间
美国大量的征募
年轻人入伍
应征报名入伍的人
都需要通过体检
患有某种罕见传染性疾病的人
不准入伍
有一种验血方法
可以经过一次化验有效地查出
血样中是否含有
这种传染病的病毒
即使病毒含量非常低的时候
此方法也能够很灵敏地
显示阳性结果
最简单的办法
是将每个人的血样检查一遍
如果有10万人应征报名入伍
就要做10万次化验
需要巨大的工作量
1943年
一个叫Robert Dorfman 的年轻学者
提出了一种分组验血的策略
可以显著地提高检验效率
他的方法是将每个人的血样
提取一部分
以k个人一组混合
如果混合血样显示阴性
则这k个人只需这一次化验
即可确认无病
如果试验结果为阳性
再分别检查该组成员的每份血样
确定患病者
我们先通过具体的假设场景
分析一下该方案的有效性
假设有100个人参加检查
其中有3人患有疾病
如果用最简单的办法
将每人的血样化验一遍
需要100次检验
如将100人分为10组
每组10人
现将每个人的血样提取一部分
将每组十个人的部分血样
合成一份混合血样
则10组混合血样中
最多有3组包含患病血样
也就是说至多需要
10组混合血样的化验
加上3组共30份血样的逐一化验
共计40次即可确定出所有患病者
而如果3个患病血样
恰好被分到了同一组
则只需要20次化验
即可确定出所有患病者
所以对这个这特定的例子
分组策略
最多可能节省80%的工作量
最少也能节省60%的工作
这一策略
确实可能减少工作量
下面我们建立概率模型
对分组验血的效率进行分析
假设N个人验血普查某种疾病
每人血样单独检验共需N次
现采用k人一组的方式
若结果阳性
则将此k人逐一检验
假设发病率为p
则此方法是否可以
节省检验次数
设每个人血样
被化验次数为随机变量X
则当该血样所在的k个人
的混合血样为阴性时
它仅在k个人的混合血样中
被化验1次
相当于一份血样被化验了k分之1次
这种情况对应的概率为
k个人的血样均为阴性的概率
等于(1-p)的k次方
当该血样所在k个人的
混合血样为阳性时
它又被单独化验了1次
相当于一份血样
被化验了1加k分之1次
此时对应的概率为
1减去(1-p)的k次方
所以随机变量X
服从取值为k分之1和1加k分之1
概率分别为(1-p)的k次方
和1减去(1-p)的k次方的离散分布
X的期望等于
1减去[(1-p)的k次幂减去k分之1]
当(1-p)的k次幂大于k分之1时
E(X)小于1
也就是一个人的血样平均意义下
被化验的次数小于1次
即在平均意义下
分组策略可以节省化验次数
而(1-p)的k次幂比k分之1大得越多
平均工作量节省的比例就越大
对于一定的p
可以计算出最优的k
使得(1-p)的k次幂
减去k分之1达到最大
从而得到平均意义下的
最优分组策略
图中列出了p取百分之1和千分之1时
不同分组规模对应的E(X)值
即平均化验次数
横坐标代表分组规模k
纵坐标代表平均化验次数E(X)
红色曲线代表p等于百分之1的结果
蓝色曲线代表p等于千分之1的结果
当p等于百分之1时
最优分组策略为每11人一组
此时大约只需要
每人化验一次方法的20%工作量
当p等于千分之1时
最优分组策略为每32人一组
此时大约只需要
每人化验一次方法的6.3%工作量
而且当p等于千分之1时
最优分组规模不是很敏感
k取20到60的效果都差不多
再看一个优惠券收集的问题
假设为促销饼干
商家在每盒饼干内放1张优惠券
共准备了n种不同的优惠券
当收集到全套的优惠券时
可以得到奖品
假定每盒饼干中的优惠券
是从n种不同的优惠券中
随机选取的
问要想获得奖品
平均需要购买多少盒饼干
令X表示收集到n种优惠券中
的每一种至少一张
所需要购买的饼干的盒数
现在要求的是E(X)
记Xk表示已经收集到了
k-1张不同优惠券后
为了一张新的优惠券
所购买的饼干盒数
则有X=X1+X2+…+Xn
恰好收集到k-1张不同的优惠券后
只有n减去(k-1)
也就是n-k+1种优惠券
对他来说是新的
所以此时够买新的一盒饼干中
装有一种新优惠券的概率
是pk等于n分之(n-k+1)
Xk服从参数为pk的几何分布
Xk的期望等于pk分之1
等于(n-k+1)分之n
所以X的期望
等于X1+X2+…+Xn的期望
等于X1的期望加X2的期望
一直加到Xn的期望
等于n分之n加(n-1)分之n
加(n-2)分之n
一直加到1分之n
提出n
得到n乘以1加2分之1加3分之1
一直加到n分之1
因为当n较大时
1加2分之1加3分之1
一直加到n分之1接近lnn
所以要想获得奖品
平均大约需要购买
n乘以lnn盒饼干
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题