当前课程知识点:概率论与数理统计 > 第七周:多维随机变量,独立性 > 常见多维随机变量举例 > 7.2. 常见多维随机变量举例
这一节我们学习几种常见的多维随机变量
首先介绍m维多项分布
m维多项分布随机变量
X1 X2 … Xm
包含参数n p1 p2 直到 pm
用大写字母M表示
设随机试验E有m个基本事件
A1 A2 到 Am
每个Ai发生的概率都大于0
记为p_i 全体p_i求和等于1
将随机试验E重复n次
以Xi表示n次试验中Ai出现的次数
则X1=k1 X2=k2
直到Xm=km的概率
等于n阶乘除以
(k1 k2到km的阶乘的连乘)
再乘以p1的k1次方乘p2的k2次方
一直乘到pm的km次方
其中k1加k2一直加到km等于n
其中A1出现k1次
A2出现k2次
依次Am出现km次
所以可能的基本结果的个数为
n次中取k1个A1的个数
乘以剩下的n-k1中取k2个A2的个数
乘以剩下的n-k1-k2中
取k3个A3的个数
一直乘到剩下的km中
取出km个Am的个数
等于n阶乘除以
(k1 k2到km的阶乘的连乘)
展开即得p1的k1次方乘p2的k2次方
一直乘到pm的km次方的系数
这个系数也等于x1加x2
一直加到xm的n次方的
多项展开式中x1的k1次方
乘x2的k2次方
一直乘到xm的km次方项的系数
所以此分布称为多项分布
如果某产品分为一等品 二等品 三等品
和不合格品这4个质量等级
而各档次的产品出现概率
分别为p1 p2 p3和p4
则任取n件产品
各品级产品数目服从参数
为n p1 p2 p3和p4的多项分布
假设(X,Y,Z)为参数为n
p1 p2 p3的三项分布随机变量
验证三项分布的边缘分布为二项分布
不失一般性
计算X的边缘分布
对于大于等于0
小于等于n的整数i
计算X=i的概率
此时Y+Z等于n-i
所以X=i的概率
等于对所有满足j+k
等于n-i的非负整数j k
(X=i Y=j Z=k)的联合概率的求和
等于j从0取到n-i
(X=i Y=j Z=n-i-j)的联合概率的求和
代入三项分布的联合分布列
提出n阶乘除以i阶乘除以n-i的阶乘
p1的i次方 和(1减p1)的n减i次方
则求和号内整理为n-i的阶乘
除以j阶乘除以(n-i-j)的阶乘
乘以(1-p1)分之p2的j次方
乘以1-p1分之p3的n-i-j次方
j从0到n-i求和
则求和号内恰好等于
(1-p1)分之p2
加(1-p1)分之p3的
n-i次幂的展开式
整理得Cni乘以p1的i次方
乘以(1-p1)的n-i次方
这正是参数为n
p1的二项分布随机变量取值为i的概率
所以X服从参数为n p1的二项分布
同理 可也推出Y和Z的边缘分布
分别为参数是n p2
和n p3的二项分布
D为x y平面上的一个有界区域
其面积等于SD
若二维随机变量(X Y)的密度函数
在D区域内等于SD分之1
其他地方为0
则称二元随机变量(X Y)
服从区域D上的均匀分布
记为(X Y)服从于U(D)
第一周第2讲古典概型的例1.2.3的会面问题
甲 乙约定在下午4点至5点之间见面
并约定等候20分钟
过时即离去
求二人的会面概率
甲 乙到达时间(X Y)
即服从x y大于等于0
小于等于60的
正方形区域上的均匀分布
如图所示
设(X Y)服从x y坐标轴
以及x+2y=2
所围成三角形区域内的均匀分布
求X和Y的边缘密度函数
并计算X小于1的概率
因为x y坐标轴
以及x+2y=2
所围成三角形区域的面积等于1
所以(X Y)的联合密度函数
f(x y)在此三角形内部等于1
在其他点均为0
所以当x小于等于0
或x大于等于2时
X的边缘密度函数等于0
当x大于0小于2时
X的边缘密度函数等于固定x
将联合密度函数f(x y)
对y从负无穷到正无穷积分
等于y从0到1-x/2
对密度函数1积分
等于1-x/2
当y小于等于0或y大于等于1时
Y的边缘密度函数等于0
当Y大于0 小于1时
Y的边缘密度函数等于固定y
将联合密度函数f(x y)
对x从负无穷到正无穷积分
等于x从0到2-2y
对密度函数1积分
等于2-2y
X小于1的概率
等于对X的边缘密度函数fX(x)
x从负无穷到1积分
等于x从0到1对1-x/2积分
等于3/4
二维正态分布随机变量
(X Y)共有5个参数
mu1 mu2 sigma1方sigma2方和pho
二元正态分布随机变量(X Y)的密度函数
为这样一个比较复杂的表达式
其中exp表示e的x次幂
其中x y的取值为所有实数
参数mu1和mu2也可取任意实数
参数sigma1和sigma2大于0
参数pho的绝对值小于等于1
如图所示
为几组不同参数取值下的
二维正态分布随机变量的密度函数图像
当sigma1和sigma2
比较小时密度函数的取值更加集中
峰值更为明显
当pho较小时x y的分布较均匀
而当pho较大时
x y的分布更加扁平
随机变量(X Y)服从参数为mu1 mu2
sigma1方 sigma2方和pho的二维正态分布
计算X和Y的边缘密度函数
先算X的边缘密度函数fX(x)
等于将密度函数
对y从负无穷到正无穷积分
代入二维正态分布的密度函数表达式
做变量代换
u等于sigma1分之x减mu1
v等于sigma2分之y减mu2
再将指数部分
合并为(v-pho u)的平方
加(1-pho方)乘以u方
提出根号2pi乘sigma1分之1
乘以e的负2分之u方次幂
剩下的积分部分恰好是期望为pho u
方差为(1—pho方)的正态随机变量密度函数
从负无穷到正无穷的积分等于1
所以等于根号2pi乘sigma1分之1
乘以e的负2分之u方次幂
用sigma1分之x减mu1替换u
得到X的边缘密度函数
fX(x)的表达式
此函数就是期望为mu1
方差为sigma1方的
正态分布随机变量的密度函数
所以X的边缘分布就是参数为mu1
sigma1方的正态分布
由对称性刚才的分析中
若互换x y的位置
即可得到Y的边缘分布为参数是mu2
sigma2方的正态分布
由此 我们得到二元正态分布的一个重要性质
二元正态分布的边缘分布是一元正态分布
需要注意的是
此命题的逆命题不成立
即二元随机变量(X Y)的边缘分布均为正态
联合分布未必是二元正态分布
我们将在附加材料中给出一个反例
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题