当前课程知识点:概率论与数理统计 > 第3章 多维随机变量及其分布 > 条件分布与随机变量的独立性 > 拓展知识
两个事件的独立性是指:一个事件的发生不受另一个事件发生与否的影响。两个随机变量的独立性远比事件的独立性要求高。虽然在现实中,随机变量间完全相互独立的情形很少,但在某些情况下将随机变量的相依关系简化为相互独立具有重要的意义,比如由低维分布构造高维分布、高维分布的降维、统计抽样中的简单样本假设等。
下面我们从随机模拟的角度来进一步认识多个随机变量的独立性,以二维随机变量为例。
二维正态分布是最重要的多维分布之一。设已知 \( (X,Y) \) 服从二维正态分布 \( N(0,1;0,1;\rho) \),\( |\rho|\leq 1 \) 为相关系数,其联合密度函数为
\[
f(x,y)=\frac{1}{2\pi\sqrt {1-\rho^2}} \exp\left\{-\frac{x^2-2\rho xy+y^2}{2(1-\rho^2)}\right\},\ \ x\in R, y\in R
\]
我们知道,不论相关系数的取值为多少,\( (X,Y) \) 的边缘分布都是相同的一维正态分布,容易证明: \( X,Y \) 相互独立的充要条件为 \( \rho=0 \)。可见,\( \rho \) 的不同取值暗示了两个随机变量 \( X,Y \) 的``相依关系'',通过随机模拟,获取 \( (X,Y)\sim N(0,1;0,1;\rho) \) 的随机数,画出它们的散点图,直观地观察 \( X,Y \) 的``相依关系''。
图1中相关系数 \( \rho=0.8 \),利用matlab产生的伪随机数散点呈椭圆族(棒状)数据;从相应的横坐标 \( X \),纵坐标 \( Y \) 的取值曲线(前50个点)可见:决大多数情况下,\( X \) 与 \( Y \) 的变化非常一致,都增大或都减小,``正相关''程度高;
图2中相关系数 \( \rho=-0.8 \),利用matlab产生的伪随机数散点呈椭圆族(棒状)数据; \( X \) 与 \( Y \) 的变化呈``反向一致'',一增一减,``负相关''程度高;
图3中相关系数 \( \rho=0.3 \),利用matlab产生的伪随机数散点呈椭圆族数据;决大多数情况下,\( X \) 与 \( Y \) 的变化有一定的一致性,都增大或都减小,呈弱的``正相关'';
图4中相关系数 \( \rho=0 \),利用matlab产生的伪随机数散点呈圆族数据,散点落在``圆域''内显得更加``均匀''、``随机'',当然它们也是``集中''在均值 \( (0,0) \) 附近的; \( X \) 与 \( Y \) 的变化联系没有规律可循,也就是说``即使已知 \( X \) 的取值情况,也不能对判断 \( Y \) 的取值情况提供更多的信息'',坐标 \( X \) 与 \( Y \) ``不相关'',我们称随机变量 \( X \) 与 \( Y \) 是相互独立的。
注:由散点图去判断数据的类型是常用的方法,这对了解数据的分布非常有帮助。比如,在对高斯型(二维正态)圆族数据进行聚类分析时,可针对性地采用 \( K \) 均值(K-means)聚类,距离函数采用欧氏距离,效果较好;又如,一旦数据表现出一个随机变量 \( Y \) 与另一个随机变量 \( X \) 之间有强的相关关系,那么在知道 \( X \) 的情况下就可以较好地预测出 \( Y \),且此时往往我们可以仅考察变量 \( X \) 而忽略变量 \( Y \),以达到对高维数据降维的目的,如主成分分析(PCA)。
-课程发展概况及概率的三要素
--讲义下载
--拓展知识
-第一章第一节测试题
-古典概率
--讲义下载
--拓展知识
-第一章第二节测试题
-几何概率
--讲义下载
--拓展知识
-第一章第三节测试题
-条件概率与乘法公式
--讲义下载
--拓展知识
-第一章第四节测试题
-全概率公式
--讲义下载
--拓展知识
-第一章第五节测试题
-贝叶斯公式
--讲义下载
--拓展知识
-第一章第六节测试题
-事件的独立性及应用
--讲义下载
--拓展知识
-第一章第七节测试题
-讨论
--“三门”问题
-第一章测试题
-随机变量及其分布
--讲义下载
--拓展知识
-第二章第一节测试题
-一类离散型随机变量的分布
--讲义下载
--拓展知识
-第二章第二节测试题
-泊松分布及泊松定理
--讲义下载
--拓展知识
-第二章第三节测试题
-均匀分布与指数分布
--讲义下载
--拓展知识
-第二章第四节测试题
-正态分布
--讲义下载
--拓展知识
-第二章第五节测试题
-连续型随机变量函数的分布
--讲义下载
--拓展知识
-第二章第六节测试题
-讨论
--分布之间关系
-第二章测试题
-多维随机变量及分布(一)
--讲义下载
--拓展知识
-第三章第一节测试题
-多维随机变量及分布(二)
--讲义下载
--拓展知识
-第三章第二节测试题
-边缘分布律和边缘密度
--讲义下载
--拓展知识
-第三章第三节测试题
-条件分布与随机变量的独立性
--讲义下载
--拓展知识
-第三章第四节测试题
-随机变量极值的分布
--讲义下载
--拓展知识
-第三章第五节测试题
-随机变量和的分布
--讲义下载
--拓展知识
-第三章第六节测试题
-数形结合求解函数的分布
--讲义下载
--拓展知识
-第三章第七节测试题
-讨论
--分布类的和不变性
-第三章测试题
-数学期望和方差的定义
--讲义下载
--拓展知识
-第四章第一节测试题
-数学期望和方差的应用
--讲义下载
--拓展知识
-第四章第二节测试题
-数学期望的线性性质及应用
--讲义下载
--拓展知识
-第四章第三节测试题
-方差的性质与协方差
--讲义下载
--拓展知识
-第四章第四节测试题
-标准化与相关系数
--讲义下载
--拓展知识
-第四章第五节测试题
-讨论
-第四章测试题
-大数定律
--课程讲义下载
--拓展知识
-第五章第一节测试题
-中心极限定理
--讲义下载
--拓展知识
-第五章第二节测试题
-讨论
--用电量的正态假设
-第五章测试题
-数理统计的基本概念
--讲义下载
--拓展知识
-第六章第一节测试题
-单样本均值统计量的分布
--讲义下载
--拓展知识
-第六章第二节测试题
-单样本方差统计量的分布
--讲义下载
--拓展知识
-第六章第三节测试题
-讨论
--保险损失分布
-第六章测试题
-什么是参数估计
--讲义下载
--拓展知识
-第七章第一节测试题
-矩估计
--讲义下载
--拓展知识
-第七章第二节测试题
-似然原理与似然函数
--讲义下载
--拓展知识
-第七章第三节测试题
-连续型分布的似然估计
--讲义下载
--拓展知识
-第七章第四节测试题
-一类离散总体的似然估计
--讲义下载
--拓展知识
-第七章第五节测试题
-区间估计
--讲义下载
--拓展知识
-第七章第六节测试题
-讨论
--湖中有多少条鱼?
-第七章测试题
-假设检验的基本原理
--讲义下载
--拓展知识
-第八章第一节测试题
-两类错误
--讲义下载
--拓展知识
-第八章第二节测试题
-正态总体均值的检验
--讲义下载
--拓展知识
-第八章第三节测试题
-正态总体方差的检验
--讲义下载
--拓展知识
-第八章第四节测试题
-卡方拟合检验
--讲义加载
--拓展知识
-第八章第五节测试题
-讨论
-第八章测试题
-一元线性回归(最小二乘估计)
--讲义下载
--拓展知识
-第九章第一节测试题
-一元线性回归(相关系数检验)
--讲义下载
--拓展知识
-第九章第二节测试题
-讨论
--火灾损失的因素
-第九章测试题