当前课程知识点:概率论与数理统计 > 第九周 协方差与相关系数 > 相关与独立 > 9.4 相关与独立
当随机变量X,Y相互独立时
X,Y的协方差为0
因此相关系数也为0
也就是X,Y相互独立
则X,Y必然不相关
但反过来X,Y不相关时
并不能推出X,Y相互独立
把一枚均匀硬币抛掷三次
设X为三次抛掷中正面出现的次数
而Y为正面出现的次数
与反面出现的次数之差的绝对值
试求X与Y的联合分布律
以及X与Y的相关系数
并判断X与Y是否独立
由于X为三次抛掷中正面出现的次数
故X的可能取值为0,1,2,3
而3次抛掷的结果
不同面的次数或者是3,0
或者是2,1
所以Y的可能取值为1和3
且X等于0时 Y一定等于3
此时的联合概率等于8分之1
当X等于1时 Y一定等于1
而出现1次正面有3种可能
所以此时的联合概率等于8分之3
当X等于2时 Y也一定等于1
联合概率等于8分之3
当X等于3时 Y必然等于3
联合概率等于8分之1
其余的X,Y取值的联合概率均为0
所以X,Y的联合分布律
和边缘分布律如表所示
根据X,Y的联合分布律和边缘分布律
分别计算X,Y的期望和方差
并且得到XY乘积的期望等于4分之9
利用定义计算X,Y的相关系数
代入各个期望、方差的数值
得到相关系数等于0
即随机变量X与Y不相关
另一方面
观察到X=0 Y=1的联合概率等于0
而X=0和Y=1的概率
分别为8分之1和8分之6
X=0 Y=1的联合概率
不等于X=0和Y=1概率的乘积
所以X与Y不独立
这里我们举一个不相关
但并不是相互独立的例子
设随机变量X服从标准正态分布
并取Y等于X平方
考虑随机变量X和Y之间的
相关性和独立性
Y是由X决定的
直觉上 X,Y显然不是相互独立的
但随机变量之间的关系
不能仅仅靠直觉判断
必须符合其概率意义下的定义
实际上 可写出X,Y的
联合概率密度函数
其中phi(x)是
标准正态分布随机变量的密度函数
联合密度函数只有在
y等于x平方这条抛物线上是非零的
在抛物线以外x,y平面上的其余点
f(x,y)均为0
而X,Y的边缘密度
在任何自变量取值时均不为0
所以对抛物线y=x平方之外的点(x,y)
联合密度函数f(x,y)等于
X,Y边缘密度函数
在x,y点取值的乘积这一关系均不成立
所以随机变量X,Y相互不独立
另一方面
X,Y的协方差等于XY的乘积的期望
减去X的期望和Y的期望的乘积
等于X立方的期望
减去X的期望乘以Y的期望
因为X立方的期望和X的期望均等于0
所以X,Y的协方差等于0
X,Y不相关
刚才的例子中
X和Y的相关系数等于0
它们不相关
但是它们之间显然具有很强的
相互关联的关系
实际上 相关系数反映的是随机变量之间
在线性关系意义下的相关程度
下面的定理更清楚地表明了
相关系数的这一性质
随机变量X,Y相关系数为
正负1的充要条件是
X,Y之间以概率1满足线性关系
即存在常数a和b
使得Y等于aX加b的概率为1
所以按照协方差除以
标准差乘积定义的相关系数
也称为线性相关系数
不相关指的是不存在线性相关的关系
相关系数并不能有效的表达
非线性的相关关系
下面给出定理的证明
先证明充分性
即由X,Y以概率1满足Y等于aX加b
推出X,Y的相关系数等于正负1
若Y等于aX加b
则Y的方差等于a平方乘以X的方差
得到Y的标准差等于
a的绝对值倍的X的标准差
另一方面
从Y等于aX加b还可推出
X,Y的协方差等于a倍的X和X的协方差
即等于a倍的X的方差
等于a乘以X的标准差的平方
代入X,Y的相关系数的定义
得到相关系数等于a除以a的绝对值
等于正负1
当a为正数时 相关系数等于1
当a为负数时 相关系数等于-1
再证明必要性
即由相关系数等于正负1
推出X,Y以概率1满足Y等于aX加b
计算sigma_x分之X
加减sigma_y分之Y的方差
等于sigma_x分之X的方差
加sigma_y分之Y的方差
加减2倍的sigma_x分之X
与sigma_y分之Y的协方差
等于2乘以1加减X,Y的相关系数
若X,Y的相关系数为正负1
则推出sigma_x分之X减sigma_y分之Y
或sigma_x分之X加sigma_y分之Y的方差等于0
所以得到sigma_x分之X减sigma_y分之Y
或sigma_x分之X加sigma_y分之Y
以概率1等于某常数c
即Y以概率1可以表示为X的一个线性函数
如图所示
我们给出不同相关系数下
两个随机变量的模拟结果
可以大致看到相关系数分别等于1和0
以及0.9,0.7,0.5,0.3时
所对应的两个随机变量之间的
相互依赖程度
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题