当前课程知识点:概率论与数理统计 > 第十三周 统计学基本概念 > 三种重要的统计分布和分位数 > 13.4 三种重要的统计分布和分位数
正态分布是统计数据分析中最常见的分布
以标准正态分布为基础
构造出的三个重要的统计量
在实际问题中有着广泛的应用
这三个分布分别被命名为卡方 t和F分布
常常被称为统计学中的“三大抽样分布”
首先看卡方分布的定义
随机变量X1、X2、Xn相互独立
都服从标准正态分布
定义随机变量Y
等于X1方加X2方
一直加到Xn方
则称随机变量Y服从
自由度为n的卡方分布
记为Y服从于卡方n
或Y服从于卡方下标n
由卡方分布的定义
可知卡方分布随机变量具有可加性
即若随机变量X1 X2相互独立
且分别服从自由度为m和n的卡方分布
则X1加X2服从
自由度为m加n的卡方分布
n个自由度的卡方分布随机变量
其期望等于n 方差等于2n
这两个结果的计算推导
留给同学们做为练习
图13.1给出自由度
分别为2、4、8、16的卡方分布的密度函数
卡方分布随机变量永远是非负的
自由度较小时
密度函数的峰值偏左
随着自由度的增加
密度函数曲线变得越来越平缓
卡方分布具有重要意义的原因之一
是下面的定理
设X1、X2、Xn是来自于期望为mu
方差为sigma方的正态总体的样本
其样本均值和样本方差分别为
X一拔和S方
则X一拔和S方相互独立
X一拔服从期望为mu
方差为n分之sigma方的正态分布
n-1倍的S方除以sigma方
服从自由度n-1的卡方分布
这个定理的结果
会在后面的参数估计和假设检验中用到
定理的(1)(3)部分的证明超过了本课程要求
所以略去了
t分布的定义
设随机变量X1服从标准正态分布
随机变量X2服从自由度为n的卡方分布
X1和X2相互独立
定义随机变量Y
等于X1除以根号n分之X2
则称随机变量Y为自由度为n的t分布
记为Y服从于t(n)
设随机变量X1和X2相互独立
分别服从自由度为m和n的卡方分布
定义随机变量Y等于m分之X1
除以n分之X2
则称随机变量Y
为服从自由度为m与n的F分布
记为Y服从于F(m、n)
图13.2给出了不同自由度的
t分布随机变量的密度函数曲线
和提供对比的
标准正态分布的密度函数曲线
其中红色曲线为标准正态分布的密度函数
t分布随机变量的密度函数
关于x=0对称
当自由度较小时
随着自变量x的绝对值的增大
t分布密度函数明显比
标准正态分布的密度函数的衰减速度
要更缓慢一些
通常将这种衰减速度较缓慢的性质
直观地称为重尾性质
当自由度较大时
可以看出t分布密度函数
越来越接近于标准正态分布
事实上 自由度大于30时
t分布就基本上等同于标准正态分布了
F分布只取非负值
其密度函数有一个峰值
图中显示了自由度分别为4、1 4、4
4、10和4、100的
F分布随机变量的密度函数
很多概率统计问题
需要知道给定分布函数值时
随机变量相应的取值
由此引出分位数的概念
设X为一个连续型随机变量
它的分布函数为F(x)
如果F(a)等于alpha
则称a为该分布的下侧alpha分位点
也称为下侧alpha分位数
标准正态分布的alpha分位点
用u alpha表示
自由度为n的卡方分布的alpha分位点
用卡方下标alpha n表示
自由度为n的t分布的alpha分为点
用t alpha n表示
自由度为n m的F分布的alpha分位点
记为F alpha m n
看一个关于分位数的例题
随机变量X服从标准正态分布
求随机变量X的绝对值小于等于
标准正态分布0.975分位数的概率
X的绝对值小于等于
标准正态分布0.975分位数的概率
等于X小于u 0.975
大于负的u 0.975的概率
如图所示
利用标准正态分布密度函数的对称性
等于2倍的X小于u 0.975
大于0的概率
等于2倍的二分之一减去X
大于等于u 0.975的概率
等于1减去2倍的X
大于等于u 0.975的概率
等于1减去2倍的1减0.975
等于0.95
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题