当前课程知识点:概率论与数理统计 > 第六章 数理统计的基本概念 > 第3节 抽样分布 > 6.3 抽样分布
下面我们学习第三节
抽样分布和抽样分布定理
本节内容包括两个知识点
抽样分布和抽样分布定理
首先我们看
一第个知识点,抽样分布
首先呢,给出抽样分布的定义
统计量T(X1,···Xn)
我们说是一个随机变量
既然是随机变量
就有分布函数,统计量的分布函数
我们称为抽样分布
本节我们介绍统计学中
常用的三大统计量的抽样分布
它们分别是卡方统计量分布
T统计量分布
和F统计量分布
首先,我们看第一大分布卡方分布
首先我们看卡方分布的构造
设X1,X2,···Xn相互独立
并且Xi服从标准正态分布
这时候呢Xi的平方求和
i从1到n求和,所服从的分布
我们称为自由度为n的卡方分布
记作X服从自由度为n的卡方分布
下面我们讨论一下卡方分布的性质
首先看性质一
如果X服从自由度为m的卡方分布
Y服从自由度为n的卡方分布
并且X与Y相互独立
则X+Y服从自由度
为m加n的卡方分布
这条性质叫卡方分布的可加性
那么既然X服从自由度为m的卡方分布
所以X可以写成
m个标准正态变量的平方和
Y服从自由度为n的卡方分布
所以Y可以写成n个
标准正态变量的平方和
那么它们两个相加,X+Y就是
m+n个标准正态变量的平方和
并且要保持相互独立性
所以X+Y服从自由度
为m+n的卡方分布
看第二条性质
如果X服从自由度为n的卡方分布
则X的均值是n,方差是2n
下面我们证明一下第二条性质
因为Xi是标准正态分布
所以Xi的方差
等于1
那么方差等于EXi的平方减去
EXi括起来的平方
EXi就是
Xi的均值是零
也就是减去零的平方
所以等于EXi
Xi平方的期望就等于D(Xi)就等于1
这样我们把EXi的
平方的均值就求出来了
下面我们再求Xi平方的方差
根据方差的计算公式等于
Xi的平方的平方的均值
减去Xi平方的均值的平方
那么在上面关系式中
我们已经求出了Xi平方的均值是1
所以后面这一项,就是1的平方,仍然是1
前面一项我们看是Xi的四次幂
是Xi的函数
根据函数的均值是等于函数乘以密度积分
密度是根号2π分之一
e的负二分之x的平方
那么这个积分呢,我们给它这样处理一下
x四次幂写成x三次幂
乘以二分之2x,2x方的后面
就是x的平方,二分之一放在后面
就是二分之x的平方
那么这是偶函数积分
所以呢,我们只积区间的一半
从零积到正无穷,前面是一个二倍的关系
然后我们做变量替换
t等于二分之x平方
由系数和被积函数,我们可以写成
根号π分之四
零到正无穷
t的二分之三次幂,e的负t
对t呢进行积分,积分项
我们看,t二分之三可以写成
t二分之五减一
乘以e的负t,从零到正无穷积分
这个积分恰好是伽马函数
是伽马
二分之五
通过计算,伽马二分之五是等于四分之三
根号π和前面系数相乘
根号π约掉,4约掉,还剩3
三减一等于二
这样的话我们就可以把X的
Xi的平方的方差求出来了
那么由于卡方等于Xi的平方
i从1到n求和,且X1,X2,···Xn
是两两独立
所以我们看一下
卡方的均值
也就是和的均值
等于每一项的均值的和
每一项的均值
大家看是等于1
所以有n个1相加
所以卡方的均值是n
那么卡方的方差,和的方差等于
方差的和,等于每一项求方差
那么每一项的方差是2
所以呢方差是2n
好,我们回顾一下
伽马函数,在高数中我们学过
伽马p是等于xp-1,e的-x次幂
关于x从零到正无穷积分
参数p呢要求是大于零
它呢是具有两个性质
第一个性质,伽马p加一等于p乘以伽马p
伽马二分之一等于根号π
这样的话
伽马二分之五我们可以写成
伽马二分之三加一,根据第一条性质等于
二分之三乘以伽马二分之三
伽马二分之三又可以写成二分之一加一
那么再根据第一条性质,等于二分之一
乘以伽马二分之一
伽马二分之一是根号π
所以呢是结果呢是四分之三根号π
就把这一项呢求出来了
下面我们看一下卡方分布的密度
这是n等于四的时候
自由度是四的时候
它的密度曲线,n等于十的时候
是这样一个形式
当n很大的时候
卡方呢
我们知道是等于i从1到n
Xi的平方和
如果我们把Xi的平方
看做是一个整体
那么卡方呢,是n个变量的和的形式
那么在中心极限定理中
n个变量的和,当n趋向无穷的时候
是近似服从正态分布
所以当n很大的时候
卡方分布
近似服从正态分布,在前面呢
我们求出了均值是n,方差是2n
所以服从均值是n,方差是2n的
正态分布
下面我们看一下卡方分布的
上侧分位数
对于α大于零小于1
如果卡方小于等于卡方1-α平方
等于1-α
这时候呢
我们称卡方1-α为
卡方变量的上侧α分位数
也就是这个分界点的上侧的面积是α
好,下面呢,我们求一下卡方分位数
比如我们求一下
卡方0.99
自由度是21
那么这个的话,我们首先在分位数表中
找到α是1减去0.01
找到α等于0.01
然后
在左侧一栏找到自由度是21
得到
这个分位数是38.932
再比如,n等于21
α等于0.01
这也是一个分位数
那么这个分位数呢,同样也可以由
卡方分位数转换,得到
是41.401
这个分位数是卡方0.99,自由度是20
求出来是37.566
注意到分位数表只给出了
自由度小于等于四十五的情况
另外
除了表中给出的α值
其余表中没有的α值
怎么求它的上α分位数呢
我们根据前面的结论
当n很大的时候
卡方分布近似服从正态分布
那么利用这个结论呢
我们可以用
标准正态统计量,来近似求
卡方分布的分位数
那么得到这个结论,卡方1-α(n)
近似等于n加上根号2n乘以
u1-α,u1-α是标准
正态统计量
关于α的
上分位数
我们来简单证明一下这个结论
因为卡方变量,小于等于卡方1-α(n)
那么这个概率是和下表是一致的
是等于1-α
这时候呢,如果n很大的时候
我们说卡方呢是服从n
2n的正态分布
所以卡方减均值减n
比上标准差根号2n
那么这时候就是一个标准正态变量
这个标准正态变量
小于等于u1-α概率
也是1-α
那么然后我们将这个公式呢给它展开
就是卡方小于等于n,加上根号2n
u1-α
那么这时候呢,这两个值呢
是近似相等
所以就得到卡方1-α(n)
近似等于加上根号2n·u1-α
比如我们求卡方0.975(50)
50大于等于45
那么不能够通过数学用表来求
可以用近似计算
等于n加上根号2nu1-α
也就是五十加上根号一百u0.975
前面呢我们查出来呢
是1.96,根号100是10
也就是19.6加50是69.6
这是卡方分布
下面我们介绍另一类重要的分布,叫T分布
首先我们给出T分布的构造
设X服从
标准正态分布,Y是服从自由度
为n的卡方分布
并且X与Y是相互独立
这时候呢我们称
X除以根号Y比上
自由度n
那么这个统计量服从的分布
称为自由度为n 的
T分布
记作T服从自由度为n的T分布
这个T分布最早是由英国统计学家柯萨德引进的
下面,我们看一下它的密度曲线
它的密度曲线,我们看,是关于Y轴对称
随着自由度的
逐渐增大
逐渐接近于标准正态分布曲线
如果这个点t1-α(n)
它的左侧的概率和下标是一致的
是1-α,右侧的概率是α
这个点呢是T变量
关于α的
上分位数
这是上分位数
它的定义是对于α大于0小于1
如果P小于等于t1-α
概率是1-α,则称
t1-α(n)为T变量的上侧α分位数
那么左边这个分位数是tα
也就是它左侧的面积是α
根据这个图像是一个
关于Y轴对称的偶函数形式
所以呢,这个点的坐标等于
负的t1-α
两侧的概率呢
我们说都是α
我们看这样一个分位数,n=20
α=0.01
那么查表求一下tα(n)
也就是t0.01
自由度是20
那么因为概率α是
等于0.01小于0.5
所以这个值呢应该是负的
我们在
t分位数表上
首先找到α
然后在左侧一列找到自由度是20
这个值呢是-2.528
下面我们看t1-α(n)
我们说t1-α(n)等于负的tα(n)
所以等于2.528
我们再看t1减二分之α
这是关于α的双侧分位数
这个呢,查表呢是2.806
好 ,再看一个问题
设t1-α(n)
为t变量的上侧α分位数
计算概率,t小于t1-α的概率
我们说小于的概率和下标是一致的
所以等于
1-α
再看,t小于负的t1-α(n)
我们说负的t1-α(n)
关于Y轴和tα(n)对称
所以呢,这个概率等于T小于tα
所以
这个概率等于α
再看
T的绝对值大于t1-α(n)
它的概率,我们说
T大于t1-α这个概率呢
是等于α的,T小于负的
t1-α概率也等于α
所以绝对值大于t1-α的概率
是2α
我们后面的数学用表只给出了
n小于等于45的t分位数
那么当n大于45的时候
上侧分位数的值可以用正态分布来近似
也就是t1-α约等于
u1-α
比如求
t0.975(100)
再看100是大于45
所以近似等于u0.975
这个值呢是
1.96
好,下面我们学习
F分布
首先我们看一下
F分布的构造
设X服从自由度为n1的卡方分布
Y服从自由度为n2的卡方分布
并且X、Y相互独立
则称,X比上自由度n1
比上Y比上它的自由度n2,所服从的分布
为自由度为(n1,n2)的F分布
记作F服从自由度为
(n1,n2)的F分布
n1表示第一自由度
n2表示第二自由度
我们看一下它的性质
首先呢,从构造上我们可以
得到这样一个结论
F的倒数,F分之1
也就是Y比上n2比上
X比上n1,仍然是卡方变量
比自由度,比上卡方变量比自由度
所以仍然应该是服从
F分布
只不过自由度呢变成了(n2,n1)
这是第一条性质
我们看一下它的密度曲线
那么如果这个边界点
密度函数从这个边界点积到正无穷的
概率是α的话
也就是下侧的面积是1-α
那么这个点呢就记作F1-α
称为F变量
关于α的上分位数
所谓的上分位数就是对于α
大于0小于1
如果F小于等于
F1-α(n1,n2)概率是1-α
我们就称F1-α(n1,n2)
为F关于α的上分位数
那么由第二条属性
也就是F的倒数仍然是F分布
我们可以得到
Fα(n1,n2)
等于F1-α(n2,n1)
也就是
分位数的倒数仍然可以得到另一个分位数
只不过它们的自由度呢要调换一下位置
下标要变成1减原来的下标
这样一个形式
那么对于这个公式
我们看一下,当分位数在
数学用表查不到时呢
我们可以用该性质转化为
倒数的分位数,来查数学用表
下面我们简单的证明下它的结论
那么Fα是F小于等于α
概率是α
F变量是非负的
所以呢可以取倒数,F分之1大于等于
Fα分之1的概率就等于α
那么F分之1大于等于
右边这个界限的概率是α
所以,小于等于的概率呢就是1-α
又因为F的倒数仍然是F分布
服从(n2,n1)的F分布
那么F分之1小于等于
F1-α(n2,n1)的概率是1-α
这样的话我们看,由上面这个关系式
和下面这个关系式
所以呢F1-α(n2,n1)
一就等于
Fα(n1,n2)
然后交换一下位置
就是我们要证明的结论
Fα(n1,n2)等于
F1-α(n2,n1)分之1
下面我们求这样一个分位数
F0.95(8,12)
我们仍然在F分位数表中
找到α等于
0.05
然后找到自由度n1等于8
n2等于12
得到2.85
然后我们再查一个分位数
F0.05(12,8)
那么这个分位数,我们可以通过
求倒数,这个下标呢
变成了1-α
也就是0.95
然后自由度交换位置,也就是(8,12)
上面已经查出来呢是2.85
这就算出来是
2.85分之1等于0.351
好,下面我们看第二个问题
设F服从自由度为(8,9)的F分布
求满足F大于λ1的概率是0.05的
λ1
λ1
首先呢,我们看一下λ1
根据后面的概率是什么
大家看,λ1
F大于λ1的概率是0.05
所以F小于等于
λ1的概率呢应该是0.95
所以下标呢,应该是0.95
自由度就是F的自由度
也就是说(8,9)
然后通过数学用表呢
查出来是3.39
再求一个,求满足F小于λ2的
概率等于0.975的λ2
首先呢,我们把λ2写出来
它是一个分位数
F下标是和概率是一样的
因为是F小于
是0.975
在这里呢,我们设F服从
(8,9)的F分布
所以呢,后面两个自由度呢是8和9
查表得到是4.10
好,现在我们学习了来自正态总体的
三个分布,卡方分布
T分布和F分布
这三大分布是统计学中非常重要的
三大分布,在统计推断中有非常重要的应用
对这三大分布我们要求掌握它们的构造
定义、主要性质以及分布曲线的形状
掌握三种分布的上侧分位数的
表示、性质和查表方法
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试