当前课程知识点:概率论与数理统计 > 第八章 假设检验 > 第八章 练习题 > 6.2 抽样分布
大家好,欢迎来到我的课堂!
今天,我们要学习的内容是抽样分布。
前面我们已经学习了统计量,
统计量是样本的函数,
是随机变量。
统计量的分布我们称之为抽样分布。
当总体分布已知时,
抽样分布是确定的,
但往往难以计算。
然而,
有三大抽样分布,
它们来自正态总体,
它们在统计推断当中有重要的应用。
下面,我们就逐个进行介绍。
一、卡方分布。
设X1,…,Xn是标准正态总体的样本,
称Xi的平方和
服从自由度为n的卡方分布,记作χ²(n)。
这里的自由度n,
其实就是分布的参数。
那么,这个定义表明卡方分布是如何构造的,
它是由n个相互独立的
标准正态的平方和构成的。
当然,
我们也可以用卡方分布的概率密度
给出这一分布的定义,
其中Γ函数由积分形式给出。
下图给出了卡方分布随机变量的
概率密度函数的图像。
卡方分布有下面几个重要的性质:
第一,
如果随机变量X服从自由度为n的卡方分布,
那么,很容易验证X的期望等于自由度n,
X的方差等于2n。
第二个,假设X是自由度为m的卡方分布,
Y是自由度为n的卡方分布,
且两者独立。
那么,X+Y可以写成
m+n个独立的标准正态的平方和,
因此,X+Y是自由度为m+n的卡方分布。
下面,我们给出卡方分布的上分位点。
如图所示,
如果X服从自由度为n的卡方分布,
α是0到1之间的某一个数值。
如果X在某一点及其右侧的概率恰好等于α,
那么我们称这个位置为卡方分布的上α分位点,
记作χ²_α(n)。
抽样分布的上分位点
在统计推断当中有重要的作用。
下面,我们来看例1,查表计算这两个分位数。
根据下面给出的卡方分布表,
我们首先来计算第一个分位数。
这里α取0.05,
n自由度取10,
我们查的这一数值为18.307。
下面我们来看第二个,
这里n>50,表中没有给出数据。
然而,我们可以用这一近似公式。利用公式得到
1/2乘以,标准正态分布的上0.05分位点
加上根号99再取平方。
标准正态的分位点,
我们通过标准正态分布表可以查得。
最后计算的结果如下。
这一结果与软件计算的非常相近。
下面我们介绍第二个抽样分布——t分布。
假设X是标准正态分布,
Y服从自由度为n的卡方分布,
且两者独立。
我们称 X 除以根号下Y/n
服从自由度为n的t分布,
也称学生分布,记作t(n)。
注意,这是t分布的概率密度函数图像
及其公式。
下面,我们来看t分布的一条性质。
当n趋于无穷的时候,
t分布的概率密度函数
以标准正态分布的概率密度函数为极限,
即 n 充分大时,t 分布近似标准正态分布。
下面,我们给出t分布上分位点的概念。
与卡方分布类似,
假设X服从自由度为n的t分布,
如果X在某一点及其右侧的概率
恰好等于α,
则称这个点为t分布的上α分位点。
记作t_α(n)
由于t分布概率密度函数对称,
因此
它的上α分位点的相反数
恰好是上1-α分位点,
即有如下公式成立。
下面,我们来看第三个抽样分布——F分布。
假设X服从自由度为m的卡方分布,
Y服从自由度为n的卡方分布,
且两者独立。
那我们称X和Y除以各自自由度、
再做商得到的分式
服从自由度为m和n的F分布,
记作 F(m,n)。
这是 F分布的概率密度及其图像。
注意,它有两条重要性质。
第一,如果W服从F分布,
那么1/W也是F分布,
只不过自由度交换次序。
第二条,如果W是自由度为n的t分布,
那么W²服从自由度为1和n的F分布。
这一证明非常简单,
如这个公式所示。
下面,我们给出F分布的上α分位点,
其定义与卡方分布、t分布类似。
注意,F分布的上α分位点
有一个重要性质。
就是自由度为m和n的F分布的上1-α分位点
等于自由度为n和m的F分布的上α分位点的倒数。
例2,设X1,…,X6是标准正态总体的样本,
求下列统计量的抽样分布。
我们首先看第一个,
它的分子是独立的标准正态的线性组合,
因此是正态分布。
而且,其期望等于零、
方差等于2,
因此
X1-X2是这样一个正态分布,
我们将它标准化得到标准正态分布。
再来看它的分母,
根号下的X3²+X4²
显然是自由为2的卡方分布。
而且,这一分布与前面得到的标准正态分布独立。
因此,我们可以构造出一个t分布,
即由标准正态做分子、
由卡方分布除以自由度2开根做分母,
得到自由度为2的 t分布。
这就是第一问的解答。
下面,我们来看第二问。
其分子服从自由度为4的卡方分布,
分母当中,X5²+X6²
服从自由度为2的卡方分布,
且这两个卡方分布相互独立。
因此,我们可以让它们除以各自的自由度、
再做商,得到自由度为4和2的F分布。
这个式子整理得到这个形式,
即我们的第二问。
下面,我们来给出正态总体的样本均值
与样本方差的抽样分布。
首先来看定理1。
设X1,…,Xn是正态总体的样本,
X¯, S²分别是样本均值和样本方差。
那么,第一条
样本均值X¯服从这样的正态分布。
其证明很简单,
因为X¯是样本的算术平均,
即,它是独立正态随机变量的线性组合,
服从正态分布。
又经过前面的计算,
我们知道它的期望是μ、
它的方差是σ²/n。
因此,X¯服从这样一个形式的正态分布,
我们可以将它标准化得到一个标准正态分布。
第二条和第三条由于超出本课程的范围,
这里略过。
下面,我们来看结论四。
由于(1)当中给出了一个标准正态分布,
(2)当中给出了一个卡方分布,
且两者相互独立,
因此我们用它们可以构造一个t分布。
具体来说,
以标准正态为分子、
以卡方分布除以自由度开根为分母,
得到自由度为n-1的t分布。
这个式子整理即得到我们的结论(4)。
下面我们看定理2。
X1,…,Xn1和 Y1,…,Yn2
分别是取自两个正态总体的样本,
并且两样本相互独立。
样本均值记作X¯, Y¯,
样本方差记作S1²和S2²。
第一个结论是关于样本方差比的,
我们看到这个分式当中出现了样本方差的比值,
也包含了总体方差的比值,
这个式子服从F分布。
第二条,当总体方差相等的时候
下面的式子成立。
这是一个t分布,
其中,我们看到包含了样本均值的差,
也包含了总体均值的差。
有了定理2的(1)和(2),
未来我们就可以利用样本信息,
对总体方差的比σ1²/σ2²,
以及对总体均值的差μ1-μ2作出统计推断。
因此定理1和定理2的结论非常重要,
需要记忆。
本节,我们学习了抽样分布,
包括三类抽样分布。
我们需要知道它们的定义、
特别是它们是如何构造的,
了解它们的性质和上分位点的概念。
另外,我们这一节得到了正态总体抽样分布的结论,
包括单正态总体均值、方差的分布,
以及两正态总体样本均值和方差的分布。
好,今天的课就到这儿。
谢谢大家!
- 第八章 练习题