当前课程知识点:概率论与数理统计 > 第6章 数理统计的基本概念 > 单样本方差统计量的分布 > 拓展知识
引例: 某食品生产厂家宣传声称,高纤维含量的谷物食品除了能够降低各种癌症的发病率外,也具有减肥的功效。为此,随机调查了27人,其中食用高纤维谷物的有10人,不食用高纤维谷物的有17人。下表是这两类人的午餐中卡路里含量数据。假设卡路里含量服从正态分布,依据抽样数据,问高纤维组与非高纤维组人的午餐卡路里含量是否显著不同?
\[
\begin{array}{|c|cccccc|}
\hline
\mbox{高纤维组 }x_i&
592.77& 602.01& 612.87&711.56& 608.60& 608.74\\
& 647.61& 565.57& 537.57&498.23 &&\\
\hline
\mbox{非高纤维组 }y_j &
675.15& 611.67 &669.14& 671.22 &726.03& 690.35\\
&668.78&750.75 &715.91& 631.21 & 757.89& 605.56\\
& 680.58 &780.92&766.31&782.33&758.11& \\
\hline
\end{array}
\]假设以上两组数据 \( (x_1 ,\cdots ,x_{10} ),(y_1 ,\cdots ,y_{17}
) \) 分别来自两个正态总体 \( N(\mu _X ,\sigma _X ^2) \),\( N(\mu _Y ,\sigma _Y
^2) \)。如果 \( \mu _X =\mu _Y \),\( \sigma _X^2 =\sigma _Y^2
\),则表明这两组数据无显著差异否则,它们有差异。
要回答该问题需要采用假设检验的方法,其关键就是选择检验统计量和确定它的分布有如下的理论支撑。
定理: 设 \( X_1 ,X_2 ,\cdots ,X_n \) 与 \( Y_1 ,Y_2 ,\cdots ,Y_m
\) 分别是来自总体 \( N(\mu _X ,\sigma _X^2 ) \) 与 \( N(\mu _Y ,\sigma _Y^2
) \) 的样本,且两组样本相互独立,\( \bar {X},\bar {Y},S_X^2 ,S_Y^2
\) 分别表示样本均值与样本方差,则
(1)\[\frac{S_X^2 /S_Y^2 }{\sigma _X^2 /\sigma _Y^2 }\sim F(n-1,m-1)\]
(2)如果 \( \sigma _X^2 =\sigma _Y^2 =\sigma ^2 \),\[\frac{(\bar {X}-\bar
{Y})-(\mu _X -\mu _Y )}{S_w \sqrt {\frac{1}{n}+\frac{1}{m}} }\sim
t(n+m-2)\]
其中 \( S_w^ =\sqrt {\frac{(n_X -1)S_X^2 +(n_Y -1)S_Y^2 }{n_X +n_Y -2}} \)。
该定理用到了 \( F \) 分布,它与 \( t \) 分布个 \( \chi^2 \) 分布同等重要,称它们为统计学中的''三大分布''。
\( F \) 分布的定义
设 \( X\sim \chi ^2(n) \),\( Y\sim \chi ^2(m) \),且 \( X \) 与 \( Y \) 相互独立。则称随机变量
\[
F=\frac{X/n}{Y/m}
\]服从参数为 \( n \) 和 \( m \) 的 \( F \) 分布,记为 \( F\sim
F(n,m) \)。其中,\( n \) 和 \( m \) 称为 \( F \) 分布的第一自由度和第二自由度。
可以证明:第一自由度为 \( n \),第二自由度为 \( m \) 的 \( F \) 分布的密度函数为
\[
f(x)=\left\{ {\begin{array}{ll}
\frac{\Gamma \left( {\frac{n+m}{2}} \right)}{\Gamma \left( {\frac{n}{2}}
\right)\Gamma \left( {\frac{m}{2}} \right)}\left( {\frac{n}{m}}
\right)^{\frac{n}{2}}x^{\frac{n}{2}-1}\left( {1+\frac{nx}{m}}
\right)^{-\frac{n+m}{2}},&x>0 \\
0,& x\le 0 \\
\end{array}} \right.
\]当自由度 \( n \) 和 \( m \) 取不同值时,\( F \) 分布的密度函数曲线如图1所示。
\( F \) 分布具有如下性质:
性质1:若 \( F\sim F(n,m) \),则 \( \frac{1}{F}\sim F(m,n) \)
性质2:若 \( T\sim t(n) \),则 \( T^2\sim F(1,n) \)
请同学们自己证明。
例:设 \( X_1 ,X_2 ,\cdots ,X_8 \) 是来自正态总体 \( X\sim N(0,2^2) \) 的样本。令
\[
Y=\frac{(X_1 -X_2 )^2+(X_3 +X_4 )^2}{\sum\limits_{i=5}^8 {X_i^2 } }
\]利用 \( F \) 分布的定义,试判断统计量 \( Y \) 的分布。
解:因 \( X_1 -X_2 \sim N(0,8) \),\( X_3 +X_4 \sim N(0,8) \),故
\[\frac{X_1 -X_2 }{2\sqrt 2 }\sim N(0,1),\frac{X_3 +X_4 }{2\sqrt 2 }\sim
N(0,1)\]则\[Y_1 =\frac{(X_1 -X_2 )^2}{8}+\frac{(X_3 +X_4 )^2}{8}\sim \chi ^2(2)\]
同时,\( \frac{X_i }{2}\sim N(0,1) \),\( i=5,6,7,8 \)。则
\[Y_2 =\frac{1}{4}\sum\limits_{i=5}^8 {X_i^2 } \sim \chi ^2(4)\]
又因 \( Y_1 \) 和 \( Y_2 \) 相互独立,则由 \( F \) 分布的定义得\[
Y=\frac{Y_1 /2}{Y_2 /4}=\frac{(X_1 -X_2 )^2+(X_3 +X_4
)^2}{\sum\limits_{i=5}^8 {X_i^2 } }\sim F(2,4)
\]
注意: \( F \) 分布的定义中的条件。
\( F \) 分布是作为方差比值的分布而自然产生的,在统计推断中具有重要作用。对两个正态总体方差相等的假设检验、方差分析中总体是否相等的检验以及回归分析中回归模型显著性检验等,都需要构造服从 \( F \) 分布的检验统计量。
在引例中,如果将高纤维含量的谷物食品分为高、中、低三类,做试验获得三组样本数据,欲鉴别这三组数据是否有显著差异。如果假定三组数据都来自同方差的正态分布,则问题转换为三个正态总体的理论均值是否相等的问题,这就是方差分析的问题,需要用到 \( F \) 统计量和它的分布。
为了使同学们掌握三大分布,试根据它们的分布定义,思考如下题目:
思考题1:设 \( X_1 ,X_2 \sim N(0,1) \),且 \( X_1 ,X_2 \) 相互独立,试确定常数 \( c \),使得
\[
P\left\{ {\frac{(X_1 +X_2 )^2}{(X_1 +X_2 )^2+(X_1 -X_2 )^2}>c} \right\}=0.1
\]
思考题2:设 \( X_1 ,X_2 ,\cdots ,X_m ,X_{m+1} ,\cdots ,X_{m+n} \) 是来自总体 \( X\sim
N(0,\sigma ^2) \) 的样本,试确定下来统计量的分布:
1) \( Y_1 =\frac{\sqrt n \sum\limits_{i=1}^m {X_i } }{\sqrt m \sqrt
{\sum\limits_{i=m+1}^{m+n} {X_i^2 } } } \);
2) \( Y_2 =\frac{n\sum\limits_{i=1}^m {X_i^2 }
}{m\sum\limits_{i=m+1}^{m+n} {X_i^2 } } \);
3) \( Y_3 =\frac{1}{m\sigma ^2}\left( {\sum\limits_{i=1}^m {X_i } }
\right)^2+\frac{1}{n\sigma ^2}\left( {\sum\limits_{i=m+1}^{m+n} {X_i
} } \right)^2 \).
-课程发展概况及概率的三要素
--讲义下载
--拓展知识
-第一章第一节测试题
-古典概率
--讲义下载
--拓展知识
-第一章第二节测试题
-几何概率
--讲义下载
--拓展知识
-第一章第三节测试题
-条件概率与乘法公式
--讲义下载
--拓展知识
-第一章第四节测试题
-全概率公式
--讲义下载
--拓展知识
-第一章第五节测试题
-贝叶斯公式
--讲义下载
--拓展知识
-第一章第六节测试题
-事件的独立性及应用
--讲义下载
--拓展知识
-第一章第七节测试题
-讨论
--“三门”问题
-第一章测试题
-随机变量及其分布
--讲义下载
--拓展知识
-第二章第一节测试题
-一类离散型随机变量的分布
--讲义下载
--拓展知识
-第二章第二节测试题
-泊松分布及泊松定理
--讲义下载
--拓展知识
-第二章第三节测试题
-均匀分布与指数分布
--讲义下载
--拓展知识
-第二章第四节测试题
-正态分布
--讲义下载
--拓展知识
-第二章第五节测试题
-连续型随机变量函数的分布
--讲义下载
--拓展知识
-第二章第六节测试题
-讨论
--分布之间关系
-第二章测试题
-多维随机变量及分布(一)
--讲义下载
--拓展知识
-第三章第一节测试题
-多维随机变量及分布(二)
--讲义下载
--拓展知识
-第三章第二节测试题
-边缘分布律和边缘密度
--讲义下载
--拓展知识
-第三章第三节测试题
-条件分布与随机变量的独立性
--讲义下载
--拓展知识
-第三章第四节测试题
-随机变量极值的分布
--讲义下载
--拓展知识
-第三章第五节测试题
-随机变量和的分布
--讲义下载
--拓展知识
-第三章第六节测试题
-数形结合求解函数的分布
--讲义下载
--拓展知识
-第三章第七节测试题
-讨论
--分布类的和不变性
-第三章测试题
-数学期望和方差的定义
--讲义下载
--拓展知识
-第四章第一节测试题
-数学期望和方差的应用
--讲义下载
--拓展知识
-第四章第二节测试题
-数学期望的线性性质及应用
--讲义下载
--拓展知识
-第四章第三节测试题
-方差的性质与协方差
--讲义下载
--拓展知识
-第四章第四节测试题
-标准化与相关系数
--讲义下载
--拓展知识
-第四章第五节测试题
-讨论
-第四章测试题
-大数定律
--课程讲义下载
--拓展知识
-第五章第一节测试题
-中心极限定理
--讲义下载
--拓展知识
-第五章第二节测试题
-讨论
--用电量的正态假设
-第五章测试题
-数理统计的基本概念
--讲义下载
--拓展知识
-第六章第一节测试题
-单样本均值统计量的分布
--讲义下载
--拓展知识
-第六章第二节测试题
-单样本方差统计量的分布
--讲义下载
--拓展知识
-第六章第三节测试题
-讨论
--保险损失分布
-第六章测试题
-什么是参数估计
--讲义下载
--拓展知识
-第七章第一节测试题
-矩估计
--讲义下载
--拓展知识
-第七章第二节测试题
-似然原理与似然函数
--讲义下载
--拓展知识
-第七章第三节测试题
-连续型分布的似然估计
--讲义下载
--拓展知识
-第七章第四节测试题
-一类离散总体的似然估计
--讲义下载
--拓展知识
-第七章第五节测试题
-区间估计
--讲义下载
--拓展知识
-第七章第六节测试题
-讨论
--湖中有多少条鱼?
-第七章测试题
-假设检验的基本原理
--讲义下载
--拓展知识
-第八章第一节测试题
-两类错误
--讲义下载
--拓展知识
-第八章第二节测试题
-正态总体均值的检验
--讲义下载
--拓展知识
-第八章第三节测试题
-正态总体方差的检验
--讲义下载
--拓展知识
-第八章第四节测试题
-卡方拟合检验
--讲义加载
--拓展知识
-第八章第五节测试题
-讨论
-第八章测试题
-一元线性回归(最小二乘估计)
--讲义下载
--拓展知识
-第九章第一节测试题
-一元线性回归(相关系数检验)
--讲义下载
--拓展知识
-第九章第二节测试题
-讨论
--火灾损失的因素
-第九章测试题