当前课程知识点:概率论与数理统计 >  第6章 数理统计的基本概念 >  单样本方差统计量的分布 >  拓展知识

返回《概率论与数理统计》慕课在线视频课程列表

拓展知识资料文件与下载

拓展知识

                  双正态总体的检验统计量及分布

引例: 某食品生产厂家宣传声称,高纤维含量的谷物食品除了能够降低各种癌症的发病率外,也具有减肥的功效。为此,随机调查了27人,其中食用高纤维谷物的有10人,不食用高纤维谷物的有17人。下表是这两类人的午餐中卡路里含量数据。假设卡路里含量服从正态分布,依据抽样数据,问高纤维组与非高纤维组人的午餐卡路里含量是否显著不同?
\[
\begin{array}{|c|cccccc|}
\hline
\mbox{高纤维组 }x_i&
592.77& 602.01& 612.87&711.56& 608.60&  608.74\\
&  647.61& 565.57& 537.57&498.23 &&\\
\hline
\mbox{非高纤维组 }y_j &
675.15& 611.67 &669.14& 671.22 &726.03& 690.35\\
&668.78&750.75 &715.91& 631.21 & 757.89& 605.56\\
& 680.58 &780.92&766.31&782.33&758.11& \\
\hline
\end{array}
\]假设以上两组数据 \( (x_1 ,\cdots ,x_{10} ),(y_1 ,\cdots ,y_{17}
) \) 分别来自两个正态总体 \( N(\mu _X ,\sigma _X ^2) \),\( N(\mu _Y ,\sigma _Y
^2) \)。如果 \( \mu _X =\mu _Y  \),\( \sigma _X^2 =\sigma _Y^2
 \),则表明这两组数据无显著差异否则,它们有差异。

    要回答该问题需要采用假设检验的方法,其关键就是选择检验统计量和确定它的分布有如下的理论支撑。

定理: 设 \( X_1 ,X_2 ,\cdots ,X_n  \) 与 \( Y_1 ,Y_2 ,\cdots ,Y_m
 \) 分别是来自总体 \( N(\mu _X ,\sigma _X^2 ) \) 与 \( N(\mu _Y ,\sigma _Y^2
) \) 的样本,且两组样本相互独立,\( \bar {X},\bar {Y},S_X^2 ,S_Y^2
 \) 分别表示样本均值与样本方差,则
(1)\[\frac{S_X^2 /S_Y^2 }{\sigma _X^2 /\sigma _Y^2 }\sim F(n-1,m-1)\]
(2)如果 \( \sigma _X^2 =\sigma _Y^2 =\sigma ^2 \),\[\frac{(\bar {X}-\bar
{Y})-(\mu _X -\mu _Y )}{S_w \sqrt {\frac{1}{n}+\frac{1}{m}} }\sim
t(n+m-2)\]
其中 \( S_w^ =\sqrt {\frac{(n_X -1)S_X^2 +(n_Y -1)S_Y^2 }{n_X +n_Y -2}}  \)。

   该定理用到了 \( F \) 分布,它与 \( t \) 分布个 \( \chi^2 \) 分布同等重要,称它们为统计学中的''三大分布''。

 \( F \) 分布的定义
    设 \( X\sim \chi ^2(n) \),\( Y\sim \chi ^2(m) \),且 \( X \) 与 \( Y \) 相互独立。则称随机变量
\[
F=\frac{X/n}{Y/m}
\]服从参数为 \( n \) 和 \( m \) 的 \( F \) 分布,记为 \( F\sim
F(n,m) \)。其中,\( n \) 和 \( m \) 称为 \( F \) 分布的第一自由度和第二自由度。

    可以证明:第一自由度为 \( n \),第二自由度为 \( m \) 的 \( F \) 分布的密度函数为
\[
f(x)=\left\{ {\begin{array}{ll}
 \frac{\Gamma \left( {\frac{n+m}{2}} \right)}{\Gamma \left( {\frac{n}{2}}
\right)\Gamma \left( {\frac{m}{2}} \right)}\left( {\frac{n}{m}}
\right)^{\frac{n}{2}}x^{\frac{n}{2}-1}\left( {1+\frac{nx}{m}}
\right)^{-\frac{n+m}{2}},&x>0 \\
0,& x\le 0 \\
 \end{array}} \right.
\]当自由度 \( n \) 和 \( m \) 取不同值时,\( F \) 分布的密度函数曲线如图1所示。
                                   

 \( F \) 分布具有如下性质:

    性质1:若 \( F\sim F(n,m) \),则 \( \frac{1}{F}\sim F(m,n) \)
    性质2:若 \( T\sim t(n) \),则 \( T^2\sim F(1,n) \)

请同学们自己证明。

例:设 \( X_1 ,X_2 ,\cdots ,X_8  \) 是来自正态总体 \( X\sim N(0,2^2) \) 的样本。令
\[
Y=\frac{(X_1 -X_2 )^2+(X_3 +X_4 )^2}{\sum\limits_{i=5}^8 {X_i^2 } }
\]利用 \( F \) 分布的定义,试判断统计量 \( Y \) 的分布。

解:因 \( X_1 -X_2 \sim N(0,8) \),\( X_3 +X_4 \sim N(0,8) \),故
\[\frac{X_1 -X_2 }{2\sqrt 2 }\sim N(0,1),\frac{X_3 +X_4 }{2\sqrt 2 }\sim
N(0,1)\]则\[Y_1 =\frac{(X_1 -X_2 )^2}{8}+\frac{(X_3 +X_4 )^2}{8}\sim \chi ^2(2)\]
同时,\( \frac{X_i }{2}\sim N(0,1) \),\( i=5,6,7,8 \)。则
\[Y_2 =\frac{1}{4}\sum\limits_{i=5}^8 {X_i^2 } \sim \chi ^2(4)\]
又因 \( Y_1  \) 和 \( Y_2  \) 相互独立,则由 \( F \) 分布的定义得\[
Y=\frac{Y_1 /2}{Y_2 /4}=\frac{(X_1 -X_2 )^2+(X_3 +X_4
)^2}{\sum\limits_{i=5}^8 {X_i^2 } }\sim F(2,4)
\]
注意: \( F \) 分布的定义中的条件。

 \( F \) 分布是作为方差比值的分布而自然产生的,在统计推断中具有重要作用。对两个正态总体方差相等的假设检验、方差分析中总体是否相等的检验以及回归分析中回归模型显著性检验等,都需要构造服从 \( F \) 分布的检验统计量。
    在引例中,如果将高纤维含量的谷物食品分为高、中、低三类,做试验获得三组样本数据,欲鉴别这三组数据是否有显著差异。如果假定三组数据都来自同方差的正态分布,则问题转换为三个正态总体的理论均值是否相等的问题,这就是方差分析的问题,需要用到 \( F \) 统计量和它的分布。

    为了使同学们掌握三大分布,试根据它们的分布定义,思考如下题目:

思考题1:设 \( X_1 ,X_2 \sim N(0,1) \),且 \( X_1 ,X_2  \) 相互独立,试确定常数 \( c \),使得
\[
P\left\{ {\frac{(X_1 +X_2 )^2}{(X_1 +X_2 )^2+(X_1 -X_2 )^2}>c} \right\}=0.1
\]
思考题2:设 \( X_1 ,X_2 ,\cdots ,X_m ,X_{m+1} ,\cdots ,X_{m+n}  \) 是来自总体 \( X\sim
N(0,\sigma ^2) \) 的样本,试确定下来统计量的分布:
    1) \( Y_1 =\frac{\sqrt n \sum\limits_{i=1}^m {X_i } }{\sqrt m \sqrt
{\sum\limits_{i=m+1}^{m+n} {X_i^2 } } } \);
    2) \( Y_2 =\frac{n\sum\limits_{i=1}^m {X_i^2 }
}{m\sum\limits_{i=m+1}^{m+n} {X_i^2 } } \);
    3) \( Y_3 =\frac{1}{m\sigma ^2}\left( {\sum\limits_{i=1}^m {X_i } }
\right)^2+\frac{1}{n\sigma ^2}\left( {\sum\limits_{i=m+1}^{m+n} {X_i
} } \right)^2 \).

下一节:保险损失分布

返回《概率论与数理统计》慕课在线视频列表

概率论与数理统计课程列表:

第1章 随机事件与概率

-课程发展概况及概率的三要素

--课程发展概况及概率的三要素(刘琼荪)--9:09min

--讲义下载

--拓展知识

-第一章第一节测试题

-古典概率

--古典概率(黎雅莲)--8:27min

--讲义下载

--拓展知识

-第一章第二节测试题

-几何概率

--几何概率(李曼曼)--7:01

--讲义下载

--拓展知识

-第一章第三节测试题

-条件概率与乘法公式

--条件概率及乘法公式(刘琼荪)--8:00min

--讲义下载

--拓展知识

-第一章第四节测试题

-全概率公式

--全概率公式(荣腾中)--9.57min

--讲义下载

--拓展知识

-第一章第五节测试题

-贝叶斯公式

--贝叶斯公式(荣腾中)-10:00min

--讲义下载

--拓展知识

-第一章第六节测试题

-事件的独立性及应用

--事件的独立性及应用(刘琼荪)--9:53min

--讲义下载

--拓展知识

-第一章第七节测试题

-讨论

--“三门”问题

-第一章测试题

第2章 一维随机变量及其分布

-随机变量及其分布

--随机变量及其分布(刘琼荪)--8:05min

--讲义下载

--拓展知识

-第二章第一节测试题

-一类离散型随机变量的分布

--一类离散型随机变量的分布(李曼曼)--08:57min

--讲义下载

--拓展知识

-第二章第二节测试题

-泊松分布及泊松定理

--泊松分布与泊松定理(李曼曼)--7:40min

--讲义下载

--拓展知识

-第二章第三节测试题

-均匀分布与指数分布

--均匀分布与指数分布(李曼曼)--08:36min

--讲义下载

--拓展知识

-第二章第四节测试题

-正态分布

--正态分布(刘琼荪)--8:40min

--讲义下载

--拓展知识

-第二章第五节测试题

-连续型随机变量函数的分布

--连续型随机变量函数的分布(黎雅莲)--09:58min

--讲义下载

--拓展知识

-第二章第六节测试题

-讨论

--分布之间关系

-第二章测试题

第3章 多维随机变量及其分布

-多维随机变量及分布(一)

--多维随机变量及其分布(一)(李曼曼)-08:03

--讲义下载

--拓展知识

-第三章第一节测试题

-多维随机变量及分布(二)

--多维随机变量及其分布(二)(李曼曼)-06:16min

--讲义下载

--拓展知识

-第三章第二节测试题

-边缘分布律和边缘密度

--边缘分布律与边缘密度(黎雅莲)-07:55min

--讲义下载

--拓展知识

-第三章第三节测试题

-条件分布与随机变量的独立性

--条件分布与随机变量的独立性(黎雅莲)-11:15min

--讲义下载

--拓展知识

-第三章第四节测试题

-随机变量极值的分布

--随机变量的极值分布(荣腾中)-09:55min

--讲义下载

--拓展知识

-第三章第五节测试题

-随机变量和的分布

--随机变量和的分布(荣腾中)-10:02min

--讲义下载

--拓展知识

-第三章第六节测试题

-数形结合求解函数的分布

--数形结合求解函数的分布(荣腾中)-08:59min

--讲义下载

--拓展知识

-第三章第七节测试题

-讨论

--分布类的和不变性

-第三章测试题

第4章 随机变量的数字特征

-数学期望和方差的定义

--数学期望与方差的定义(李曼曼)-07:25min

--讲义下载

--拓展知识

-第四章第一节测试题

-数学期望和方差的应用

--数学期望和方差的应用(荣腾中)-08:59min

--讲义下载

--拓展知识

-第四章第二节测试题

-数学期望的线性性质及应用

--数学期望的线性性质和应用(荣腾中)-08:56min

--讲义下载

--拓展知识

-第四章第三节测试题

-方差的性质与协方差

--方差的性质与协方差(荣腾中)-11:15min

--讲义下载

--拓展知识

-第四章第四节测试题

-标准化与相关系数

--标准化与相关系数(荣腾中)-11:24min

--讲义下载

--拓展知识

-第四章第五节测试题

-讨论

--相关关系与因果关系

-第四章测试题

第5章 极限定理

-大数定律

--大数定律(胥斌)-13:17min

--课程讲义下载

--拓展知识

-第五章第一节测试题

-中心极限定理

--中心极限定理(胥斌)-09:48min

--讲义下载

--中心极限定理动态演示

--拓展知识

-第五章第二节测试题

-讨论

--用电量的正态假设

-第五章测试题

第6章 数理统计的基本概念

-数理统计的基本概念

--数理统计的基本概念(刘琼荪)-10:12min

--讲义下载

--拓展知识

-第六章第一节测试题

-单样本均值统计量的分布

--单样本均值统计量的分布(刘琼荪)-12:05min

--讲义下载

--拓展知识

-第六章第二节测试题

-单样本方差统计量的分布

--单样本方差统计量的分布(刘琼荪)-10:40min

--讲义下载

--拓展知识

-第六章第三节测试题

-讨论

--保险损失分布

-第六章测试题

第7章 参数估计

-什么是参数估计

--参数与参数空间(荣腾中)-07:08min

--讲义下载

--拓展知识

-第七章第一节测试题

-矩估计

--矩估计(荣腾中)-09:14min

--讲义下载

--拓展知识

-第七章第二节测试题

-似然原理与似然函数

--似然原理与似然函数(荣腾中)-10:47min

--讲义下载

--拓展知识

-第七章第三节测试题

-连续型分布的似然估计

--连续型分布的似然估计(荣腾中)-07:41min

--讲义下载

--拓展知识

-第七章第四节测试题

-一类离散总体的似然估计

--一类离散型分布的似然估计(荣腾中)-09:51min

--讲义下载

--拓展知识

-第七章第五节测试题

-区间估计

--区间估计(荣腾中)-11:08min

--讲义下载

--拓展知识

-第七章第六节测试题

-讨论

--湖中有多少条鱼?

-第七章测试题

第8章 假设检验

-假设检验的基本原理

--假设检验的基本原理(荣腾中)-13:18min

--讲义下载

--拓展知识

-第八章第一节测试题

-两类错误

--两类错误(荣腾中)-11:37min

--讲义下载

--拓展知识

-第八章第二节测试题

-正态总体均值的检验

--单正态总体均值的假设检验(荣腾中)-12:59min

--讲义下载

--拓展知识

-第八章第三节测试题

-正态总体方差的检验

--单正态总体方差的假设检验(荣腾中)-09:25min

--讲义下载

--拓展知识

-第八章第四节测试题

-卡方拟合检验

--卡方拟合检验(刘琼荪)-08:37min

--讲义加载

--拓展知识

-第八章第五节测试题

-讨论

--有没有第II类错误?

-第八章测试题

第9章 回归分析

-一元线性回归(最小二乘估计)

--一元线性回归—最小二乘估计(黎雅莲)-11:10min

--讲义下载

--拓展知识

-第九章第一节测试题

-一元线性回归(相关系数检验)

--相关系数检验(黎雅莲)-08:42min

--讲义下载

--拓展知识

-第九章第二节测试题

-讨论

--火灾损失的因素

-第九章测试题

拓展知识笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。