当前课程知识点:概率论与数理统计 > 第8章 假设检验 > 卡方拟合检验 > 拓展知识
正态性检验方法很多,这里主要介绍的卡方拟合检验法和正态概率纸检验法。
例:某银行储蓄所某天营业期间顾客依次到达某柜台的时间间隔(单位:分钟)数据如下表1。
\[\mbox{表1 顾客到达某银行储蓄所柜台的间隔时间(单位:分钟)}\]\[\begin{array}{|l|l|l|l|l|l|l|l|l|}
\hline
6.62&
13.68&
11.55&
4.46&
3.03&
3.80&
6.77&
14.25&
7.34 \\
\hline
7.75&
3.22&
11.01&
1.05&
4.93&
6.99&
10.36&
14.44&
7.19 \\
\hline
5.85&
8.48&
7.26&
9.28&
9.95&
11.50&
11.83&
1.19&
9.42 \\
\hline
10.98&
8.21&
5.96&
10.79&
6.13&
15.19&
12.87&
10.44&
7.20 \\
\hline
4.89&
10.78&
4.16&
9.52&
5.73&
7.99&
6.01&
5.85&
4.96 \\
\hline
\end{array}
\]试在显著水平0.05下检验这些数据是否来自正态分布?
检验方法一 (卡方拟合检验)
设顾客到达银行储蓄所柜台的时间间隔为 \( X \),从45个观测数据中容易获得: \( x_{(1)}
=1.05,\;\;x_{(45)} =15.19 \),人为地将数据分为5个组: \( A_1 =\{X\le 4\},\;A_2
=\{4<X\le 7\} \),\( A_3 =\{7<X\le 10\},\;\;\;A_4 =\{10<X\le 13\} \),\( A_5
=\{X>13\} \),统计各个事件出现的频数,分别为:4,15,12,10,4。
提出卡方检验问题: \( H_0 \) :数据来自正态总体; \( H_1 \) :数据来自非正态总体
首先,确定在 \( H_0 \) 成立条件下正态分布 \( N(\mu ,\sigma ^2
) \) 中两个参数的最大似然估计值为 \( \hat {\mu }=\bar {x}\approx 8.019,\;\;\hat
{\sigma }=\sqrt {m_2^\ast } \approx 3.435 \)。
其次,计算在 \( H_0 \) 的条件下\[
\hat {p}_1 =P\{X\le 4\}=\Phi \left( {\frac{4-8.019}{3.435}} \right)\approx
0.121.
\]\[
\hat {p}_2 =P\{4<X\le 7\}=\Phi \left( {\frac{7-8.019}{3.435}} \right)-\Phi
\left( {\frac{4-8.019}{3.435}} \right)\approx 0.262.
\]\[
\hat {p}_3 =P\{7<X\le 10\}\;=\Phi \left( {\frac{10-8.019}{3.435}}
\right)-\Phi \left( {\frac{7-8.019}{3.435}} \right)\approx 0.335
\]\[
\hat {p}_4 =P\{10<X\le 13\}\;=\Phi \left( {\frac{13-8.019}{3.435}}
\right)-\Phi \left( {\frac{10-8.019}{3.435}} \right)\approx 0.208
\]\[
\hat {p}_5 =P\{X>13\}=1-\sum\limits_{i=1}^4 {\hat {p}_i } =0.074
\]
检验统计量 \( \hat {\chi }^2=\sum\limits_{i=1}^m {\frac{(v_i -n\hat {p}_i
)^2}{n\hat {p}_i }} \) 的样本值计算过程见表2。
\[\mbox{表2 检验统计量 \( \hat {\chi }^2 \) 的样本值计算表}\]\[\begin{array}{|c|c|c|c|c|c|}
\hline
Interval&
Frequency&
\hat {p}_i &
n\hat {p}_i &
(v_i -n\hat {p}_i )^2&
(v_i -n\hat {p}_i )^2/np_i \\
\hline
\le 4&
4&
0.121&
5.445 &
2.088&
0.383 \\
\hline
(4,7]&
15&
0.262&
11.790 &
10.304&
0.874 \\
\hline
(7,10]&
12&
0.335&
15.075 &
9.456&
0.627 \\
\hline
(10,13]&
10&
0.208&
9.360 &
0.410&
0.044 \\
\hline
>13&
4&
0.074&
3.330 &
0.449&
0.135 \\
\hline
\end{array}
\]
计算得到 \( \hat {\chi }^2 =2.063 \) 。在显著水平0.05下,拒绝域 \( \{\hat {\chi
}^2>\chi _{1-\alpha }^2 (5-1-2)\} \) 的临界值为 \( \chi _{1-\alpha }^2
(5-1-2)=\chi _{0.95}^2 (2)\approx 5.992 \) . 由于 \( \hat {\chi }^2
=2.063<5.992 \) 。
所以,在显著水平0.05下,不拒绝原假设,可以认为数据来自正态分布。
检验方法二 (正态概率纸检验)
正态概率纸检验总体的正态性的步骤:
(1)将样本值 \( x_1 ,x_2 ,\cdots ,x_n \) 按由小到大顺序排序为: \( x_{(1)} ,x_{(2)}
,\cdots ,x_{(n)} \) 。
(2)计算 \( F(x_{(i)} ),\left( {i=1,2,\cdots ,n} \right) \) 的估计值
\[\hat
{F}(x_{(i)} )=\frac{i-(3/8)}{n+(1/4)}\mbox{ or }\hat {F}(x_{(i)}
)=\frac{i}{n+1},i=1,2,\cdots ,n\]
(3)在正态概率纸上描出各点: \( (x_{(i)} ,\hat {F}(x_{(i)} ),i=1,2,\cdots ,n. \)
(4)判断: 若在正态概率纸上描出 \( n \) 个点: \( (x_{(i)} ,\hat {F}(x_{(i)} ),\left(
{i=1,2,\cdots ,n}
\right) \) 在一条直线附近,则认为该样本来自某正态分布;若这 \( n \) 个点明显不在一条直线附近,则认为该样本不是来自某正态分布。
由表1的数据,根据以上步骤,由公式
\[\hat {F}(x_{(i)}
)=\frac{i}{n+1},i=1,2,\cdots ,n
\]计算,在excel下对点画散点图如下:
图形显示, \( n \) 个点明显在红色直线附近,表明数据近似地来自正态分布 \( N(8.019,\;\;3.435^2) \)。
正态概率纸检验法在工程上常见,具体方法原理参见文献[1]。
参考文献:
[1] 钟波等.数理统计[M].北京:高等教育出版社,2015.2.
-课程发展概况及概率的三要素
--讲义下载
--拓展知识
-第一章第一节测试题
-古典概率
--讲义下载
--拓展知识
-第一章第二节测试题
-几何概率
--讲义下载
--拓展知识
-第一章第三节测试题
-条件概率与乘法公式
--讲义下载
--拓展知识
-第一章第四节测试题
-全概率公式
--讲义下载
--拓展知识
-第一章第五节测试题
-贝叶斯公式
--讲义下载
--拓展知识
-第一章第六节测试题
-事件的独立性及应用
--讲义下载
--拓展知识
-第一章第七节测试题
-讨论
--“三门”问题
-第一章测试题
-随机变量及其分布
--讲义下载
--拓展知识
-第二章第一节测试题
-一类离散型随机变量的分布
--讲义下载
--拓展知识
-第二章第二节测试题
-泊松分布及泊松定理
--讲义下载
--拓展知识
-第二章第三节测试题
-均匀分布与指数分布
--讲义下载
--拓展知识
-第二章第四节测试题
-正态分布
--讲义下载
--拓展知识
-第二章第五节测试题
-连续型随机变量函数的分布
--讲义下载
--拓展知识
-第二章第六节测试题
-讨论
--分布之间关系
-第二章测试题
-多维随机变量及分布(一)
--讲义下载
--拓展知识
-第三章第一节测试题
-多维随机变量及分布(二)
--讲义下载
--拓展知识
-第三章第二节测试题
-边缘分布律和边缘密度
--讲义下载
--拓展知识
-第三章第三节测试题
-条件分布与随机变量的独立性
--讲义下载
--拓展知识
-第三章第四节测试题
-随机变量极值的分布
--讲义下载
--拓展知识
-第三章第五节测试题
-随机变量和的分布
--讲义下载
--拓展知识
-第三章第六节测试题
-数形结合求解函数的分布
--讲义下载
--拓展知识
-第三章第七节测试题
-讨论
--分布类的和不变性
-第三章测试题
-数学期望和方差的定义
--讲义下载
--拓展知识
-第四章第一节测试题
-数学期望和方差的应用
--讲义下载
--拓展知识
-第四章第二节测试题
-数学期望的线性性质及应用
--讲义下载
--拓展知识
-第四章第三节测试题
-方差的性质与协方差
--讲义下载
--拓展知识
-第四章第四节测试题
-标准化与相关系数
--讲义下载
--拓展知识
-第四章第五节测试题
-讨论
-第四章测试题
-大数定律
--课程讲义下载
--拓展知识
-第五章第一节测试题
-中心极限定理
--讲义下载
--拓展知识
-第五章第二节测试题
-讨论
--用电量的正态假设
-第五章测试题
-数理统计的基本概念
--讲义下载
--拓展知识
-第六章第一节测试题
-单样本均值统计量的分布
--讲义下载
--拓展知识
-第六章第二节测试题
-单样本方差统计量的分布
--讲义下载
--拓展知识
-第六章第三节测试题
-讨论
--保险损失分布
-第六章测试题
-什么是参数估计
--讲义下载
--拓展知识
-第七章第一节测试题
-矩估计
--讲义下载
--拓展知识
-第七章第二节测试题
-似然原理与似然函数
--讲义下载
--拓展知识
-第七章第三节测试题
-连续型分布的似然估计
--讲义下载
--拓展知识
-第七章第四节测试题
-一类离散总体的似然估计
--讲义下载
--拓展知识
-第七章第五节测试题
-区间估计
--讲义下载
--拓展知识
-第七章第六节测试题
-讨论
--湖中有多少条鱼?
-第七章测试题
-假设检验的基本原理
--讲义下载
--拓展知识
-第八章第一节测试题
-两类错误
--讲义下载
--拓展知识
-第八章第二节测试题
-正态总体均值的检验
--讲义下载
--拓展知识
-第八章第三节测试题
-正态总体方差的检验
--讲义下载
--拓展知识
-第八章第四节测试题
-卡方拟合检验
--讲义加载
--拓展知识
-第八章第五节测试题
-讨论
-第八章测试题
-一元线性回归(最小二乘估计)
--讲义下载
--拓展知识
-第九章第一节测试题
-一元线性回归(相关系数检验)
--讲义下载
--拓展知识
-第九章第二节测试题
-讨论
--火灾损失的因素
-第九章测试题