当前课程知识点:寻据而来-药学数据统计 > 第三章 试验样本的均值比较 > 3.5 同环境下多组数据对比 > 3.5 同环境下多组数据对比
同学们好
今天我们讲第三章第五节
多组数据的差异性比较
我们学习多组数据的差异性比较
其实就是学习单因素方差分析检验
一般采用F检验
在生产实践和科学试验中
影响某一事物的因素往往很多
怎样确定某个因素的影响
就需要进行方差分析
方差分析就是在有关因素中找出有显著影响的那些因素的方法
在实验工作中
有时我们把其他一切因素
都安排在固定不变的状态
只就某个因素进行实验
先确定这个因素的若干水平
然后在每个水平里做若干重复试验
以确定该因素对试验结果的影响
这种试验方法
统计学上称为单因素方差分析
单因素方差分析由于需在不同水平下重复试验
因而会产生出同条件下的多组数据
对多组数据进行差异性分析
就可以判断出该因素是否影响试验结果
我们接着学习单因素方差分析前提条件
设某因素有k个水平
第i个水平下
做 ni 次试验
i=1 2 ···n
设总体是正态分布
每个总体下
的水平所得到的实验数据
看成是从正态总体中抽取出来的样本
不同水平下的总体方差认为是相等的
也就是齐性的
实验要相互独立
我们接着学习单因素方差分析步骤
首先也是提出原假设H0
这里是假定多组样本数据的总体均值相同
也就是µ1=µ2=µ3= ···=µk
备择假设H1表示这些均数不完全相同
接着是选取统计量
在选择统计量之前
先看实验设计
假设该因素包含k个水平
在每个水平下做ni次试验
i=1 2 ···k
我们看着这个表格
N表示所有试验的总次数
-Xi
表示第i个水平下的样本平均值
X表示所有样本的总平均值
接着我们算出总离差平方和
什么是总离差平方和呢
就是
所有样本值与其总平均值偏差的平方和
通过最终整理化简可以得到总离差平方和SS
大家看到这个公式
它分为两部分
从总离差平方和SS公式来看
它是有两项之和组成
一个是组内离差平方和SSe
一个是组间离差平方和SSA
组内离差平方和它表示试验中的随机误差
即各个样本值对本组均值离差平方和的总和
组间离差平方和它表示试验中的系统误差
即各组均值对总平均值的离差平方和
于是有
总离差平方和
就等于组内离差平方和
加上组间离差平方和
我们接着学习自由度概念
自由度等于
统计量中独立变量的个数减去约束条件个数
组内离差平方和SSe中有K个约束条件
独立变量的总数为N
于是就有组内离差平方和的自由度
fe=N-K
组间离差平方和SSA中有K个独立变量
约束条件只有一个
于是就有组间离差平方和的自由度
fA=K-1
我们定义两个概念
组内方差和组间方差
组内方差等于
SSe比上它的自由度N-K
组间方差SA的平方等于
SSA比上它的自由度k-1
当原假设H0
就是µ1=µ2=µ3= ···=µk成立
而且它们的方差齐性时
我们就选取统计量F
F等于SA的平方比上Se的平方
它服从第一自由度是k-1
第二自由度是N-K的f分布
然后根据显著水平α
查出F分布的临界值Fα(K-1,N-K)
注意这里临界值的第一
第二自由度与F统计量的自由度一致
最后把F统计量的值
与临界值Fα(K-1,N-K)比较大小
当F> Fα(K-1,N-K)时
拒绝H0
接受H1
可以认为这些因素水平对结果有显著影响
当F< Fα(K-1,N-K)时
接受原假设H0
就认为这些因素水平对结果是无影响的
我们接着来看单因素方差分析的计算
为了计算出组内离差平方和SSe
及组间离差平方和SSA
根据它们的定义公式
推出更容易计算的两个公式
我们来看这两个公式
接着来看例题一
为考察工艺对花粉中的氨基酸百分含量的影响
某药厂用四种不同工艺对花粉进行处理
测得氨基酸百分含量如下表
试判断四种不同工艺处理间的氨基酸百分含量
有无显著性差异
α=0.01
我们看着这个表格
在表格中已经把每一列样本数据的和
和的平方
平方和都算出来了
等下我们只需套公式就可以算出统计量
首先第一步
提出原假设H0和备择假设H1
然后根据表格中的数据算出组内离差平方和SSe
以及组间离差平方和SSA
接着按公式算出
组间方差
SA平方=SSA/K-1=1.799
组内方差
Se平方=SSe/N-K=0.00358
然后第二步算出统计量F
F= SA平方/ Se平方=502.514
第三步
我们根据显著水平α=0.01查临界值表
查出F0.01(3,12)=5.95
第四步比较统计量F与临界值大小
由于我们统计的
F=502.514> F0.01(3,12)=5.95
故拒绝H0
接受H1
即四种不同的工艺处理对花粉中氨基酸百分含量有显著影响
我们接着小结一下这一节的主要内容
多组数据的差异性比较
它是单因素方差分析
要求各水平的数据方差齐性
它本质就是多组数据差异性的假设检验
第一步
提出多组数据的总体均值相同和不完全相同
第二步
根据总离差平方和
组内离差平方和
组间离差平方和
求出统计量F
第三步
根据显著水平查出临界值
最后一步
比较统计量与临界值大小
从而决定是接受原假设H0还是备择假设H1
好了
这节课我们就讲到这里
再见
-1.1 数据需要分析吗
-1.2 课程纲要及参考源
-1.3 数据分析的对象和任务
-1.4 从数据中获取信息
-第一章习题
-2.1 误差可以避免吗
-2.2 误差检验
--2.2 误差检验
-2.3 发现异常值
-2.4 误差是可以传递的
-2.5 数据的正态性检验
-2.6 统计助手---软件工具的介绍
-第二章习题
-3.1 各组间的差异可以衡量吗
-3.2 对照标准值比较差异
-3.3 两组数据的差异性比较
-3.4 两组配对数据差异性比较
-3.5 同环境下多组数据对比
-第三章习题
-4.1 有因就有果吗
-4.2 相关与回归方程的建立与检验
-4.3 多元回归及可信赖检验
-4.4 应当避免的数据坑
-第四章习题
-5.1 实验需要设计吗
-5.2 两因素的方差分析
-5.3 全因子设计实验
-5.4 部分因子设计实验
-5.5 响应曲面实验设计
-5.6 正交试验设计
-5.7 均匀设计实验
-5.8 无附加约束的混料实验设计
-5.9 有附加约束的混料设计
-5.10 均匀混料实验设计
-第五章习题
-6.1 聚类分析
--6.1 聚类分析
-6.2 判别分析
--6.2 判别分析
-第六章习题
-7.1 麻辛石甘汤与新冠疫情
-7.2 中药注射剂再评价
-7.3 幸存者偏差