当前课程知识点:寻据而来-药学数据统计 >  第三章 试验样本的均值比较 >  3.5 同环境下多组数据对比 >  3.5 同环境下多组数据对比

返回《寻据而来-药学数据统计》慕课在线视频课程列表

3.5 同环境下多组数据对比在线视频

下一节:4.1 有因就有果吗

返回《寻据而来-药学数据统计》慕课在线视频列表

3.5 同环境下多组数据对比课程教案、知识点、字幕

同学们好

今天我们讲第三章第五节

多组数据的差异性比较

我们学习多组数据的差异性比较

其实就是学习单因素方差分析检验

一般采用F检验

在生产实践和科学试验中

影响某一事物的因素往往很多

怎样确定某个因素的影响

就需要进行方差分析

方差分析就是在有关因素中找出有显著影响的那些因素的方法

在实验工作中

有时我们把其他一切因素

都安排在固定不变的状态

只就某个因素进行实验

先确定这个因素的若干水平

然后在每个水平里做若干重复试验

以确定该因素对试验结果的影响

这种试验方法

统计学上称为单因素方差分析

单因素方差分析由于需在不同水平下重复试验

因而会产生出同条件下的多组数据

对多组数据进行差异性分析

就可以判断出该因素是否影响试验结果

我们接着学习单因素方差分析前提条件

设某因素有k个水平

第i个水平下

做 ni 次试验

i=1 2 ···n

设总体是正态分布

每个总体下

的水平所得到的实验数据

看成是从正态总体中抽取出来的样本

不同水平下的总体方差认为是相等的

也就是齐性的

实验要相互独立

我们接着学习单因素方差分析步骤

首先也是提出原假设H0

这里是假定多组样本数据的总体均值相同

也就是µ1=µ2=µ3= ···=µk

备择假设H1表示这些均数不完全相同

接着是选取统计量

在选择统计量之前

先看实验设计

假设该因素包含k个水平

在每个水平下做ni次试验

i=1 2 ···k

我们看着这个表格

N表示所有试验的总次数

-Xi

表示第i个水平下的样本平均值

X表示所有样本的总平均值

接着我们算出总离差平方和

什么是总离差平方和呢

就是

所有样本值与其总平均值偏差的平方和

通过最终整理化简可以得到总离差平方和SS

大家看到这个公式

它分为两部分

从总离差平方和SS公式来看

它是有两项之和组成

一个是组内离差平方和SSe

一个是组间离差平方和SSA

组内离差平方和它表示试验中的随机误差

即各个样本值对本组均值离差平方和的总和

组间离差平方和它表示试验中的系统误差

即各组均值对总平均值的离差平方和

于是有

总离差平方和

就等于组内离差平方和

加上组间离差平方和

我们接着学习自由度概念

自由度等于

统计量中独立变量的个数减去约束条件个数

组内离差平方和SSe中有K个约束条件

独立变量的总数为N

于是就有组内离差平方和的自由度

fe=N-K

组间离差平方和SSA中有K个独立变量

约束条件只有一个

于是就有组间离差平方和的自由度

fA=K-1

我们定义两个概念

组内方差和组间方差

组内方差等于

SSe比上它的自由度N-K

组间方差SA的平方等于

SSA比上它的自由度k-1

当原假设H0

就是µ1=µ2=µ3= ···=µk成立

而且它们的方差齐性时

我们就选取统计量F

F等于SA的平方比上Se的平方

它服从第一自由度是k-1

第二自由度是N-K的f分布

然后根据显著水平α

查出F分布的临界值Fα(K-1,N-K)

注意这里临界值的第一

第二自由度与F统计量的自由度一致

最后把F统计量的值

与临界值Fα(K-1,N-K)比较大小

当F> Fα(K-1,N-K)时

拒绝H0

接受H1

可以认为这些因素水平对结果有显著影响

当F< Fα(K-1,N-K)时

接受原假设H0

就认为这些因素水平对结果是无影响的

我们接着来看单因素方差分析的计算

为了计算出组内离差平方和SSe

及组间离差平方和SSA

根据它们的定义公式

推出更容易计算的两个公式

我们来看这两个公式

接着来看例题一

为考察工艺对花粉中的氨基酸百分含量的影响

某药厂用四种不同工艺对花粉进行处理

测得氨基酸百分含量如下表

试判断四种不同工艺处理间的氨基酸百分含量

有无显著性差异

α=0.01

我们看着这个表格

在表格中已经把每一列样本数据的和

和的平方

平方和都算出来了

等下我们只需套公式就可以算出统计量

首先第一步

提出原假设H0和备择假设H1

然后根据表格中的数据算出组内离差平方和SSe

以及组间离差平方和SSA

接着按公式算出

组间方差

SA平方=SSA/K-1=1.799

组内方差

Se平方=SSe/N-K=0.00358

然后第二步算出统计量F

F= SA平方/ Se平方=502.514

第三步

我们根据显著水平α=0.01查临界值表

查出F0.01(3,12)=5.95

第四步比较统计量F与临界值大小

由于我们统计的

F=502.514> F0.01(3,12)=5.95

故拒绝H0

接受H1

即四种不同的工艺处理对花粉中氨基酸百分含量有显著影响

我们接着小结一下这一节的主要内容

多组数据的差异性比较

它是单因素方差分析

要求各水平的数据方差齐性

它本质就是多组数据差异性的假设检验

第一步

提出多组数据的总体均值相同和不完全相同

第二步

根据总离差平方和

组内离差平方和

组间离差平方和

求出统计量F

第三步

根据显著水平查出临界值

最后一步

比较统计量与临界值大小

从而决定是接受原假设H0还是备择假设H1

好了

这节课我们就讲到这里

再见

寻据而来-药学数据统计课程列表:

第一章 数据分析概论

-1.1 数据需要分析吗

--1.1 数据需要分析吗

-1.2 课程纲要及参考源

--1.2课程纲要及参考源

-1.3 数据分析的对象和任务

--1.3数据分析的对象和任务

-1.4 从数据中获取信息

--1.4从数据中获取信息

-第一章习题

第二章 试验数据的误差分析

-2.1 误差可以避免吗

--2.1 误差可以避免吗

-2.2 误差检验

--2.2 误差检验

-2.3 发现异常值

--2.3 发现异常值

-2.4 误差是可以传递的

--2.4 误差是可以传递的

-2.5 数据的正态性检验

--2.5 数据的正态性检验

-2.6 统计助手---软件工具的介绍

--2.6 统计助手---软件工具的介绍

-第二章习题

第三章 试验样本的均值比较

-3.1 各组间的差异可以衡量吗

--3.1 各组间的差异可以衡量吗

-3.2 对照标准值比较差异

--3.2 对照标准值比较差异

-3.3 两组数据的差异性比较

--3.3 两组数据的差异性比较

-3.4 两组配对数据差异性比较

--3.4 两组配对数据差异性比较

-3.5 同环境下多组数据对比

--3.5 同环境下多组数据对比

-第三章习题

第四章 试验数据的回归分析

-4.1 有因就有果吗

--4.1 有因就有果吗

-4.2 相关与回归方程的建立与检验

--4.2相关与回归方程的建立与检验

-4.3 多元回归及可信赖检验

--4.3多元回归及可信性检验

-4.4 应当避免的数据坑

--4.4应当避免的数据坑

-第四章习题

第五章 试验设计

-5.1 实验需要设计吗

--5.1试验需要设计吗

-5.2 两因素的方差分析

--5.2两因素的方差分析

-5.3 全因子设计实验

--5.3全因子试验设计

-5.4 部分因子设计实验

--5.4部分因子试验设计

-5.5 响应曲面实验设计

--5.5响应曲面试验设计

-5.6 正交试验设计

--5.6正交试验设计

-5.7 均匀设计实验

--5.7均匀试验设计

-5.8 无附加约束的混料实验设计

--5.8无附加约束的混料试验设计

-5.9 有附加约束的混料设计

--5.9有附加约束的混料试验设计

-5.10 均匀混料实验设计

--5.10均匀混料试验设计

-第五章习题

第六章 聚类分析和判别分析

-6.1 聚类分析

--6.1 聚类分析

-6.2 判别分析

--6.2 判别分析

-第六章习题

专题1:透过数据看中药质量提升

-7.1 麻辛石甘汤与新冠疫情

--7.1麻辛石甘汤与新冠疫情

-7.2 中药注射剂再评价

--7.2 中药注射剂再评价

专题2:数据发现的启示--幸存者偏差

-7.3 幸存者偏差

--7.3 幸存者偏差

●课程思政--新冠肺炎疫情

-数理统计--新冠肺炎疫情讨论

●课程参考资料及视频

-课程参考资料

3.5 同环境下多组数据对比笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。