当前课程知识点:管理定量方法 > 第四章 数据的描述与统计推断 > 第十四节 假设检验(二) > 第十四节 假设检验(二)
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师
杨老师
第14节
介绍假设检验的第二个部分
我们前边已经讲过
假设检验
是推断统计的一种非常重要的方法
推断统计
我们讲了两大类的方法
第一 是参数估计
参数估计
就是直接通过样本
来估计总体参数的过程
而假设检验
是先假设
总体参数具备某一个特征
然后看样本提供的信息
是否与假设相矛盾
假设检验的基本步骤如下
第一 确定原假设和备择假设
第二 选定一个可以接受的显著性水平
第三 抽取样本容量为n的样本
并计算相应的统计量
第四 确定统计量的抽样分布规律
第五 根据选定的显著性水平
计算临界值
第六 确定决策的规则
第七 判断是否接受零假设
第八 得出研究的结论
根据我们所提供的
假设检验的基本步骤
我们来介绍三种典型的假设检验
第一种
单一总体均值的假设检验中的双尾检验
双尾检验
我们给了大家一道例题
北京二锅头
平均每瓶的净重
规定为100克
现有一批产品下线
如果不知道这批二锅头的重量
是否符合规定的要求
但是根据历史的经验
我们发现
每瓶酒的标准差
σ等于5克
在这个过程中
我们按照前面所讲述的
假设检验的基本流程来解题
第一步
首先我们先设出原假设和备择假设
假设所有下线的产品
二锅头总体的平均重量为μ
H0是μ等于100克
H1是μ不等于100克
第二步
选定显著性水平
α等于0.05
第三 从这批下线的产品中
随机的抽取100瓶
分别测试每一瓶的净重
得到100个数据
我们计算得到平均的重量
x拔=98克
第4步
确定统计量的抽样分布规律
这里我们可以看到
我们并不知道
总体这批下线的产品的平均重量
是否符合正态分布
但是我们在抽样的过程中
保证了是大样本的情形
样本量n等于100瓶
根据中心极限定理
可以得到
样本的均值x拔
是服从正态分布的
第五 计算临界值
在计算临界值的过程中
我们给大家介绍三种方法
第一种方法
可以计算实际的临界值
其公式就是
μ0+-z乘以σ
除以根号n
这个公式跟参数估计的公式
是差不多的
但是大家需要注意
在决定实际临界值的原点的时候
用的不是统计量X拔
而是μ0
μ0是我们规定的
产品重量的标准
而不是样本均值的统计量
利用这个公式
来计算实际的临界值
代入数据
100加减1.96
乘以5再除以根号100
得到实际的临界值
99.02克到100.98克之间
我们把这个区间画一张图
一减α是接受域
在这个范围内
产品均是合格品
如果其产品的重量小于99.02克
或者超过100.98克的话
属于不合格产品
这两个被标红的区域面积
分别为1/2α
是拒绝域
如果我们一次抽样
获得的产品的平均值
落在拒绝域
就有理由拒绝h0
接受h1
可以看到
我们一次抽样得到的样本均值的结果
是98克
正好落在左边的拒绝域里边
我们就可以得到
拒绝H0的结论
第二种计算临界值的方法
是统计量X拔标准化的过程
可以样本统计量x拔进行标准化
来进行计算
样本统计量x拔是一个随机变量
它是服从正态分布的
但是不服从标准正态分布
我们可以把x拔进行标准化
在标准化的过程中
假设过程是一样的
H0 μ等于100克
H1 μ不等于100克
我们选定一个显著性水平
α等于0.05
样本量n等于100
我们把x拔标准化
标准化的公式
在我们前面章节里边
已经给大家讲述过
x拔减去均值μ
再除以x拔的标准差
σ比上根号n
得到一个z分布
Z分布的数值为-4
我们把z等于-4
放在一个标准正态分布里
当取阿拉法拒绝域等于0.05
也就是5%
5%对应的标准正态分布值
分别是±1.96
我们可以看到
从负的1.96
到正的1.96
这个区域是接受域
1减α
标准正态分布值落在这个地方
一定是接受域
但是 标准正态分布值z值
落在了拒绝域
z=-4
正好落在
左边的拒绝域
我们仍然能够得到结论
拒绝h0
接受h1
这种方法
普遍应用于学术研究的
假设检验的验证过程
这两种方法的第6步
都是确定决策的规则
比如说
我们得到标准正态分布的z值
z值要大于等于负的1.96
小于等于正的1.96
则接受h0
如果z超过1.96
或者z小于负的1.96
则拒绝h0
接受h1
另外 第7步
判断是否接受原假设
方法一
因为x拔=98
小于99.02克的实际标准
所以可以拒绝h0
接受h1
如果利用第二种方法
标准正态分布值的z值
等于-4
小于负的1.96
则可以拒绝h0
接受h1
最终我们得到第8步
这两个过程
都可以得到相同的结论
在显著性水平
为α等于0.05的情况之下
不能认为
这批二锅头的平均重量达到100克
第三种方法
我们可以利用p值来进行决策
p值的决策
在统计软件中有广泛的应用
什么是p值
在原始假设为真的条件下
检验统计量的观测值
大于或者等于
其计算值的概率
P值在双尾检验分布中
是统计量两侧面积的一个总和
反映实际观测的数据
与所假设的h0之间
不一致的程度
我们也把p值
称为可观察到的显著性水平
其决策的规则是
p值如果小于给定的显著水平的话
我们会拒绝h0
请大家注意
在双尾检验中
我们的统计量
落在分布规律图形上的面积
统计软件会输出二倍的面积
来给定p值
因为是双尾的情形
所以说
我们直接可以利用
p值跟所定的显著性水平
进行一个简单的比较
就可以判断出来
是否拒绝h0
接受h1
下面给出一个
p值检验方法的应用
前面的例题可以看到
p值就等于二倍的
当x拔小于等于98克的概率面积
我们把x拔标准化之后
就是二倍的p
(z小于等于-4)的面积
查表得到
当标准正态分布值z值
小于-4的时候
其概率为0.2×0
约等于0
p值约等于0
所以p值
远远小于给定的显著性水平0.05
则拒绝H0
接受H1
下面我们举一个
左尾单尾检验的例子
我们也给了大家一道例题
一家生产充气气囊的公司
开发了一种新的产品
该公司的产品推广部的经理
向某汽车公司极力的推荐该商品
他声称
新的充气气囊
充气时间小于0.05秒
比原来有了很大的改善
那么汽车公司如何来进行决策
汽车公司的基本态度是
对这种商品感兴趣
但又不能完全相信对方的说法
所以我们来对第二个问题进行解答
第一步
我们仍然先把假设设出来
假设充气气囊
平均的充气时间为μ
h0是
μ大于等于0.05秒
H1是μ小于0.05秒
第二步
我们从这批产品中
随机抽取了100个产品
分别测量
每一个充气气囊的充气时间
得到100个数据
根据这100个数据
我们计算出100个充气气囊
平均充气的时间为0.04秒
x拔=0.04
其样本的标准差为
s为0.01
我们选定一个显著性水平
阿拉法等于0.05
第三步
根据样本的均值的抽样分布规律
把样本均值统计量转化为
标准正态的分布值
z值来进行计算
根据中心极限定理
x拔是服从正态分布的
那么把x拔标准化
x拔减去均值μ
再除以s比上根号n
代入公式
z就等于
0.04-0.05÷0.01
比上根号100
得到z值为-10
第4步
当显著性水平为0.05的时候
我们查表得
Z值为负的1.645
大家注意
Z值是需要查表的
这里是一个单尾的情形
第5步
因为实际的统计量
Z为-10
是小于标准正态分布的Z值-1.645
所以我们拒绝H0原假设
得到相应的结论
这批产品还是合格的
我们给了统计分布的图形
供大家来参考
当然我们也可以采用P值的决策
p值的计算
p概率就等于
x拔小于等于0.04的概率的面积
我们把x拔标准化
就是概率值z
小于等于0.04减去0.05
除以0.01比上根号100的情形
也就是z值小于等于-10的概率
我们查表得到
概率为0
所以p值
仍然是小于给定的显著性水平0.05的
照样可以得到结论
拒绝h0
这批产品是合格的
我们再给大家举一个
右尾检验的例子
供大家来做参考
右尾检验提供了一道例题
一家药品销售公司的销售代表
向一家三甲医院
推销治疗胆固醇的新药
这位销售代表声称
该药的疗效
比现在的医院使用效果更好
原来的疗效是1个疗程
降低胆固醇30个单位
医院采购部门将如何决策
我们已知
医院的态度是
对这种产品是感兴趣的
但又不能完全相信对方的说法
我们仍然
按照解题的步骤
第一步
假设这个新药的平均疗程效果为μ
H0是缪小于等于30个单位
H1 μ大于30单位
第二 做临床实验
100个病人服用该药一个疗程
分别得到
每一个病人胆固醇的降低量
得到100个数据
100个病人的胆固醇的
平均降低量为32个单位
x拔=32
其样本的标准差S
为10个单位
我们把统计量x拔标准化
得到Z值
Z就等于32-30
再除以1等于2
第4步
如果我们选
显著性水平α等于0.05的话
其统计量z
仍然小于查表查得的1.645
则接受h0
否则拒绝h0
我们发现
z等于2
超过了1.645
所以拒绝h0
这批产品还是值得相信的
再给大家一张图
来看整个假设检验的基本过程
我们仍然
也可以用p值来进行检验
并计算
P值就等于x拔
大于等于32的概率
我们把32进行标准化
就是z大于=32-30÷1
也就是当
z值大于等于2的时候
其概率计算是0.0228
如果α等于0.05的情况之下
0.0228小于0.05
所以我们就拒绝h0
接受h1
这批产品还是合格的
本章我们给大家介绍了
假设检验的基本的概念和思想
请大家注意
关注以下的概念
什么是假设
假设检验的基本流程
什么是显著性水平
以及假设检验可能会犯的两类错误
我们利用三道例题
来给大家介绍了
假设检验的基本步骤
而且分成了三类假设检验
一个是双尾检验
一个是单尾检验
单尾检验
我们又把它分成了
左尾检验
和右尾检验
并讨论假设检验的基本步骤和方法
好 这节课我们就上到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题