当前课程知识点:基于R语言的社会统计分析 > 第七章: 统计推断 - 显著性检验 > 7.2 一个显著性检验的五个部分 > Video
那我们首先
先来看看所有检验具有的共性
就是它们都会具有五个部分
这五个部分分别是什么
首先前面我们老说显著性检验这个
不同的学科可能对它的命名也会有
略有不同
英文是significance test
我们纯学统计的人
更倾向于管它叫做假设检验
叫做hypothesis testing或hypothesis test
那更懒一点我直接就管它叫检验test
这个检验包括五个部分
首先第一部分
我们有前提假定
就是使用某一种特别的检验的时候
你总要有一些假设条件
这个假设条件是什么
然后第二个是你的理论假设
也就是我们所说的hypothesis
第三部分检验统计量
然后
第四第五部分分别是P值和结论
下面我一个一个来具体说明
首先假定
中文里面有的时候
我们说假定有的时候我们说假设
我们好像觉得意思都差不多有什么区别
英文里面假定是
Assumption有它特别的用词
这个Assumption的意思就是说
每个检验都有一定的特定的前提假设
或者是需要一些特殊的条件
才是有效的
那这些前提假定包括什么
首先
你需要知道你的数据类型是什么
我们前面老说不管是什么样的统计方法
第一件事一定要把你的变量类型分清楚
是一个分类变量
还是一个数值变量
数值型变量的时候我们看均值
那分类变量的时候呢我要看比例
那第二个
最重要的
我们总要时时刻刻记住
样本是通过随机化的原则抽取的
所以这个随机化过程一定要被保证
那
才能保证我的样本是有代表性的
然后第三个对于总体分布的假设
前面有的时候说我们如果说样本量
比较大的情况
我对总体分布并不是太看重
因为我有特别无敌的中心极限定理
那
一个意思我们
有的时候当你样本量比较小的时候
我可能对一些特别的情况
是需要对总体的分布进行假定的
最常用的情况
我们希望总体是正态分布的
那最后呢样本量
样本量总是多多益善的
在经费和时间允许的情况下我希望
能进入我研究的研究对象自然是越多越好
那样本越多呢
检验的效度或说检验的力度
也会随之增加
后面我们在讲这个检验统计量讲抽样分布的时候
还会更具体的说明
这是关于
研究最初的那些Assumption基本的假定
说完假定我们要看看假设
假设检验或说显著性检验最核心的部分是
理论假设
那
每个显著性检验
一定都会有关于总体参数的
两个假设
关于总体参数
首先第一个假设是原假设
英文叫做Null hypothesis
我们的叫法不同有的时候管它叫原假设
有的时候直接管它叫H0就是
最初的那个假设
原假设是对总体参数
等于某一个特定取值的一个陈述
一定是等于某一个特定取值
它不会是一个取值范围
那与之相对应的
原假设对立的就是备择假设
备呢准备准备的备
其实它就是后面候着等待被选择的这样一个假设
那英文叫做alternative hypothesis
就是备选的那个假设
这个假设呢通常是认为参数
会落入某一个备选的取值范围
那很多同学就是在
做假设检验的时候特别困扰
就是确定不了什么是原假设什么是备择假设
很纠结
那我们可以这么理解
原假设
它其实体现的是一种
没事儿没事儿什么事儿都对我没影响那个状态
就是它是对原始状态的一种继承
好像什么事儿都没发生
就是英文教材里经常说
原假设是一种假设它假设的是
nothing is going on 什么事儿都没发生
那
备择假设呢
通常代表某种类型的效应
真的发生了
也就是如果我研究两个变量之间的关系的时候
我通常假设x对y是有效应的
这个时候放在备择假设里
它代表了对原始状态的一种挑战
有的时候我们直接就把备择假设称为研究假设
因为它恰恰是我们想证明的那个陈述
比如说我们看性别偏好那个例子
就是说沃尔玛也好还是那个
那个佛罗里达州的连锁超市到底有没有
倾向于选择男同事
进入管培项目
如果我认为
nothing is going on什么事都没发生
那就是原始的特别美好的一个世界
没有偏向不偏不倚
那选进入管培项目的概率
男女应该各占二分之一
然后我有了一个挑战的声音
女同事进行了抗议
她偏说男性的比例是大于二分之一的
所以
男性比例等于二分之一是原假设
出来挑战的那个假设
大于二分之一是你的备择假设
显著性检验呢实际上就是分析
由样本获得的
针对原假设的证据
这个一定是冲着原假设来的
我推翻也是要推翻它
证明也是要证明它
那检验最直接的目的
是搜寻反对原假设的证据
如果我们成功的找到了这个证据
就进而认为
备择假设是正确的
那你可以想象这种方法实际上是一种反证法
我为了证明
一件事儿正确
实际上我最终的目标是想证明我的研究问题是对的
我的备择假设是对的
我选择的
这个路线是
打它的敌人
假想敌有一个原假设
如果我把原假设打败了我就可以证明
我的那个研究问题是正确的
所以这种方法实际上利用了
是利用了反证法的一种间接证明
我们并不是直接证明
研究假设是对的
而是先认为
原假设是对的
如果在这个前提下
我们通过收集来的数据
发现原假设为真的前提下
得到这种数据的可能性特别大
那就支持了
原假设
如果发现
我猜原假设是真的
那得到这种数据不太可能
那我就进而
去反对说原假设是假的
然后去支持备择假设
然后研究人员呢通常通过
假设检验
来搜集支持某个备择假设的证据
然后Ha
通常被称为研究假设叫research hypothesis
这些假设呢是在数据收集和数据分析以前
就已经建立的
这个很重要
我们经常要强调是说
你建立的假设检验
一般都是从理论中来的
你有了一个先验的理论
有了一个想法说我要去收集数据
做一个研究去证明它
那
所以这里面特别要强调
假设检验是在数据收集和数据分析以前就已经建立的假设
这是关于第二部分假设
第三部分
叫做检验统计量
test statistic也就是我们在
进行假设检验的过程
在进行显著性检验的过程中使用的那个统计量
研究假设中所关注的那个参数
一定会有一个点估计对吧
就是一般假设都是我猜
比如说总体的均值等于某一个数
总体的比例等于某一个数
那假设的时候都会对参数有一个猜测
那
为了了解这个参数我去抽样
从样本中会得出关于这个参数的点估计
比如说施瓦辛格的那个例子
我得到的点估计认为
样本的比例是56.5%
那员工性别歧视的那个例子呢我认为样本的
点估计是样本
对于总体的那个点估计是0.9十分之九
那检验统计量是什么呢
它实际上就是想总结点估计
和理论的猜测值之间到底有多远
怎么去衡量这个距离
实际上它是猜测的参数和点估计之间
相差了多少个
标准误的距离
如果还记得上星期学的内容的话这个
构建置信区间的时候
实际上我们用到的这个概念
你经常关注的是你的点估计和你的参数值
到底差了多少个标准误的距离
这是第三点关于检验统计量
那第四点呢是关于p值
p值呢
是我们很多人
尤其在读论文的时候每个人都会关注的一个值
它的意思是
在通过检验
统计量和统计量里面的样本点估计和
原假设之间的距离以后呢我们
比如说我得出个结论说
我的点估计和我的猜测相差了两个标准误的距离
或者是三个标准误的距离但是
我对它总结的时候不想靠
几个标准误来做一个最后的总结
我需要构造的是一个概率的总结
我想知道在原假设为真也就是我的理论前提成立的情况下
得到眼前的这个样本统计量的
概率是多少
就是如前面所说我希望知道可能性
那你想想我想知道在原假设为真的情况下得到
眼前的这个样本点估计的概率是多少
一定又会遇到
我们每次都提的那个概念啊
我一定是想知道抽样分布是什么样子的
因为每一个样本都具有它的
特异性啊
就拿均值来说每次抽一个杨本我都会得到一个不同的均值
那我就想知道在总体的均值μ
等于某一个数的前提下
我得到这个特定的样本
样本的均值的概率是多少
如果说我得到一个数我发现
概率上特别小它特别奇怪
那我就可以推翻原假设
如果我认为
可能性很大那我就可以
不推翻原假设
那再具体而言如果
你的检验统计量刚好落在了
你的备择假设那个方向
备择假设那个尾巴的地方
那就说明这个结果远远地不同于原假设的预期
我们通过分析样本量的抽样分布呢
可以计算在原假设为真的前提下
样本点估计等于
目前样本统计量的取值
或者是
它尾部更远更极端的取值的概率
这个概率就是p值
那我再把它
精简了用更
严谨的语言来对p值下一个定义
p值是什么东西
它就是当原假设为真时
得到目前的样本观测值
或者与备择假设方向一致的
更极端结果出现的概率
后面我们在讲
总体均值还有总体比例的显著性检验的时候
会特别深化p值到底是什么的
概念
p值越小说明概率越小
也就是原假设为真
得到目前的这种观测值的概率
也就是原假设为真
得到目前的这种观测值的概率
很小
那小到什么程度
我可以决定说原假设是假的
我要把它成功推翻呢
那总要下一个结论这就是我们的第五点
结论
我不能光光的给出一个概率说
p值等于0.35p值等于0.25
你还要回到你原来的研究问题中去
给个说法
我到底是拒绝还是不拒绝
所以结论部分呢就是要根据p值
回到具体的问题解释p值到底
告诉我们什么
有时候你需要给个说法
对是否应该拒绝原假设
做出最终的决策
那
一般情况下我们有一个黄金准则
如果
p值是小于0.05的话
我就认为它足够小了
0.05对应的是在原假设为真的情况下
我就认为它足够小了
0.05对应的是在原假设为真的情况下
我得到这个
样本的取值
或者是比这个样本取值还要极端的
统计量的取值的概率是5%
我认为5%已经是一个足够小的概率了
我就可以推翻原假设认为
原假设是假的
那如果说有的人
更严肃一点
就是很怕犯错那我就把这个
水平变得更低一点
必须得小到
0.01的时候我才觉得这事儿特别不可能呢
那我也可以把
这个显著性水平变成0.01
刚才说的0.05也好还是0.01也好
实际上都叫做显著性水平
用α来表示
显著性水平代表的意思就是
在原假设H0为真的情况下
得到像观测值这样极端
或者是比它还要极端的
样本统计量的概率
不会超过5%或者是1%
这是我们说的所有的检验
都会共同具有的五个部分
我们一定会有一个前提的假定
会有理论假设
会有检验统计量
会有p值还有最后的结论
那么下面呢我们就来具体看看
均值的显著性检验
和比例的显著性检验
-1.1 什么是统计学?
--视频1.1
-1.2 数据
--视频 1.2
-1.3 随机化原则
--视频 1.3
-1.4 数据收集方法
--视频 1.4
-第一章:绪论--1.5 习题
-2.1 描述统计概述 - 社会学概念的量化问题
--Video
-2.2 变量的分类
--Video
-2.3 描述统计方法 I: 制表法 Tabular Method
--Video
-2.4 描述统计方法 II: 绘图法 Graphical Method
--Video
-2.5 描述统计方法 III: 数值法 Numerical Method
--Video
-第二章:描述统计--2.6 习题
-3.1 探索性数据分析
--视频3.1
-3.2 EDA的制图原则
--Video
-3.3 R语言初体验
--R 语言初体验
-3.4 CRAN 和学习资源
-3.5 R 基础知识
--Video
-3.6 图形和数值
--Video
-4.1 概率的基本概念
--Video
-4.2 离散型与连续型变量的概率分布
--Video
-4.3 正态分布
--Video
-4.4 抽样分布
--Video
-第四章:概率分布--4.5 习题
-5.1 用抽样分布来代表抽样的变异性
--Video
-5.2 样本均值的抽样分布
--Video
-5.3 中心极限定理
--Video
-5.4 点估计和区间估计
--Video
-第五章:统计推断 - 估计--5.5 习题
-6.1 区间估计
--Video
-6.2 总体比例的区间估计
--Video
-6.3 置信水平
--Video
-6.4 总体均值的区间估计
--Video
-第六章:统计推断 - 区间估计--6.5 习题
-7.1 绪论
--Video
-7.2 一个显著性检验的五个部分
--Video
-7.3 均值的显著性检验
--Video
-7.4 比例的显著性检验
--Video
-7.5 检验中错误的类型
--Video
-第七章: 统计推断 - 显著性检验--7.6 习题
-8.1 预备知识
--Video
-8.2 比较两组比例
--Video
-8.3 比较两个独立样本的均值
--Video
-8.4 比较两个相依样本的均值
--Video
-8.5 方差分析(选学)
--Video
-第八章:两组比较和多组比较--8.6 习题
-9.1 变量间的关联分析
--Video
-9.2 列联分析
--Video
-9.3 定序变量间的关联关系
--Video
-第九章:变量间的关联分析--9.4 习题
-10.1 简单线性回归模型概述
--Video
-10.2 模型系数估计
--Video
-10.3 评价系数估计的准确性
--Video
-10.4 评价模型的准确性
--Video
-10.5 R Lab: 用R构建简单线性模型
--Video
-第十章:简单线性回归--10.6 习题
-11.1 多元线性回归概述
--Video
-11.2 多元线性回归
--Video
-11.3 潜在问题及解决方案
--Video
-11.4 用R语言进行多元线性回归
--Video
-第十一章:多元回归--11.5 习题
-12.1 社会科学中的分类问题
--Video
-12.2 Logistic回归概述
--Video
-12.3 Logistic回归系数估计
--Video
-12.4 Logistic回归模型评价
--Video
-12.5 其他多元统计方法
--Video
-12.6 R语言实践
--Video
-12.7 结束语
--Video