当前课程知识点:基于R语言的社会统计分析 >  第七章: 统计推断 - 显著性检验 >  7.2 一个显著性检验的五个部分 >  Video

返回《基于R语言的社会统计分析》慕课在线视频课程列表

Video在线视频

Video

下一节:Video

返回《基于R语言的社会统计分析》慕课在线视频列表

Video课程教案、知识点、字幕

那我们首先

先来看看所有检验具有的共性

就是它们都会具有五个部分

这五个部分分别是什么

首先前面我们老说显著性检验这个

不同的学科可能对它的命名也会有

略有不同

英文是significance test

我们纯学统计的人

更倾向于管它叫做假设检验

叫做hypothesis testing或hypothesis test

那更懒一点我直接就管它叫检验test

这个检验包括五个部分

首先第一部分

我们有前提假定

就是使用某一种特别的检验的时候

你总要有一些假设条件

这个假设条件是什么

然后第二个是你的理论假设

也就是我们所说的hypothesis

第三部分检验统计量

然后

第四第五部分分别是P值和结论

下面我一个一个来具体说明

首先假定

中文里面有的时候

我们说假定有的时候我们说假设

我们好像觉得意思都差不多有什么区别

英文里面假定是

Assumption有它特别的用词

这个Assumption的意思就是说

每个检验都有一定的特定的前提假设

或者是需要一些特殊的条件

才是有效的

那这些前提假定包括什么

首先

你需要知道你的数据类型是什么

我们前面老说不管是什么样的统计方法

第一件事一定要把你的变量类型分清楚

是一个分类变量

还是一个数值变量

数值型变量的时候我们看均值

那分类变量的时候呢我要看比例

那第二个

最重要的

我们总要时时刻刻记住

样本是通过随机化的原则抽取的

所以这个随机化过程一定要被保证

才能保证我的样本是有代表性的

然后第三个对于总体分布的假设

前面有的时候说我们如果说样本量

比较大的情况

我对总体分布并不是太看重

因为我有特别无敌的中心极限定理

一个意思我们

有的时候当你样本量比较小的时候

我可能对一些特别的情况

是需要对总体的分布进行假定的

最常用的情况

我们希望总体是正态分布的

那最后呢样本量

样本量总是多多益善的

在经费和时间允许的情况下我希望

能进入我研究的研究对象自然是越多越好

那样本越多呢

检验的效度或说检验的力度

也会随之增加

后面我们在讲这个检验统计量讲抽样分布的时候

还会更具体的说明

这是关于

研究最初的那些Assumption基本的假定

说完假定我们要看看假设

假设检验或说显著性检验最核心的部分是

理论假设

每个显著性检验

一定都会有关于总体参数的

两个假设

关于总体参数

首先第一个假设是原假设

英文叫做Null hypothesis

我们的叫法不同有的时候管它叫原假设

有的时候直接管它叫H0就是

最初的那个假设

原假设是对总体参数

等于某一个特定取值的一个陈述

一定是等于某一个特定取值

它不会是一个取值范围

那与之相对应的

原假设对立的就是备择假设

备呢准备准备的备

其实它就是后面候着等待被选择的这样一个假设

那英文叫做alternative hypothesis

就是备选的那个假设

这个假设呢通常是认为参数

会落入某一个备选的取值范围

那很多同学就是在

做假设检验的时候特别困扰

就是确定不了什么是原假设什么是备择假设

很纠结

那我们可以这么理解

原假设

它其实体现的是一种

没事儿没事儿什么事儿都对我没影响那个状态

就是它是对原始状态的一种继承

好像什么事儿都没发生

就是英文教材里经常说

原假设是一种假设它假设的是

nothing is going on 什么事儿都没发生

备择假设呢

通常代表某种类型的效应

真的发生了

也就是如果我研究两个变量之间的关系的时候

我通常假设x对y是有效应的

这个时候放在备择假设里

它代表了对原始状态的一种挑战

有的时候我们直接就把备择假设称为研究假设

因为它恰恰是我们想证明的那个陈述

比如说我们看性别偏好那个例子

就是说沃尔玛也好还是那个

那个佛罗里达州的连锁超市到底有没有

倾向于选择男同事

进入管培项目

如果我认为

nothing is going on什么事都没发生

那就是原始的特别美好的一个世界

没有偏向不偏不倚

那选进入管培项目的概率

男女应该各占二分之一

然后我有了一个挑战的声音

女同事进行了抗议

她偏说男性的比例是大于二分之一的

所以

男性比例等于二分之一是原假设

出来挑战的那个假设

大于二分之一是你的备择假设

显著性检验呢实际上就是分析

由样本获得的

针对原假设的证据

这个一定是冲着原假设来的

我推翻也是要推翻它

证明也是要证明它

那检验最直接的目的

是搜寻反对原假设的证据

如果我们成功的找到了这个证据

就进而认为

备择假设是正确的

那你可以想象这种方法实际上是一种反证法

我为了证明

一件事儿正确

实际上我最终的目标是想证明我的研究问题是对的

我的备择假设是对的

我选择的

这个路线是

打它的敌人

假想敌有一个原假设

如果我把原假设打败了我就可以证明

我的那个研究问题是正确的

所以这种方法实际上利用了

是利用了反证法的一种间接证明

我们并不是直接证明

研究假设是对的

而是先认为

原假设是对的

如果在这个前提下

我们通过收集来的数据

发现原假设为真的前提下

得到这种数据的可能性特别大

那就支持了

原假设

如果发现

我猜原假设是真的

那得到这种数据不太可能

那我就进而

去反对说原假设是假的

然后去支持备择假设

然后研究人员呢通常通过

假设检验

来搜集支持某个备择假设的证据

然后Ha

通常被称为研究假设叫research hypothesis

这些假设呢是在数据收集和数据分析以前

就已经建立的

这个很重要

我们经常要强调是说

你建立的假设检验

一般都是从理论中来的

你有了一个先验的理论

有了一个想法说我要去收集数据

做一个研究去证明它

所以这里面特别要强调

假设检验是在数据收集和数据分析以前就已经建立的假设

这是关于第二部分假设

第三部分

叫做检验统计量

test statistic也就是我们在

进行假设检验的过程

在进行显著性检验的过程中使用的那个统计量

研究假设中所关注的那个参数

一定会有一个点估计对吧

就是一般假设都是我猜

比如说总体的均值等于某一个数

总体的比例等于某一个数

那假设的时候都会对参数有一个猜测

为了了解这个参数我去抽样

从样本中会得出关于这个参数的点估计

比如说施瓦辛格的那个例子

我得到的点估计认为

样本的比例是56.5%

那员工性别歧视的那个例子呢我认为样本的

点估计是样本

对于总体的那个点估计是0.9十分之九

那检验统计量是什么呢

它实际上就是想总结点估计

和理论的猜测值之间到底有多远

怎么去衡量这个距离

实际上它是猜测的参数和点估计之间

相差了多少个

标准误的距离

如果还记得上星期学的内容的话这个

构建置信区间的时候

实际上我们用到的这个概念

你经常关注的是你的点估计和你的参数值

到底差了多少个标准误的距离

这是第三点关于检验统计量

那第四点呢是关于p值

p值呢

是我们很多人

尤其在读论文的时候每个人都会关注的一个值

它的意思是

在通过检验

统计量和统计量里面的样本点估计和

原假设之间的距离以后呢我们

比如说我得出个结论说

我的点估计和我的猜测相差了两个标准误的距离

或者是三个标准误的距离但是

我对它总结的时候不想靠

几个标准误来做一个最后的总结

我需要构造的是一个概率的总结

我想知道在原假设为真也就是我的理论前提成立的情况下

得到眼前的这个样本统计量的

概率是多少

就是如前面所说我希望知道可能性

那你想想我想知道在原假设为真的情况下得到

眼前的这个样本点估计的概率是多少

一定又会遇到

我们每次都提的那个概念啊

我一定是想知道抽样分布是什么样子的

因为每一个样本都具有它的

特异性啊

就拿均值来说每次抽一个杨本我都会得到一个不同的均值

那我就想知道在总体的均值μ

等于某一个数的前提下

我得到这个特定的样本

样本的均值的概率是多少

如果说我得到一个数我发现

概率上特别小它特别奇怪

那我就可以推翻原假设

如果我认为

可能性很大那我就可以

不推翻原假设

那再具体而言如果

你的检验统计量刚好落在了

你的备择假设那个方向

备择假设那个尾巴的地方

那就说明这个结果远远地不同于原假设的预期

我们通过分析样本量的抽样分布呢

可以计算在原假设为真的前提下

样本点估计等于

目前样本统计量的取值

或者是

它尾部更远更极端的取值的概率

这个概率就是p值

那我再把它

精简了用更

严谨的语言来对p值下一个定义

p值是什么东西

它就是当原假设为真时

得到目前的样本观测值

或者与备择假设方向一致的

更极端结果出现的概率

后面我们在讲

总体均值还有总体比例的显著性检验的时候

会特别深化p值到底是什么的

概念

p值越小说明概率越小

也就是原假设为真

得到目前的这种观测值的概率
也就是原假设为真

得到目前的这种观测值的概率

很小

那小到什么程度

我可以决定说原假设是假的

我要把它成功推翻呢

那总要下一个结论这就是我们的第五点

结论

我不能光光的给出一个概率说

p值等于0.35p值等于0.25

你还要回到你原来的研究问题中去

给个说法

我到底是拒绝还是不拒绝

所以结论部分呢就是要根据p值

回到具体的问题解释p值到底

告诉我们什么

有时候你需要给个说法

对是否应该拒绝原假设

做出最终的决策

一般情况下我们有一个黄金准则

如果

p值是小于0.05的话

我就认为它足够小了

0.05对应的是在原假设为真的情况下
我就认为它足够小了

0.05对应的是在原假设为真的情况下

我得到这个

样本的取值

或者是比这个样本取值还要极端的

统计量的取值的概率是5%

我认为5%已经是一个足够小的概率了

我就可以推翻原假设认为

原假设是假的

那如果说有的人

更严肃一点

就是很怕犯错那我就把这个

水平变得更低一点

必须得小到

0.01的时候我才觉得这事儿特别不可能呢

那我也可以把

这个显著性水平变成0.01

刚才说的0.05也好还是0.01也好

实际上都叫做显著性水平

用α来表示

显著性水平代表的意思就是

在原假设H0为真的情况下

得到像观测值这样极端

或者是比它还要极端的

样本统计量的概率

不会超过5%或者是1%

这是我们说的所有的检验

都会共同具有的五个部分

我们一定会有一个前提的假定

会有理论假设

会有检验统计量

会有p值还有最后的结论

那么下面呢我们就来具体看看

均值的显著性检验

和比例的显著性检验

基于R语言的社会统计分析课程列表:

第一章:绪论

-1.1 什么是统计学?

--视频1.1

-1.2 数据

--视频 1.2

-1.3 随机化原则

--视频 1.3

-1.4 数据收集方法

--视频 1.4

-第一章:绪论--1.5 习题

-Week 1

第二章:描述统计

-2.1 描述统计概述 - 社会学概念的量化问题

--Video

-2.2 变量的分类

--Video

-2.3 描述统计方法 I: 制表法 Tabular Method

--Video

-2.4 描述统计方法 II: 绘图法 Graphical Method

--Video

-2.5 描述统计方法 III: 数值法 Numerical Method

--Video

-第二章:描述统计--2.6 习题

-第二章 (第一部分)测量与变量

-第二章 (第二部分)描述统计 - 制表

-第二章 (第三部分)描述统计 - 绘图

-第二章 (第四部分)描述统计 - 数值

第三章:基于R语言的探索性数据分析

-3.1 探索性数据分析

--视频3.1

-3.2 EDA的制图原则

--Video

-3.3 R语言初体验

--R 语言初体验

-3.4 CRAN 和学习资源

--CRAN 和学习资源

-3.5 R 基础知识

--Video

-3.6 图形和数值

--Video

-第三章 基于R语言的探索性数据分析

第四章:概率分布

-4.1 概率的基本概念

--Video

-4.2 离散型与连续型变量的概率分布

--Video

-4.3 正态分布

--Video

-4.4 抽样分布

--Video

-第四章:概率分布--4.5 习题

-第四章 概率分布

第五章:统计推断 - 估计

-5.1 用抽样分布来代表抽样的变异性

--Video

-5.2 样本均值的抽样分布

--Video

-5.3 中心极限定理

--Video

-5.4 点估计和区间估计

--Video

-第五章:统计推断 - 估计--5.5 习题

-第五章 抽样分布

第六章:统计推断 - 区间估计

-6.1 区间估计

--Video

-6.2 总体比例的区间估计

--Video

-6.3 置信水平

--Video

-6.4 总体均值的区间估计

--Video

-第六章:统计推断 - 区间估计--6.5 习题

-州长选举支持率模拟抽样 R Code

-中心极限定理 R Code

-第六章 统计推断 - 区间估计

第七章: 统计推断 - 显著性检验

-7.1 绪论

--Video

-7.2 一个显著性检验的五个部分

--Video

-7.3 均值的显著性检验

--Video

-7.4 比例的显著性检验

--Video

-7.5 检验中错误的类型

--Video

-第七章: 统计推断 - 显著性检验--7.6 习题

-第七章 统计推断 - 显著性检验

第八章:两组比较和多组比较

-8.1 预备知识

--Video

-8.2 比较两组比例

--Video

-8.3 比较两个独立样本的均值

--Video

-8.4 比较两个相依样本的均值

--Video

-8.5 方差分析(选学)

--Video

-第八章:两组比较和多组比较--8.6 习题

-第八章 两组比较与多组比较 - 课件

-第八章 两组比较与多组比较 - 讲义

-第八章 R-syntax

-第八章 举例数据-mobile

-第八章 举例数据-occupation

第九章:变量间的关联分析

-9.1 变量间的关联分析

--Video

-9.2 列联分析

--Video

-9.3 定序变量间的关联关系

--Video

-第九章:变量间的关联分析--9.4 习题

-第九章 R Code

第十章:简单线性回归

-10.1 简单线性回归模型概述

--Video

-10.2 模型系数估计

--Video

-10.3 评价系数估计的准确性

--Video

-10.4 评价模型的准确性

--Video

-10.5 R Lab: 用R构建简单线性模型

--Video

-第十章:简单线性回归--10.6 习题

-第十章 简单线性回归模型 - 讲义

-第十章 R Code

第十一章:多元回归

-11.1 多元线性回归概述

--Video

-11.2 多元线性回归

--Video

-11.3 潜在问题及解决方案

--Video

-11.4 用R语言进行多元线性回归

--Video

-第十一章:多元回归--11.5 习题

-第十一章 R Code

-第十一章 多元线性回归模型-讲义

第十二章: Logistic回归和其他高级统计方法简介

-12.1 社会科学中的分类问题

--Video

-12.2 Logistic回归概述

--Video

-12.3 Logistic回归系数估计

--Video

-12.4 Logistic回归模型评价

--Video

-12.5 其他多元统计方法

--Video

-12.6 R语言实践

--Video

-12.7 结束语

--Video

-第十二章 R code

Video笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。