当前课程知识点:基于R语言的社会统计分析 >  第八章:两组比较和多组比较 >  8.3 比较两个独立样本的均值 >  Video

返回《基于R语言的社会统计分析》慕课在线视频课程列表

Video在线视频

Video

下一节:Video

返回《基于R语言的社会统计分析》慕课在线视频列表

Video课程教案、知识点、字幕

刚才我们聊了比较两组的比例

下面你们可以猜到我一定要讲

比较两组的均值了

比较两组均值的时候

我们可以直接用前面时间调查的那个例子

我们现在来看看具体的怎么样来比较

两组的均值

定量数据比较两个均值的时候呢

同样也有两种方法

一种是置信区间的方法

一种是显著性检验的方法

那我前面已经说了好多次我认为

置信区间可能比显著性检验更有用

所以我们现在

主要介绍一下置信区间的方法

μ2减μ1的置信区间应该等于什么

它是对于

都服从正态分布的两个组别中呢抽取两个

独立的随机样本

然后我们就有μ2减μ1的置信区间等于

y2(bar)减y1(bar)加减

T分布这个T分数

乘以估计

估计标准误se

然后se呢这个公式前面已经有了

那T分数的取值呢

是根据置信水平而决定的

那为什么用T分布

我们之前讲置信区间还有讲显著性检验的时候说

说过很多次了

因为实际上我们需要的是总体标准差

但这里面总体标准差没有

我们就用样本的标准差来代替总体标准差

所以得到的是

一个估计的标准误

通过这个替代的过程呢

这个T值呢

通过替代的过程

我们就引入了

更大的离散程度

于是乎这个胖尾巴就出现了

就要用T分布

当然一定要强调

当你的样本量足够大的时候

T分布会无限的接近于正态分布

如果你去查有一些教材的时候

你会发现有的时候有那个T分布表

然后T分布表

到30以后

就没有数了

或者是到30以后它说那自由度是

50的时候100的时候就很粗的这样进阶

原因就是

当你的样本量足够大

这里面它其实认为T分布样本量大于30它其实就已经算大了

这个T得分和Z得分就已经非常非常接近了你们回去可以去

比较一下啊

然后下面我们再看这个时间调查

里面男性和女性做家务时间这个例子

我们前面已经说过了啊发现

样本均值是有差异的

y2(bar)-y1(bar)=37-23=14也就是

直接看样本均值差异我们就发现

女性做家务的时间是比男性长的

当然我们又发现

男性的离散程度更大一点啊也就是说男的和男的之间

差异很大

我们就需要检验了我想知道

这个差异到底是因为

总体里面

确实

总的来说

女性就比男性做家务时间长还是因为我这个样本的特殊性造成的

我们的样本的随机性造成的

然后我们看差异的估计标准误

se呢就等于带公式就好了

把数代进去等于1.09

差异标准误1.09然后我直接带置信区间的那个公式啊

置信区间的那个公式

就应该等于14加减t

t分数

乘以标准误1.09好像这里

因为我的样本量很大因为我看样本量

男的是一千多女的是七百多

犯懒如果直接手算的话就可以用

Z得分就是我们耳熟能详

一直都可以记住的1.96来代替那个T得分

因为它们两个值无限趋近然后就等于14加减2

所以我得到这个置信区间是12到16

那怎么去解释它呢

你可以把它理解成

这个区间是不包含0的对吧

所以基本上我们可以说

男女做家务的时间是不可能相等的

所以就是女的比男的

做家务的时间要长

基于R语言的社会统计分析课程列表:

第一章:绪论

-1.1 什么是统计学?

--视频1.1

-1.2 数据

--视频 1.2

-1.3 随机化原则

--视频 1.3

-1.4 数据收集方法

--视频 1.4

-第一章:绪论--1.5 习题

-Week 1

第二章:描述统计

-2.1 描述统计概述 - 社会学概念的量化问题

--Video

-2.2 变量的分类

--Video

-2.3 描述统计方法 I: 制表法 Tabular Method

--Video

-2.4 描述统计方法 II: 绘图法 Graphical Method

--Video

-2.5 描述统计方法 III: 数值法 Numerical Method

--Video

-第二章:描述统计--2.6 习题

-第二章 (第一部分)测量与变量

-第二章 (第二部分)描述统计 - 制表

-第二章 (第三部分)描述统计 - 绘图

-第二章 (第四部分)描述统计 - 数值

第三章:基于R语言的探索性数据分析

-3.1 探索性数据分析

--视频3.1

-3.2 EDA的制图原则

--Video

-3.3 R语言初体验

--R 语言初体验

-3.4 CRAN 和学习资源

--CRAN 和学习资源

-3.5 R 基础知识

--Video

-3.6 图形和数值

--Video

-第三章 基于R语言的探索性数据分析

第四章:概率分布

-4.1 概率的基本概念

--Video

-4.2 离散型与连续型变量的概率分布

--Video

-4.3 正态分布

--Video

-4.4 抽样分布

--Video

-第四章:概率分布--4.5 习题

-第四章 概率分布

第五章:统计推断 - 估计

-5.1 用抽样分布来代表抽样的变异性

--Video

-5.2 样本均值的抽样分布

--Video

-5.3 中心极限定理

--Video

-5.4 点估计和区间估计

--Video

-第五章:统计推断 - 估计--5.5 习题

-第五章 抽样分布

第六章:统计推断 - 区间估计

-6.1 区间估计

--Video

-6.2 总体比例的区间估计

--Video

-6.3 置信水平

--Video

-6.4 总体均值的区间估计

--Video

-第六章:统计推断 - 区间估计--6.5 习题

-州长选举支持率模拟抽样 R Code

-中心极限定理 R Code

-第六章 统计推断 - 区间估计

第七章: 统计推断 - 显著性检验

-7.1 绪论

--Video

-7.2 一个显著性检验的五个部分

--Video

-7.3 均值的显著性检验

--Video

-7.4 比例的显著性检验

--Video

-7.5 检验中错误的类型

--Video

-第七章: 统计推断 - 显著性检验--7.6 习题

-第七章 统计推断 - 显著性检验

第八章:两组比较和多组比较

-8.1 预备知识

--Video

-8.2 比较两组比例

--Video

-8.3 比较两个独立样本的均值

--Video

-8.4 比较两个相依样本的均值

--Video

-8.5 方差分析(选学)

--Video

-第八章:两组比较和多组比较--8.6 习题

-第八章 两组比较与多组比较 - 课件

-第八章 两组比较与多组比较 - 讲义

-第八章 R-syntax

-第八章 举例数据-mobile

-第八章 举例数据-occupation

第九章:变量间的关联分析

-9.1 变量间的关联分析

--Video

-9.2 列联分析

--Video

-9.3 定序变量间的关联关系

--Video

-第九章:变量间的关联分析--9.4 习题

-第九章 R Code

第十章:简单线性回归

-10.1 简单线性回归模型概述

--Video

-10.2 模型系数估计

--Video

-10.3 评价系数估计的准确性

--Video

-10.4 评价模型的准确性

--Video

-10.5 R Lab: 用R构建简单线性模型

--Video

-第十章:简单线性回归--10.6 习题

-第十章 简单线性回归模型 - 讲义

-第十章 R Code

第十一章:多元回归

-11.1 多元线性回归概述

--Video

-11.2 多元线性回归

--Video

-11.3 潜在问题及解决方案

--Video

-11.4 用R语言进行多元线性回归

--Video

-第十一章:多元回归--11.5 习题

-第十一章 R Code

-第十一章 多元线性回归模型-讲义

第十二章: Logistic回归和其他高级统计方法简介

-12.1 社会科学中的分类问题

--Video

-12.2 Logistic回归概述

--Video

-12.3 Logistic回归系数估计

--Video

-12.4 Logistic回归模型评价

--Video

-12.5 其他多元统计方法

--Video

-12.6 R语言实践

--Video

-12.7 结束语

--Video

-第十二章 R code

Video笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。