当前课程知识点:基于R语言的社会统计分析 > 第八章:两组比较和多组比较 > 8.3 比较两个独立样本的均值 > Video
刚才我们聊了比较两组的比例
下面你们可以猜到我一定要讲
比较两组的均值了
比较两组均值的时候
我们可以直接用前面时间调查的那个例子
我们现在来看看具体的怎么样来比较
两组的均值
定量数据比较两个均值的时候呢
同样也有两种方法
一种是置信区间的方法
一种是显著性检验的方法
那我前面已经说了好多次我认为
置信区间可能比显著性检验更有用
所以我们现在
主要介绍一下置信区间的方法
μ2减μ1的置信区间应该等于什么
它是对于
都服从正态分布的两个组别中呢抽取两个
独立的随机样本
然后我们就有μ2减μ1的置信区间等于
y2(bar)减y1(bar)加减
T分布这个T分数
乘以估计
估计标准误se
然后se呢这个公式前面已经有了
那T分数的取值呢
是根据置信水平而决定的
那为什么用T分布
我们之前讲置信区间还有讲显著性检验的时候说
说过很多次了
因为实际上我们需要的是总体标准差
但这里面总体标准差没有
我们就用样本的标准差来代替总体标准差
所以得到的是
一个估计的标准误
通过这个替代的过程呢
这个T值呢
通过替代的过程
我们就引入了
更大的离散程度
于是乎这个胖尾巴就出现了
就要用T分布
当然一定要强调
当你的样本量足够大的时候
T分布会无限的接近于正态分布
如果你去查有一些教材的时候
你会发现有的时候有那个T分布表
然后T分布表
到30以后
就没有数了
或者是到30以后它说那自由度是
50的时候100的时候就很粗的这样进阶
原因就是
当你的样本量足够大
这里面它其实认为T分布样本量大于30它其实就已经算大了
这个T得分和Z得分就已经非常非常接近了你们回去可以去
比较一下啊
然后下面我们再看这个时间调查
里面男性和女性做家务时间这个例子
我们前面已经说过了啊发现
样本均值是有差异的
y2(bar)-y1(bar)=37-23=14也就是
直接看样本均值差异我们就发现
女性做家务的时间是比男性长的
当然我们又发现
男性的离散程度更大一点啊也就是说男的和男的之间
差异很大
那
我们就需要检验了我想知道
这个差异到底是因为
总体里面
确实
总的来说
女性就比男性做家务时间长还是因为我这个样本的特殊性造成的
我们的样本的随机性造成的
然后我们看差异的估计标准误
se呢就等于带公式就好了
把数代进去等于1.09
差异标准误1.09然后我直接带置信区间的那个公式啊
置信区间的那个公式
就应该等于14加减t
t分数
乘以标准误1.09好像这里
因为我的样本量很大因为我看样本量
男的是一千多女的是七百多
我
犯懒如果直接手算的话就可以用
Z得分就是我们耳熟能详
一直都可以记住的1.96来代替那个T得分
因为它们两个值无限趋近然后就等于14加减2
所以我得到这个置信区间是12到16
那怎么去解释它呢
你可以把它理解成
这个区间是不包含0的对吧
所以基本上我们可以说
男女做家务的时间是不可能相等的
所以就是女的比男的
做家务的时间要长
-1.1 什么是统计学?
--视频1.1
-1.2 数据
--视频 1.2
-1.3 随机化原则
--视频 1.3
-1.4 数据收集方法
--视频 1.4
-第一章:绪论--1.5 习题
-2.1 描述统计概述 - 社会学概念的量化问题
--Video
-2.2 变量的分类
--Video
-2.3 描述统计方法 I: 制表法 Tabular Method
--Video
-2.4 描述统计方法 II: 绘图法 Graphical Method
--Video
-2.5 描述统计方法 III: 数值法 Numerical Method
--Video
-第二章:描述统计--2.6 习题
-3.1 探索性数据分析
--视频3.1
-3.2 EDA的制图原则
--Video
-3.3 R语言初体验
--R 语言初体验
-3.4 CRAN 和学习资源
-3.5 R 基础知识
--Video
-3.6 图形和数值
--Video
-4.1 概率的基本概念
--Video
-4.2 离散型与连续型变量的概率分布
--Video
-4.3 正态分布
--Video
-4.4 抽样分布
--Video
-第四章:概率分布--4.5 习题
-5.1 用抽样分布来代表抽样的变异性
--Video
-5.2 样本均值的抽样分布
--Video
-5.3 中心极限定理
--Video
-5.4 点估计和区间估计
--Video
-第五章:统计推断 - 估计--5.5 习题
-6.1 区间估计
--Video
-6.2 总体比例的区间估计
--Video
-6.3 置信水平
--Video
-6.4 总体均值的区间估计
--Video
-第六章:统计推断 - 区间估计--6.5 习题
-7.1 绪论
--Video
-7.2 一个显著性检验的五个部分
--Video
-7.3 均值的显著性检验
--Video
-7.4 比例的显著性检验
--Video
-7.5 检验中错误的类型
--Video
-第七章: 统计推断 - 显著性检验--7.6 习题
-8.1 预备知识
--Video
-8.2 比较两组比例
--Video
-8.3 比较两个独立样本的均值
--Video
-8.4 比较两个相依样本的均值
--Video
-8.5 方差分析(选学)
--Video
-第八章:两组比较和多组比较--8.6 习题
-9.1 变量间的关联分析
--Video
-9.2 列联分析
--Video
-9.3 定序变量间的关联关系
--Video
-第九章:变量间的关联分析--9.4 习题
-10.1 简单线性回归模型概述
--Video
-10.2 模型系数估计
--Video
-10.3 评价系数估计的准确性
--Video
-10.4 评价模型的准确性
--Video
-10.5 R Lab: 用R构建简单线性模型
--Video
-第十章:简单线性回归--10.6 习题
-11.1 多元线性回归概述
--Video
-11.2 多元线性回归
--Video
-11.3 潜在问题及解决方案
--Video
-11.4 用R语言进行多元线性回归
--Video
-第十一章:多元回归--11.5 习题
-12.1 社会科学中的分类问题
--Video
-12.2 Logistic回归概述
--Video
-12.3 Logistic回归系数估计
--Video
-12.4 Logistic回归模型评价
--Video
-12.5 其他多元统计方法
--Video
-12.6 R语言实践
--Video
-12.7 结束语
--Video