当前课程知识点:基于R语言的社会统计分析 >  第五章:统计推断 - 估计 >  5.2 样本均值的抽样分布 >  Video

返回《基于R语言的社会统计分析》慕课在线视频课程列表

Video在线视频

Video

下一节:Video

返回《基于R语言的社会统计分析》慕课在线视频列表

Video课程教案、知识点、字幕

这节课呢

我们首先来用理论推导的方法给大家证明

样本均值的抽样分布长成什么样子

那因为呢

样本均值是描述数据集中趋势的时候

最常用最重要的一个统计量

所以它值得我们的特别关注

所以下面我们就来看看

怎么样来找到样本均值的抽样分布

在实际的研究中呢我们分析数据

经常要计算样本的均值

我们用x(bar)来代表样本均值

然后计算样本均值的目的

是为了预测总体的参数总体的均值μ

那但是呢我们

给出了一个样本均值以后

并不清楚这个均值

距离我们总体的实际值到底有多远

因为每个样本都有随机性上节课一直在强调

我其实自己也不知道我这个样本

对于总体的代表性到底有多少

那通过研究

抽样分布中样本均值的离散程度

我们就可以预测

我们这一次获得的样本均值的准确程度到底是多少了

那这里呢

我们需要了解抽样分布的中心在哪里

我们需要知道抽样分布的离散程度如何

也就是说

我们希望能够知道这个分布的均值和标准差

分别是多少

那下面我们就来看看均值和标准差的计算方式

首先让我们想象一个均值为μ的这么一个总体

那从这个总体中随机的抽取一个样本量为n的样本

我们会得到样本均值x(bar)

我们最终的目的实际上就是用样本的均值x(bar)

来估计μ

不同的随机样本

会导致不同的x(bar)的估计

那于是乎呢我们就像上节课所说的

我们认为x(bar)本身就是样本均值本身是一个随机变量

那实际上呢

样本均值是一个围绕着总体的真实值在不断波动的

这么一个数

每一种x(bar)的取值实际上

都以某种特定的概率出现

那相对于有一些值

一些取值的出现或者说距离真实值较近的

样本

均值可能出现的概率会比较高

那好消息的是什么呢

经过一系列长久的重复的抽样过程

我们会发现样本均值

实际上是向总体真值收敛的

也就是说

如果你对你所有这么多次抽取的样本的均值再求一个均值

有点绕

均值的均值

实际上就等于总体的真实的参数值

我们可以证明

μx(bar)它等于

x(bar)的均值和x(bar)的期望值

就等于总体的真实参数取值μ

同时呢我们还有一个非常棒的性质我们知道

σx(bar)应该等于除以根号n

也就是说

样本均值的标准差

等于总体的标准差除以根号n

这里面x(bar)被称为

样本均值抽样分布的标准误
这里面x(bar)被称为

样本均值抽样分布的标准误

然后描述了抽样分布中样本均值的标准差

有的同学经常会分不清标准误标准差

就老问我说标准误和标准差有什么区别

这里面我需要说明一下

标准误本身就是标准差

这个名词

只是标准差在应用于抽样分布时的一个固定的表达

为了区别于我们前面所说的总体中观测值的离散程度

那下面你一定会问为什么

你怎么知道

重复了这么多次抽样以后

样本均值的均值趋近于总体均值

你怎么知道样本均值的标准差

等于总体标准差除以根号n呢

下面我们就给大家

一步一步的把这个过程推导出来

你可能会问为什么样本均值的均值

会等于总体的均值

样本均值的标准差会等于

总体的标准差除以根号n呢

那下面呢我们就来手动的把这个过程给大家推导一下

我们看一下我们

首先我们看样本均值的均值

用μx(bar)来表示

它就等于

expectation

x(bar)

然后我们把样本均值打开

样本均值的表达很简单对吧我们学过

x(bar)应该就等于x1加上x2

加上点点点加到

我们一共样本量是n的话就有n个x

所以到后面是Xn

表达很简单对吧

然后我们把这个n分之一提出来它是一个常数

所以就是以前

上高中就学过的那样对吧

我们就Ex1加上Ex2

一直加到

Exn

然后把它括起来

问题就来了什么是x1呢

其实x1可以是总体里面的任意一个人

x1代表你抽到的样本里面的第一个数

第一个观测值

那重复这个操作无限次

总体里面的每一个人

都可能是x1

那现在问你

既然每个人都可以当x1

所以想象总体里每个人都被抽到过一次

那对x1求期望就应该等于总体的均值μ

所以我们直接把μ代进去

这里面Ex1等于μ

那以此类推对于

样本里面的第二个观测值x2

人人也都有机会当作这个第二观测值

所以对第二个观测值求期望又等于μ

所以

每一个观测值的期望实际上都相当于总体的均值μ

那把它们加和以后我一共有n个μ再除以n

很简单

就等于μ了

这个证明的过程很简单

就是

样本均值的均值就

向总体的真实的均值μ集中了

好下面我们来推导一下样本均值的标准差σx(bar)

那σx(bar)呢既然它标准差的话它其实就是

方差的开方

对吧

我们首先写一个variance x(bar)

那现在我问你

x(bar)样本均值的方差是什么呢

我们来推导一下

variance x(bar)应该就等于同样的过程

我们把x(bar)打开

又等于x1加上x2加上

一直加到Xn

除以n

然后既然它是方差的话有一点和原来的均值不一样

方差方差要给一个平方所以你把

常数往外提的时候要加一个平方

于是乎

这个式子就等于n方分之一

然后一个大括号我们有variance

x1的方差加上x2的方差

加上

一直加到Xn的方差

那现在我就要问了

x1的方差是谁呢

刚才已经解释过了人人可以作为样本里面的第一个观测值

于是乎

第一个观测值的方差实际上

就相当于总体的方差

那我把这个过程再代进去

σ平方

然后第二个观测值的方差

也可能是总体方差

我们就有σ2的平方加加加

加到第n个σ的平方

等于什么呢

就等于

n方分之我们有多少个σ平方

一共有n个n个观测值对吧

所以就是n倍的σ平方

平方和这个n一消就等于n分之的σ平方

那还要把它开根号

开回来以后很简单

我们这里就等于

σ除以根号n了

这就是解释了一下为什么样本均值的标准差

等于总体的标准差σ除以根号n

基于R语言的社会统计分析课程列表:

第一章:绪论

-1.1 什么是统计学?

--视频1.1

-1.2 数据

--视频 1.2

-1.3 随机化原则

--视频 1.3

-1.4 数据收集方法

--视频 1.4

-第一章:绪论--1.5 习题

-Week 1

第二章:描述统计

-2.1 描述统计概述 - 社会学概念的量化问题

--Video

-2.2 变量的分类

--Video

-2.3 描述统计方法 I: 制表法 Tabular Method

--Video

-2.4 描述统计方法 II: 绘图法 Graphical Method

--Video

-2.5 描述统计方法 III: 数值法 Numerical Method

--Video

-第二章:描述统计--2.6 习题

-第二章 (第一部分)测量与变量

-第二章 (第二部分)描述统计 - 制表

-第二章 (第三部分)描述统计 - 绘图

-第二章 (第四部分)描述统计 - 数值

第三章:基于R语言的探索性数据分析

-3.1 探索性数据分析

--视频3.1

-3.2 EDA的制图原则

--Video

-3.3 R语言初体验

--R 语言初体验

-3.4 CRAN 和学习资源

--CRAN 和学习资源

-3.5 R 基础知识

--Video

-3.6 图形和数值

--Video

-第三章 基于R语言的探索性数据分析

第四章:概率分布

-4.1 概率的基本概念

--Video

-4.2 离散型与连续型变量的概率分布

--Video

-4.3 正态分布

--Video

-4.4 抽样分布

--Video

-第四章:概率分布--4.5 习题

-第四章 概率分布

第五章:统计推断 - 估计

-5.1 用抽样分布来代表抽样的变异性

--Video

-5.2 样本均值的抽样分布

--Video

-5.3 中心极限定理

--Video

-5.4 点估计和区间估计

--Video

-第五章:统计推断 - 估计--5.5 习题

-第五章 抽样分布

第六章:统计推断 - 区间估计

-6.1 区间估计

--Video

-6.2 总体比例的区间估计

--Video

-6.3 置信水平

--Video

-6.4 总体均值的区间估计

--Video

-第六章:统计推断 - 区间估计--6.5 习题

-州长选举支持率模拟抽样 R Code

-中心极限定理 R Code

-第六章 统计推断 - 区间估计

第七章: 统计推断 - 显著性检验

-7.1 绪论

--Video

-7.2 一个显著性检验的五个部分

--Video

-7.3 均值的显著性检验

--Video

-7.4 比例的显著性检验

--Video

-7.5 检验中错误的类型

--Video

-第七章: 统计推断 - 显著性检验--7.6 习题

-第七章 统计推断 - 显著性检验

第八章:两组比较和多组比较

-8.1 预备知识

--Video

-8.2 比较两组比例

--Video

-8.3 比较两个独立样本的均值

--Video

-8.4 比较两个相依样本的均值

--Video

-8.5 方差分析(选学)

--Video

-第八章:两组比较和多组比较--8.6 习题

-第八章 两组比较与多组比较 - 课件

-第八章 两组比较与多组比较 - 讲义

-第八章 R-syntax

-第八章 举例数据-mobile

-第八章 举例数据-occupation

第九章:变量间的关联分析

-9.1 变量间的关联分析

--Video

-9.2 列联分析

--Video

-9.3 定序变量间的关联关系

--Video

-第九章:变量间的关联分析--9.4 习题

-第九章 R Code

第十章:简单线性回归

-10.1 简单线性回归模型概述

--Video

-10.2 模型系数估计

--Video

-10.3 评价系数估计的准确性

--Video

-10.4 评价模型的准确性

--Video

-10.5 R Lab: 用R构建简单线性模型

--Video

-第十章:简单线性回归--10.6 习题

-第十章 简单线性回归模型 - 讲义

-第十章 R Code

第十一章:多元回归

-11.1 多元线性回归概述

--Video

-11.2 多元线性回归

--Video

-11.3 潜在问题及解决方案

--Video

-11.4 用R语言进行多元线性回归

--Video

-第十一章:多元回归--11.5 习题

-第十一章 R Code

-第十一章 多元线性回归模型-讲义

第十二章: Logistic回归和其他高级统计方法简介

-12.1 社会科学中的分类问题

--Video

-12.2 Logistic回归概述

--Video

-12.3 Logistic回归系数估计

--Video

-12.4 Logistic回归模型评价

--Video

-12.5 其他多元统计方法

--Video

-12.6 R语言实践

--Video

-12.7 结束语

--Video

-第十二章 R code

Video笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。