当前课程知识点:管理定量方法 > 第四章 数据的描述与统计推断 > 第十一节 抽样分布 > 第十一节 抽样分布
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师 杨老师
第十一节 我们来学习抽样分布的概念
在讲抽样分布概念之前
我们先关注一下
两组非常重要的概念
第一 是参数和统计量
第二 是统计误差
首先 什么是参数和统计量
我们这里给一些符号
μ σ平方 σ 和π
μ是总体的均值
σ平方是总体的方差
σ是总体的标准差
π是总体的比例
一般我们把这些数据
称为参数
参数是反应总体分布特征的指标
我们统称为总体参数
简称参数
平时我们用到的还有x拔
s方 s和p
x拔指的是样本的均值
s方表示的是样本的方差
s表示样本的标准差
p表示样本的比例
那么这些指标
都是反映样本分布特征的统计指标
我们统称为样本统计量
简称为统计量
这里我们给出来所有的总体参数
和样本统计量的计算公式
这里就不一一来做解答
那么什么是统计误差
在我们通过样本来估计总体信息的时候
会遇到两大类的统计误差
一类是非抽样误差
另一类是抽样误差
非抽样误差
一般包括两类
登记性误差
和非随机性误差
尤其是登记性误差
是可以进行检测的
我们可以尽量地减少
在计量的过程中
所得到的登记性误差
但是我们在抽样的过程中
不可避免的
会产生抽样误差
抽样误差是一种随机性的误差
它跟我们使用的计量方法
抽样方法是息息相关的
抽样误差是可以度量和控制的
讲了这两个概念之后
要给大家讲述的重点内容
是抽样分布规律
什么是抽样分布规律
我们通过一道题
来引出这个概念
EAI公司的人事主管
正在制定一项公司25,000名员工的简报
其中包括
500名中层管理人员的人均年薪
和公司中已经完成了管理培训项目的
管理人员所占的比例
我们想知道
统计指标是总体的参数μ和π
也就是
公司中中层管理人员的
人均年薪数量μ
和公司中
已经完成管理培训的管理人员的比例π
但是现在原始数据有限
我们可以做一个抽样调查
我们从500名中层管理人员中
总体中抽取了30名人员
计算得30名员工的平均年薪
x拔是51814元
30名员工中有19名员工
完成了管理的培训
样本的比例p
就等于19÷30=63%
也就是30名员工中
有63%的管理人员
参加了管理培训
那么我们想问
能不能说
公司所有的中层员工的平均年薪
就是51814元
公司中所有的管理人员
参加了管理培训的比例就是63%
显然是不可以的
那么为了能够弄清楚
总体的样本均值
和样本比例的分布规律
我们可以把500个
由30名经理所组成的一个简单随机样本
均值x拔的频数
和相对频数的分布规律
做一张频数分布表
通过这张表格
我们又可以得到
从500名中层管理人员中
随机抽取30名公司经理
组成的一个简单随机样本
均值x拔的相对频数分布的直方图
可以大概的看到
x拔的分布规律
近似一个正态分布
所以 通过这个案例
我们可以得到
抽样分布的规律
抽样分布规律
可以用以描述
抽样误差的规律性
是统计推断的一个理论基础
我们简单的讨论一下
两大类的抽样分布规律
一类是单一样本均值的抽样分布规律
另外一个是研究两个样本均值之差的
抽样分布规律
在讨论x拔的抽样分布规律的时候
我们经常会用到两个定理
一个定理是正态分布再生定理
一个是中心极限定理
首先我们来讨论一下
正态分布再生定理
统计学家发现
当我们从总体里抽取样本的时候
如果总体服从正态分布
而且这种分布规律全部已知
我们从总体中
抽取的样本容量为小n的样本
样本均值x拔
是一定服从正态分布的
样本均值的期望值和方差是多少
X拔样本均值
照样服从正态分布
它的均值为μ
标准差是总体的标准差
σ除以根号 n
这是退还抽样的情况
如果是不退还抽样
我们可以再加一个系数
来估计样本均值的标准差
X拔服从正态分布
其正态分布的均值为总体的均值μ
标准差是根号下大N减去小n
再除以大N减1
这就是正态分布再生定理
正态分布再生定理的前提条件是
总体的分布规律全部已知
但是这种情况之下
我们实际抽样的过程中
是不常见到的
实际抽样的过程中
很难知道总体的分布规律
既然不知道总体的分布规律
我们如何确定抽样分布的规律
中心极限定理给了我们很好的回答
中心极限定理
是正态分布再生定理的一个推论
如果设某总体的元素总量为大N
期望值为μ
标准差是σ
若从该总体中
抽取随机的样本容量为小n的样本
当小n很大的时候
统计经验发现
当样本量小n超过30个样本的时候
则样本的平均数x拔
样本统计的抽样分布规律
近似为正态分布
即x拔还是服从正态分布的
它的均值为μ
x拔的标准差
为总体的标准差σ除以根号n
如果是不退还抽样的话
再乘以一个修正系数
根号下大N减小n
再除以大N减1
这就是中心极限定理
中心极限定理告诉我们
当不知道总体的分布规律的时候
只要抽取的样本量
小n超过30个
即大样本的情况之下
就能够确定
样本的均值x拔的抽样分布规律
照样近似地为正态分布
这里的大样本n超过30
指的是研究的问题是单一的随机变量X
这就是我们常见的
中心极限定理
在讨论完中心极限定理之后
我们可以研究
两个样本均值之差的抽样分布规律
当我们从两个总体中
分别独立的抽取样本容量
小n1和小n2的样本时
有两个样本均值之差
所可能形式的相对频数
构成它们的分布形态
也称之为两个样本均值之差的
抽样分布规律
两个样本之差的抽样分布规律
是从两个大样本的总体中
来进行抽取
两个总体的均值之差
x拔1减去x拔2的期望值
就等于总体的均值μ1
减去总体的均值μ2
其分布的方差
为各自方差之和
即可以得到σx拔1
减去x拔2的平方
x拔1减去x拔2的方差
就是等于σ1的平方
除以n1加上σ2的平方
除以n2
那么当我们从两个总体中
抽取的都是大样本
研究两个样本均值之差的
抽样分布规律的时候
就可以得到x拔1减去x拔2
仍然服从正态分布
这个正态分布的均值
仍然是μ1减μ2
标准差是根号下σ1的平方除以n1
加上σ平方除以n2
我们用一张图
来对今天研究内容进行总结
尤其是讲到
这两个非常重要的定理
正态分布再生定理
和中心极限定理
我们对样本均值的抽样分布规律
进行一个总结
当我们从总体中进行抽样的时候
如果总体的分布规律
已知是正态分布
而且正态分布所有的特征
都是已知的
在这种情况之下
无论我们从总体里面
抽取的是大样本
还是小样本
样本的均值
仍然是服从正态分布的
这是我们讲到的
正态分布再生定理
更多的情况之下
我们从总体中
抽取样本的时候
并不知道总体的分布规律
是正态分布还是非正态分布
在这种情况之下
我们需要抽取大样本
在单一的随机变量的研究过程中
样本量需要超过30个以上
在大样本的情形之下
样本的均值x拔
仍然近似服从于正态分布
如果我们的研究条件有限
我们并不知道
总体的分布特征
是不是正态分布
如果是非正态的分布
这时候
我们可以从总体里边
抽取的样本又是小样本
我们可以利用非正态分布来解
非正态分布小样本的情形
更多的情况之下
样本均值服从于T分布
T分布是正态分布的一个变形
在我们相关的统计学的课程中
已经有了介绍
我们在这里就不做赘述了
以上是关于抽样分布规律的
一些知识总结
抽样分布规律
将有助于我们去理解
后续课程中讲到的参数估计
和假设检验
推断统计学的基本原理
好 今天的课程就讲到这
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题