当前课程知识点:管理定量方法 > 第四章 数据的描述与统计推断 > 第十二节 参数估计 > 第十二节 参数估计
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师 杨老师
第十二节
我们来介绍参数估计
这一讲我们给大家介绍两个问题
第一 参数估计的估计方法
我们讲两大类的估计方法
点估计和区间估计
第二 单一总体均值的区间估计
并举例
首先 我们给大家参数估计的统计过程
这里有一张图
来表示参数估计的基本过程
我们想知道
总体的均值μ是多少
一种方法就是普查
普查的成本是非常高的
如果想降低统计调研的成本
我们可以采用
随机抽样的方式
从总体中选取几项
组成一个简单的随机样本
对样本的数据
进行汇总
我们可以计算
样本的均值x拔
根据样本均值x拔的数值
对总体的均值μ
来进行推断
这个过程就是参数估计
在做参数估计的过程中
有两大类的方法
一类 叫做点估计
一类叫做区间估计
什么是点估计
点估计是以实际抽样得到的某一个
估计量的单一值
作为相应总体参数的估计值
我们称之为点估计
如果想得到优良的点估计
是非常困难的
优良的点估计的标准有三个
第一 无偏性
我们得到的估计值
θ海德的期望值
应该正好等于真实的θ值
这是无偏的点估计
第二 我们用以估计真实值
θ的估计值
θ海德1的标准差
应该是未用于
估计真实θ的那些估计值
θ海德2的标准差要更小
这时候我们可以得到的是
点估计的有效性
第三 当我们不断增加样本量的时候
其估计精度会提高
这是点估计的一致性
如果一个点估计
具备了无偏性
有效性和一致性
这就是一个优良的点估计
但是 实际上
在点估计的过程中
无偏性 有效性和一致性
是不容易达到的
通常
我们用于进行优良点估计的量
有以下的三个最常用的统计量
经常会用x拔样本的均值
来点估计总体的均值μ
经常用样本的标准差s
来点估计总体的标准差σ
我们经常用样本的比例p
来估计总体的比例π
实际上 在进行参数估计的时候
我们应用最多的是区间估计
区间估计
这里我们给大家介绍三个问题
区间估计的定义
区间估计的基本程序
和单一总体平均数的区间估计
首先 我们看看区间估计的定义
什么是区间估计
区间估计 在一定的置信系数的保证下
根据统计量
得到的一个取值范围
去估计总体参数的过程
这里 我们需要搞清楚
几个区间估计的关键概念
第一个概念叫做置信系数
一般我们用1减α来表示
置信系数就是使人相信
区间包含总体均值的概率
这是一个大概率
一般我们在统计意义上
会选取以下的三个常用数值
90% 95% 和99%
这三个置信系数的大小
说明估计的一个把握性大小
它对应的标准正态分布值
分别是Z等于1.65 1.96 和2.58
第二 置信区间
置信期间就是在一定的概率保证下
包含总体均值的区间
区间的宽窄
说明估计精度的大小
区间越宽
估计的精度就越小
否则就越大
第三 临界值
临界值就是我们所设置的置信区间的
上限和下限
请注意
置信系数
和区间宽窄的关系
我们取的置信系数越大
其设置的置信区间就会越宽
反之亦然
如何进行区间估计
区间估计的基本程序如下
第一 选定一个置信系数
第二 抽取一个样本容量为n的样本
第三 计算相应的统计量
第四 确定统计量的概率分布特征
第五 得到置信区间的临界值
第六 得到参数的置信区间
我们就介绍一个
非常重要的参数估计的过程
单一总体平均数的区间估计为例
单一总体平均数的区间估计
我们分成了两种情况
第一 单一总体的标准差
σ已知的时候
总体均值μ的置信区间
如何来计算
第二 单一总体的标准差
σ未知的时候
总体的均值μ的置信区间
如何来计算
首先我们看
当总体的标准差
σ已知的时候
计算总体的均值μ的置信区间的
基本步骤如下
首先 我们先选定一个置信系数1减α
抽取一个样本容量为n的样本
计算样本的统计量x拔
确定x拔的
统计量的概率分布特征
这个过程我们需要用到两个定理
一个就是前面介绍的
正态分布再生定理
另一个就是我们介绍的
中心极限定理
然后我们通过一定的方法
去求置信区间的临界值
单一总体平均数
置信区间临界值的计算方式
我们给出来一个公式
x 拔加减Z
乘以σx 拔
这里我们对公式
简单做一个讲解
x 拔是我们定的置信区间的原点
因为x拔
是最接近总体均值μ的一个点
那么这个置信区间的宽窄
和两个要素有关
第一 我们所选定的置信系数
1减α的大小
它会对应一个标准正态分布值
第二 我们取得的统计量x拔的标准差
样本均值的标准差越小
实际上
我们构造的置信区间就可以越窄
x拔的标准差越大
说明总体的均值μ
也会比较分散
我们应该设置
更宽的置信区间
来估计总体的均值μ
这个区间估计的公式中
最重要的就是
x拔的标准差
σx拔是如何求得的
根据正态分布再生定理
和中心极限定理
样本均值的标准差
就等于总体的标准差
σ除以根号n
但是在一般的情况之下
总体的标准差σ是不知道的
我们可以用历史数据
来进行简单的估计
当没有历史数据的时候
σ未知的时候
单一总体平均数的区间估计
如何来计算
如果我们抽取的样本是大样本
由于σ是未知的
一般情况之下
我们可以用样本的标准差s
来替代总体的标准差σ
当样本量n超过30个
我们的计算公式
单一总体平均数的置信区间的临界值
仍然为x拔加减Z
乘以S除以根号n
s除以根号n
就是x拔的标准差σx拔
如果样本的均值服从正态分布
σ未知的时候
研究成本有限
样本量抽取的样本
是小于30个的小样本
我们就不能够用标准正态分布
来构造置信区间的区间公式
如果样本量小于30个
我们可以看到
x拔是服从T分布的
所以 单一总体平均数的置信区间的临界值
我们可以利用T分布来计算
其公式就是
x拔加减t
乘以s除以根号n
t值的计算
我们需要根据设定的置信系数
和T分布的自由度
查表得到
T分布又称之为学生分布
由英国的统计学家
威廉西利高赛特于1908年提出
他当时受雇佣于爱尔兰首都的一家啤酒厂
由于该厂
不允许雇员用自己的名字发表成果
于是他采用了学生的笔名来发表文章
阐述他发现的这样的一个小样本的理论
T分布有以下的三个分布特征
T分布是对称的
而且当样本容量n较小的时候
T分布的标准差大于1
当样本量超过30个时
其标准差就趋近于1
T分布就趋近于正态分布
因为此时样本的标准差s
和总体的标准差σ
非常接近
所以说T分布
实际就是标准正态分布的一个变形
是在样本容量较小的时候
一个特殊的标准正态分布
第二 T分布是一个分布簇
不同的样本量n
在统计上也称之为自由度
对应于不同的分布
但它的均值都等于0
第三 与标准正态分布相比
T分布的中心部较低
两个尾部较高
我们画了一张T分布
和标准正态Z分布的比较图
可以看到
当样本量比较大的时候
其T分布就是标准正态分布
当逐渐缩小样本量
样本量等于15
样本量等于2的时候
标准正态分布
就会发生变形
图形表现为
两个尾巴翘
中间低的T分布的分布规律
为了能够更好的阐述
单一总体平均数的
区间估计过程
我们给了大家一道例题
来帮助大家更好的理解
参数估计的过程
例题的背景是这样的
CJF有限公司
是一家专营体育设备和器材的邮购公司
公司努力
为顾客提供尽可能好的服务
为了跟踪服务的质量
CJF每个月
都选取顾客的邮购订单
组成简单随机样本
公司与样本中每一位顾客取得联系
询问顾客
对于服务水平等一系列的问题的评价
顾客的回答
用于计算样本中的
每一位顾客满意度的得分
得分值从0 最差 到100 最好的等级
然后计算样本满意得分的均值
根据历史的经验
以往每个月的调查显示
虽然每个月顾客满意度得分
样本均值都在变化
但是满意得分的样本标准差
趋于稳定
在数值20附近
于是
我们假设总体的标准差
σ等于20
最近一次
CJF对顾客满意度调查
提供了100名顾客的满意度得分
样本量是100
满意度得分的样本平均数
x拔等于82分
我们的问题是
CJF希望估计最近一次
所有顾客的满意度
得分的均值
我们可以使用点估计
和区间估计的方式
来进行估计
如果点估计
就直接用x拔等于82分
来估计总体的均值μ就可以了
这样显然显得过于简单
而且优良的点估计
是不容易得到的
如果利用区间估计的话
可以更为科学地进行推断判断
第一步 我们先选定一个置信系数1-α
如果取1-α等于95%
第二步 抽取一个样本容量
n等于100的样本
第三 计算样本的统计量
x拔等于82分
第四 确定x拔统计量的概率分布特征
根据题目中
已知总体的标准差σ=20
另外我们抽取的样本容量n等于100个
超过了30个样本
根据中心极限定理
我们可以判断样本的统计量
x拔仍然近似服从于正态分布
我们可以利用正态分布来解题
第五 我们去求置信区间的临界值
构造单一总体平均数值的
置信区间的临界值
公式为X拔加减z
乘以 σx拔
σx拔就等于σ除以根号n
我们把数值代入公式就得到
82加减1.96乘以20
除以根号100
82加减3.92
得到78.08和85.92的临界值
可以这样来解释
CJF公司在进行了抽样调研之后
我们对样本的均值
总体的平均满意度得分
进行了一个区间估计
我们有95%的把握说
总体上看来
顾客的满意度的平均分
最低是78.08分
最高可以达到85.92分之间
请大家注意
在计算的过程中
我们是如何确定
100名顾客满意度得分
样本均值的概率分布特征的
我们可以利用正态分布再生定理
和中心极限定理
来进行科学的判断
好 这节课就讲到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题