当前课程知识点：管理定量方法 > 第四章数据的描述与统计推断 > 第十二节参数估计 > 第十二节参数估计

返回《管理定量方法》慕课在线视频课程列表

第十二节参数估计在线视频

下一节:第十三节假设检验（一）

返回《管理定量方法》慕课在线视频列表

第十二节参数估计课程教案、知识点、字幕

同学们大家好

欢迎来到管理定量方法课程

我是今天的主讲老师杨老师

第十二节

我们来介绍参数估计

这一讲我们给大家介绍两个问题

第一参数估计的估计方法

我们讲两大类的估计方法

点估计和区间估计

第二单一总体均值的区间估计

并举例

首先我们给大家参数估计的统计过程

这里有一张图

来表示参数估计的基本过程

我们想知道

总体的均值μ是多少

一种方法就是普查

普查的成本是非常高的

如果想降低统计调研的成本

我们可以采用

随机抽样的方式

从总体中选取几项

组成一个简单的随机样本

对样本的数据

进行汇总

我们可以计算

样本的均值x拔

根据样本均值x拔的数值

对总体的均值μ

来进行推断

这个过程就是参数估计

在做参数估计的过程中

有两大类的方法

一类叫做点估计

一类叫做区间估计

什么是点估计

点估计是以实际抽样得到的某一个

估计量的单一值

作为相应总体参数的估计值

我们称之为点估计

如果想得到优良的点估计

是非常困难的

优良的点估计的标准有三个

第一无偏性

我们得到的估计值

θ海德的期望值

应该正好等于真实的θ值

这是无偏的点估计

第二我们用以估计真实值

θ的估计值

θ海德1的标准差

应该是未用于

估计真实θ的那些估计值

θ海德2的标准差要更小

这时候我们可以得到的是

点估计的有效性

第三当我们不断增加样本量的时候

其估计精度会提高

这是点估计的一致性

如果一个点估计

具备了无偏性

有效性和一致性

这就是一个优良的点估计

但是实际上

在点估计的过程中

无偏性有效性和一致性

是不容易达到的

通常

我们用于进行优良点估计的量

有以下的三个最常用的统计量

经常会用x拔样本的均值

来点估计总体的均值μ

经常用样本的标准差s

来点估计总体的标准差σ

我们经常用样本的比例p

来估计总体的比例π

实际上在进行参数估计的时候

我们应用最多的是区间估计

区间估计

这里我们给大家介绍三个问题

区间估计的定义

区间估计的基本程序

和单一总体平均数的区间估计

首先我们看看区间估计的定义

什么是区间估计

区间估计在一定的置信系数的保证下

根据统计量

得到的一个取值范围

去估计总体参数的过程

这里我们需要搞清楚

几个区间估计的关键概念

第一个概念叫做置信系数

一般我们用1减α来表示

置信系数就是使人相信

区间包含总体均值的概率

这是一个大概率

一般我们在统计意义上

会选取以下的三个常用数值

90% 95% 和99%

这三个置信系数的大小

说明估计的一个把握性大小

它对应的标准正态分布值

分别是Z等于1.65 1.96 和2.58

第二置信区间

置信期间就是在一定的概率保证下

包含总体均值的区间

区间的宽窄

说明估计精度的大小

区间越宽

估计的精度就越小

否则就越大

第三临界值

临界值就是我们所设置的置信区间的

上限和下限

请注意

置信系数

和区间宽窄的关系

我们取的置信系数越大

其设置的置信区间就会越宽

反之亦然

如何进行区间估计

区间估计的基本程序如下

第一选定一个置信系数

第二抽取一个样本容量为n的样本

第三计算相应的统计量

第四确定统计量的概率分布特征

第五得到置信区间的临界值

第六得到参数的置信区间

我们就介绍一个

非常重要的参数估计的过程

单一总体平均数的区间估计为例

单一总体平均数的区间估计

我们分成了两种情况

第一单一总体的标准差

σ已知的时候

总体均值μ的置信区间

如何来计算

第二单一总体的标准差

σ未知的时候

总体的均值μ的置信区间

如何来计算

首先我们看

当总体的标准差

σ已知的时候

计算总体的均值μ的置信区间的

基本步骤如下

首先我们先选定一个置信系数1减α

抽取一个样本容量为n的样本

计算样本的统计量x拔

确定x拔的

统计量的概率分布特征

这个过程我们需要用到两个定理

一个就是前面介绍的

正态分布再生定理

另一个就是我们介绍的

中心极限定理

然后我们通过一定的方法

去求置信区间的临界值

单一总体平均数

置信区间临界值的计算方式

我们给出来一个公式

x 拔加减Z

乘以σx 拔

这里我们对公式

简单做一个讲解

x 拔是我们定的置信区间的原点

因为x拔

是最接近总体均值μ的一个点

那么这个置信区间的宽窄

和两个要素有关

第一我们所选定的置信系数

1减α的大小

它会对应一个标准正态分布值

第二我们取得的统计量x拔的标准差

样本均值的标准差越小

实际上

我们构造的置信区间就可以越窄

x拔的标准差越大

说明总体的均值μ

也会比较分散

我们应该设置

更宽的置信区间

来估计总体的均值μ

这个区间估计的公式中

最重要的就是

x拔的标准差

σx拔是如何求得的

根据正态分布再生定理

和中心极限定理

样本均值的标准差

就等于总体的标准差

σ除以根号n

但是在一般的情况之下

总体的标准差σ是不知道的

我们可以用历史数据

来进行简单的估计

当没有历史数据的时候

σ未知的时候

单一总体平均数的区间估计

如何来计算

如果我们抽取的样本是大样本

由于σ是未知的

一般情况之下

我们可以用样本的标准差s

来替代总体的标准差σ

当样本量n超过30个

我们的计算公式

单一总体平均数的置信区间的临界值

仍然为x拔加减Z

乘以S除以根号n

s除以根号n

就是x拔的标准差σx拔

如果样本的均值服从正态分布

σ未知的时候

研究成本有限

样本量抽取的样本

是小于30个的小样本

我们就不能够用标准正态分布

来构造置信区间的区间公式

如果样本量小于30个

我们可以看到

x拔是服从T分布的

所以单一总体平均数的置信区间的临界值

我们可以利用T分布来计算

其公式就是

x拔加减t

乘以s除以根号n

t值的计算

我们需要根据设定的置信系数

和T分布的自由度

查表得到

T分布又称之为学生分布

由英国的统计学家

威廉西利高赛特于1908年提出

他当时受雇佣于爱尔兰首都的一家啤酒厂

由于该厂

不允许雇员用自己的名字发表成果

于是他采用了学生的笔名来发表文章

阐述他发现的这样的一个小样本的理论

T分布有以下的三个分布特征

T分布是对称的

而且当样本容量n较小的时候

T分布的标准差大于1

当样本量超过30个时

其标准差就趋近于1

T分布就趋近于正态分布

因为此时样本的标准差s

和总体的标准差σ

非常接近

所以说T分布

实际就是标准正态分布的一个变形

是在样本容量较小的时候

一个特殊的标准正态分布

第二 T分布是一个分布簇

不同的样本量n

在统计上也称之为自由度

对应于不同的分布

但它的均值都等于0

第三与标准正态分布相比

T分布的中心部较低

两个尾部较高

我们画了一张T分布

和标准正态Z分布的比较图

可以看到

当样本量比较大的时候

其T分布就是标准正态分布

当逐渐缩小样本量

样本量等于15

样本量等于2的时候

标准正态分布

就会发生变形

图形表现为

两个尾巴翘

中间低的T分布的分布规律

为了能够更好的阐述

单一总体平均数的

区间估计过程

我们给了大家一道例题

来帮助大家更好的理解

参数估计的过程

例题的背景是这样的

CJF有限公司

是一家专营体育设备和器材的邮购公司

公司努力

为顾客提供尽可能好的服务

为了跟踪服务的质量

CJF每个月

都选取顾客的邮购订单

组成简单随机样本

公司与样本中每一位顾客取得联系

询问顾客

对于服务水平等一系列的问题的评价

顾客的回答

用于计算样本中的

每一位顾客满意度的得分

得分值从0 最差到100 最好的等级

然后计算样本满意得分的均值

根据历史的经验

以往每个月的调查显示

虽然每个月顾客满意度得分

样本均值都在变化

但是满意得分的样本标准差

趋于稳定

在数值20附近

于是

我们假设总体的标准差

σ等于20

最近一次

CJF对顾客满意度调查

提供了100名顾客的满意度得分

样本量是100

满意度得分的样本平均数

x拔等于82分

我们的问题是

CJF希望估计最近一次

所有顾客的满意度

得分的均值

我们可以使用点估计

和区间估计的方式

来进行估计

如果点估计

就直接用x拔等于82分

来估计总体的均值μ就可以了

这样显然显得过于简单

而且优良的点估计

是不容易得到的

如果利用区间估计的话

可以更为科学地进行推断判断

第一步我们先选定一个置信系数1-α

如果取1-α等于95%

第二步抽取一个样本容量

n等于100的样本

第三计算样本的统计量

x拔等于82分

第四确定x拔统计量的概率分布特征

根据题目中

已知总体的标准差σ=20

另外我们抽取的样本容量n等于100个

超过了30个样本

根据中心极限定理

我们可以判断样本的统计量

x拔仍然近似服从于正态分布

我们可以利用正态分布来解题

第五我们去求置信区间的临界值

构造单一总体平均数值的

置信区间的临界值

公式为X拔加减z

乘以 σx拔

σx拔就等于σ除以根号n

我们把数值代入公式就得到

82加减1.96乘以20

除以根号100

82加减3.92

得到78.08和85.92的临界值

可以这样来解释

CJF公司在进行了抽样调研之后

我们对样本的均值

总体的平均满意度得分

进行了一个区间估计

我们有95%的把握说

总体上看来

顾客的满意度的平均分

最低是78.08分

最高可以达到85.92分之间

请大家注意

在计算的过程中

我们是如何确定

100名顾客满意度得分

样本均值的概率分布特征的

我们可以利用正态分布再生定理

和中心极限定理

来进行科学的判断

好这节课就讲到这里

同学们再见

管理定量方法课程列表：

第一章管理定量研究概述

-第一节管理学研究概述

--第一节管理学研究概述

-第二节研究的有效性

--第二节研究的有效性

-第一章习题

--第一章习题

第二章定量数据的采集

-第三节数据的采集（一）

--第三节数据的采集（一）

-第四节数据的采集（二）

--第四节数据的采集（二）

-第五节问卷与访谈

--第五节问卷与访谈

-第二章习题

--第二章习题

第三章测量与尺度设计

-第六节变量的测量（一）

--第六节变量的测量（一）

-第七节变量的测量（二）

--第七节变量的测量（二）

-第三章习题

--第三章习题

第四章数据的描述与统计推断

-第八节数据的描述

--第八节数据的描述

-第九节概率与随机变量（一）

--第九节概率与随机变量（一）

-第十节概率与随机变量（二）

--第十节概率与随机变量（二）

-第十一节抽样分布

--第十一节抽样分布

-第十二节参数估计

--第十二节参数估计

-第十三节假设检验（一）

--第十三节假设检验（一）

-第十四节假设检验（二）

--第十四节假设检验（二）

-第四章习题

--第四章习题

第五章多变量定量研究

-第十五节问卷的结构效度——探索性因子分析（一）

--第十五节问卷的结构效度——探索性因子分析（一）

-第十六节问卷的结构效度——探索性因子分析（二）

--第十六节问卷的结构效度——探索性因子分析（二）

-第十七节聚类分析（一）

--第十七节聚类分析（一）

-第十八节聚类分析（二）

--第十八节聚类分析（二）

-第五章习题

--第五章习题

第六章相关与回归模型

-第十九节相关和回归分析（一）

--第十九节相关和回归分析（一）

-第二十节相关和回归分析（二）

--第二十节相关和回归分析（二）

-第二十一节相关和回归分析（三）

--第二十一节相关和回归分析（三）

-第二十二节相关和回归分析（四）

--第二十二节相关和回归分析（四）

-第二十三节相关和回归分析（五）

--第二十三节相关和回归分析（五）

-第二十四节违背基本假设的回归（一）

--第二十四节违背基本假设的回归（一）

-第二十五节违背基本假设的回归（二）

--第二十五节违背基本假设的回归（二）

-第二十六节违背基本假设的回归（三）

--第二十六节违背基本假设的回归（三）

-第二十七节多重共线性的诊断和修正（一）

--第二十七节多重共线性的诊断和修正（一）

-第二十八节多重共线性的诊断和修正（二）

--第二十八节多重共线性的诊断和修正（二）

-第六章习题

--第六章习题

第七章定量方法总结与管理类硕士毕业论文指导

-第二十九节硕士学位毕业论文指导（一）

--第二十九节硕士学位毕业论文指导（一）

-第三十节硕士学位毕业论文指导（二）

--第三十节硕士学位毕业论文指导（二）

-第七章习题

--第七章习题

第十二节参数估计笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航课程版权归原始院校所有，
本网站仅通过互联网进行慕课课程索引，不提供在线课程学习和视频，请同学们点击报名到课程提供网站进行学习。