当前课程知识点:概率论与数理统计 >  第六章 数理统计的基本概念 >  第2节 总体、样本和统计量 >  6.2 总体、样本和统计量

返回《概率论与数理统计》慕课在线视频课程列表

6.2 总体、样本和统计量在线视频

下一节:6.3 抽样分布

返回《概率论与数理统计》慕课在线视频列表

6.2 总体、样本和统计量课程教案、知识点、字幕

下面我们学习第二节

总体样本和统计量,本节包括

三个知识点,总体和样本

统计量

分位数,三个知识点

首先我们看第一个知识点,总体和样本

所谓的总体,就是研究对象的全体称为总体

比如一万根钢筋的抗拉强度

就是我们研究的总体

组成总体的每个元素称为个体

再比如,检查某批灯泡的质量

该批灯泡构成一个总体

而每一只灯泡就是一个个体

总体有有限总体和无限总体

比如考察某大学大一两千名男生的身高

这是一个有限总体,再比如

测量一湖泊任一地点的深度

这是一个无限总体

总体对应一个随机变量

比如大学生的身高

湖泊任意一点的深度

笼统的称为

总体X

或Y,Z等

总体用大写字母来表示

下面我们介绍样本

为了考察总体

从总体中随机抽取n个个体

X1,X2,···Xn

称为总体X的一个样本

记为向量X1,X2,···Xn

这里的n称为样本容量

也就是

样本中包含个体的个数

样本X1,X2,···Xn

是一个n维随机变量

样本值

每一次抽取

X1,X2,···Xn所得到的n个

确定的具体数值

记为x1,x2

一直到xn

那么这个具体取值称为样本X1,X2

Xn的一个样本观察值

看一个例题

为了了解数学专业本科毕业生的月薪情况

调查了某地区一百名2013届

数学专业的

本科生的月薪情况,试问

1.什么是总体

2.什么是样本

3.样本容量是多少

在这里总体是该地区2013届

数学本科毕业生的月薪

样本是被调查的一百名2013届

数学本科毕业生的月薪

样本容量是一百

下面我们介绍简单随机样本

若来自总体X的样本X1,X2...Xn

具有以下两个特点

第一

具有代表性

X1,X2,···Xn这些个体

每一个都与总体具有相同的分布

第二

X1,X2,···Xn

是相互独立的随机变量

具有上面两个特性的样本

我们称为简单随机样本

获得简单随机样本的抽样方法

称为简单随机抽样

下面我们介绍样本分布

我们看,样本是一个随机向量

是来自总体X的

简单随机样本,则X1,X2,···Xn的分布

称为样本分布

也就是向量的分布

是样本分布

我们看以下问题

第一,若总体X的分布函数为F(x)

怎样求样本的函数,则样本的函数

我们说是X1,X2,···Xn的

联合分布函数

因为Xi之间相互独立

所以等于边际分布函数的乘积

每个边际分布又和总体的分布是同分布的

所以样本的分布式

i从1到n,F(xi)相乘

如果总体是连续型随机变量

它的密度为f(x),则样本的

联合密度为边际密度的乘积

每个边际密度又和总体的

分布密度是一致的

所以联合密度等于

f(xi)从1到n相乘

若总体X是离散型的

具有分布列P(X=xi)的

概率记为p(xi)

则样本X1,X2,···Xn的

分布律为p(xi)

i从1到n相乘

看下列问题

设总体X服从参数为λ的泊松分布

X1,X2,···Xn是来自总体的样本

求此样本的联合分布列

首先总体的分布列为

X等于k的概率等于k的阶乘分之

λ的k次方,1的-λ次幂

k可以取0,1,2到无穷

因为X1,X2,···Xn相互独立

并且和总体同分布

所以

样本的联合分布律

P(X1=k1,···,Xn=kn)

等于边际分布列的乘积

P(Xi=ki),i从1到n

那么每个边际分布列和

总体的分布列是一样的

所以等于

ki分之λki

e的-λ次幂

i从1到n相乘

在这个乘积中,e的-λ次幂出现了n次

所以总的乘积是

e的-nλ次幂

那么每一项都有一个λki次幂

所以呢是λk1+k2

一直加到kn次幂

分母呢是k1的阶乘

乘以k2的阶乘,一直乘到kn的阶乘

这样我们就得到了样本的联合分布律

再看一个例题,设总体X的分布密度为

f(x)等于当x在0-1

之间的时候

是3x²,其它是0

现在我们求一下样本X1...Xn的

联合密度

联合密度等于边际密度的乘积

每个边际密度是3xi的平方

i从1到n

相乘

这里要求xi在0-1之间

因为只要有一个xi不在这个范围

联合密度就是零

所以我们要求

xi在0到1之间

取值

再看一个问题

设五个学生的数学考试成绩分别为五个值

70、81、95、95、64

第一问,写出由这五个学生的数学考试成绩

构成的总体的概率分布列

第二在该总体中抽取一个容量为2的样本

写出它的所有的观察值

三,写出该样本的联合分布律

首先我们看第一个问题

学生成绩的概率分布列

那么学生的成绩可以取

64、70、81、95

64、70、81这三个分数

各有一个值

所以呢概率都是

五分之一,也就是0.2

95这个分数有两个

所以概率是五分之二,是0.4

现在从总体中抽取一个容量为2的

简单随机样本

可以看作有放回抽取

抽取的样本呢,记作X1、X2

那么X1的取值可以取

64,70,81,95

X2的取值也可以取

64,70,81,95

所以观察值有四乘四个,是十六个

这样就得到了所有的观察值

第三问,样本的联合分布列

我们看一下

X1可以取64,70,81,95

X2也可以取

64,70,81,95

我们看

如果

X1取81,X2取70

它的联合分布列

这时候呢等于边际分布列的乘积

也就等于X1等于81

乘以X2等于70的概率是

五分之一乘以五分之一的概率

等于0.04

如果X1取81,X2取95

它的概率等于X1等于81的概率

等于五分之一,乘以X2等于95的概率

等于五分之二,是二十五分之二

是0.08

就把联合分布列

全都求出来了

这样我们讲了总体、样本

样本观察值

我们看一下它们的关系

大家看,为了研究总体

从总体中按照等可能原则抽取样本

获得了样本的观察值

x1,x2,···xn,我们利用

样本的观察值, 来估计总体的参数

或检验总体的参数

从而得到总体的分布

我们看,统计是从手中已有的资料——样本观察值

去推断总体的分布情况

下面我们介绍

统计量,我们由样本推断总体的时候

不是简单的用样本

而是对样本呢进行加工

这就需要构造一些样本的函数

这些函数把样本中包含的信息集中起来

这样的函数我们称为统计量

我们给出统计量的定义

设X1,X2,···Xn

是来自总体X的样本,称不含

未知参数的样本函数T(X1,X2,···Xn)

为总体X的一个

统计量

也就是

样本的函数称为统计量

不含有除样本以外的任何其它参数

我们看统计量是样本的函数

是一个随机变量

仅依赖于样本

下面我们介绍几个常用的统计量

第一个常用的统计量叫样本均值

Xi,i从1到n

求和

除以n,叫样本均值,记为X拔

它反映了总体均值的信息

它的观察值

也就是把Xi用它的观察值小xi替换

就得到了样本均值的观察值

用小x拔来表示

它的具体取值可以用于推断总体的均值

再看样本方差,是另一个常用的统计量

Xi减去X拔和起来的平方求和

i从1到n,然后除以n-1

得到的这个统计量

记为S的平方,称为样本方差

我们经常用它的变形,是后面这个形式

它的观察值把Xi用

观察值小xi来表示

X拔用样本观察值来替换

得到它的观察值,记作小s的平方

样本方差的观察值经常用来推断

总体的方差

我们看

第三个统计量叫样本k阶

原点矩

记作Ak

Ak等于n分之1

i从1到n,Xi的k次幂

k从1,2

一直取到无穷,可以取到无穷

我们看,当k等于1的时候

样本的1阶原点矩,就是我们前面学习的

样本均值

k阶原点矩的观察值是

用小ak来表示

也就是把样本k阶原点矩中

Xi用它的观察值小xi来替换

得到小ak

下面介绍样本的k阶中心矩

样本的k阶中心矩是

样本分量减去X拔括起来的k次幂

i从1到n求和,除以n

它的观察值也是将样本

用观察值来替换得到

我们看,当k等于2的时候

就是得到了B2,它和样本方差

有这样一个关系

从它的表达式呢,我们能够看出来

看一个问题

在某次期末考试中

随机抽取十三个学生

微积分成绩,得到一组样本值为

80,90,98

一直到78

十三个数值,试计算样本均值

样本方差及样本标准差

首先呢,我们计算样本均值的观察值

那么样本均值的观察值就是把

十三个考试成绩求和除以十三

得到80.92308

我们可以借助于软件来求

例如用matlab或者用

excel函数来求

样本方差的观察值

等于

(Xi-X拔)²

i从1到n,除以n-1

把数带进来以后呢,算出来的结果

是82.87692

这样的计算也可以通过matlab

或excel函数

来求出来

同样呢,我们可以把样本方差

通过S的平方啊

开根号就得到了样本标准差

再看一个问题,设总体X的k阶原点矩

X的k次幂均值等于μk存在

则样本的k阶原点矩依概率收敛于μk

证明

因为X1,X2,···Xn

是相互独立且与X同分布

所以X1的k次幂,X2的k次幂

Xn的k次幂,也相互独立

并且与X的k次幂同分布

那么我们可以得到X1的k次幂的

均值和X2的k次幂的

均值

一直到Xn的k次幂的

均值,都和总体

X的k次幂的均值相等

是等于μk,于是,根据辛钦大数定律

∀ε大于0,当n趋向无穷的时候

样本的k阶原点矩减去μk

小于ε的概率趋向于1,这样我们就

得到了样本的

k阶原点矩

以及概率收敛于μk

对总体的性质进行统计分析

我们看,往往是需要借助于统计量

例如,利用样本均值可以估计总体的均值

用样本方差可以估计总体的方差

用样本的k阶原点矩估计

总体的k阶原点矩等等

寻求合适的统计量,是解决许多

统计问题的关键

下面我们介绍分位数

分位数经常用于计算统计量的概率

首先我们给出分位数的定义

设统计量X服从某种分布

我们取α在(0,1)间的一个数

一般呢,我们取α小于二分之一

如果一个数x1减α满足

统计量X小于等于x1-α

这个概率是等于1-α

大家看,概率和X上界,小x1-α下标

是一致的

是一致的

如果X的密度积分

积到x1-α,概率是1-α

密度从x1-α积到正无穷的概率

就是α

所以我们称x1-α为X的

上α分位数,分位数也称为分位点

或临界值,分位数的下标始终与下侧的概率

是一致的

上α分位数即为随机变量

落在x1-α右侧的概率

从图像上看

若数xα满足X小于等于

xα概率等于α

我们称xα为X的下α分位数

好,我们看一下右边这个边界点

x1-α

那么它的右侧的面积

是α

所以x1-α

是关于α的上分位数

那么xα左侧的面积是α

所以xα是X关于α的

下侧分位数

再看一个问题

在统计中,标准正态统计量

我们常常称为U统计量

对标准正态统计量U

服从标准正态分布

它的上α分位数

根据分位数的记法

应该是u1-α

下α分位数记为uα

我们从图像上看一下

根据密度函数

从负无穷积到u1-α

那么这个积分呢

是负无穷到u1-α的概率

应该是和下标是一致的

是1-α

从图像上我们看一下

uα左侧的概率是α,u1-α

右侧的概率是α,标准正态分布的密度

是偶函数

所以我们说uα和u1-α的

相反数是相等的

这是偶函数的特点

下面我们介绍双侧分位数,对随机变量

它的密度如果是偶函数

那么就应该有双侧分位数

U分布关于α/2的上侧分位数

u1-α/2满足这样一个关系

U大于u1-α/2

概率是α/2

U小于u1-α/2相反数

也就是负的u1-α/2

也等于α/2

那么两边的概率和呢,是α

所以我们称

u1-α/2

为U分布关于α的双侧分位数

那么这个表呢,给出了标准正态分布

上α分位数的一些具体取值

我们要记住一些特殊的值

比如α取0.5,u1-α

也就是u0.5,分位数等于零

从图像上我们能够观察出这个结果的

也就是u0.5等于零

查一下u0.975

我们在书后面有一个常用的数学用表

有标准正态分位数表

从概率栏中找到u0.975,在左侧和

上一栏找到u的具体取值是1.96

好,我们再看u0.025

是等于负的1-α,那么α是0.025

所以是负的u0.975,上面值呢是1.96

所以这里呢是负的1.96

如果α等于0.01

我们求双侧分位数,大家看

u1-α/2

也就是u1减去

二分之零点零一

也就是0.995

查表得到2.57

今天我们学习了总体和样本,统计量,分位数

分位数主要用来计算统计量的概率

好,今天的课我们就上到这里

谢谢大家

概率论与数理统计课程列表:

第一章 概率论的基本概念

-第1节 随机事件

--1.1.1 随机试验、样本空间、随机事件

--1.1.2 事件的关系和运算

--1.1 作业

-第2节 概率的定义和性质

--1.2.1 随机事件的频率及概率

--1.2.2 概率的性质

--1.2 作业

-第3节 古典概型与几何概型

--1.3.1 古典概型

--1.3.2 几何概型

--1.3 作业

-第4节 条件概率

--1.4.1条件概率的概念和概率的乘法公式

--1.4.2 全概率公式

--1.4.3 贝叶斯公式

--1.4 作业

-第5节 随机事件的独立性

--1.5.1 两个事件、三个事件及多个事件的独立性

--1.5.2 n 重伯努利试验

--1.5 作业

-本章测试

--第一章测试

第二章 随机变量及其概率分布

-第1节 随机变量与分布函数

--2.1.1 随机变量

--2.1.2 分布函数

--2.1 作业

-第2节 离散型随机变量

--2.2.1 定义与基本概念

--2.2.2 0-1分布和二项分布

--2.2.3 泊松分布

--2.2 作业

-第3节 连续型随机变量

--2.3.1 定义与基本概念

--2.3.2 均匀分布和指数分布

--2.3.3 正态分布

--2.3 作业

-第4节 随机变量函数的分布

--2.4.1 离散型随机变量函数的概率分布

--2.4.2 连续型随机变量函数的概率分布

--2.4 作业

-本章测试

--第二章测试

第三章 二维随机向量及其分布

-第1节 二维随机向量及其分布函数

--3.1 二维随机向量及其分布函数

--3.1 作业

-第2节 二维离散型随机向量

--3.2 二维离散型随机向量

--3.2 作业

-第3节 二维连续型随机向量

--3.3.1 基本概念与性质

--3.3.2 二维连续型随机向量的例题

--3.3.3 二维均匀分布与二维正态分布

--3.3 作业

-第4节 条件分布与随机变量的独立性

--3.4.1 条件分布

--3.4.2 随机变量的独立性

--3.4 作业

-第5节 随机向量函数的分布

--3.5.1 离散型随机向量函数的分布

--3.5.2 连续型随机向量函数的分布

--3.5 作业

-本章测试

--第三章测试

第四章 随机变量的数学期望

-第1节 数学期望

--4.1.1 离散型随机变量的数学期望

--4.1.2 连续型随机变量的数学期望

--4.1.3 随机变量函数的数学期望

--4.1.4 数学期望的性质

--4.1 作业

-第2节 方差

--4.2.1 方差的定义及性质

--4.2.2 三种离散型随机变量的方差

--4.2.3 三种连续型随机变量的方差

--4.2.4 切比雪夫不等式

--4.2 作业

-第3节 协方差和相关系数

--4.3.1 协方差

--4.3.2 相关系数

--4.3 作业

-第4节 矩和协方差矩阵

--4.4 矩和协方差矩阵

-本章测试

--第四章测试

第五章 大数定律和中心极限定理

-第1节 大数定律

--5.1.1 依概率收敛和伯努利大数定律

--5.1.2 切比雪夫大数定律和辛钦大数定律

--5.1 作业

-第2节 中心极限定理

--5.2.1 独立同分布的中心极限定理

--5.2.2 De Moivre-Laplace 中心极限定理

--5.2 作业

-本章测试

--第五章测试

第六章 数理统计的基本概念

-第1节 数理统计的基本问题

--6.1 数理统计的基本问题

-第2节 总体、样本和统计量

--6.2 总体、样本和统计量

--6.2 作业

-第3节 抽样分布

--6.3 抽样分布

--6.3 作业

-第4节 抽样分布定理

--6.4 抽样分布定理

--6.4 作业

-本章测试

--第六章测试

第七章 参数估计

-第1节 参数点估计

--7.1.1 矩估计法

--7.1.2 最大似然估计法

--7.1.3 估计量的评选标准

--7.1 作业

-第2节 区间估计

--7.2.1 区间估计的概念和术语

--7.2.2 正态总体参数的区间估计

--7.2 作业

-第3节 非正态总计参数的区间估计

--7.3 非正态总体参数的区间估计和单侧置信区间

--7.3 作业

-本章测试

--第七章测试

第八章 假设检验

-第1节 假设检验的基本概念

--8.1.1 假设检验的思想和方法

--8.1.2 假设检验的形式和两类错误

--8.1 作业

-第2节 正态总体参数的假设检验

--8.2.1 正态总体均值的假设检验(方差已知)

--8.2.2 正态总体均值的假设检验(方差未知)

--8.2.3 正态总体方差的假设检验

--8.2.4 两独立正态总体均值相等的假设检验

--8.2.5 两独立正态总体方差相等的假设检验

--8.2 作业

-第3节 非正态总体参数的假设检验

--8.3 非正态总体参数的假设检验

-本章测试

--第八章测试

期末考试

-期末考试

6.2 总体、样本和统计量笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。