当前课程知识点:概率论与数理统计 > 第六章 数理统计的基本概念 > 第2节 总体、样本和统计量 > 6.2 总体、样本和统计量
下面我们学习第二节
总体样本和统计量,本节包括
三个知识点,总体和样本
统计量
分位数,三个知识点
首先我们看第一个知识点,总体和样本
所谓的总体,就是研究对象的全体称为总体
比如一万根钢筋的抗拉强度
就是我们研究的总体
组成总体的每个元素称为个体
再比如,检查某批灯泡的质量
该批灯泡构成一个总体
而每一只灯泡就是一个个体
总体有有限总体和无限总体
比如考察某大学大一两千名男生的身高
这是一个有限总体,再比如
测量一湖泊任一地点的深度
这是一个无限总体
总体对应一个随机变量
比如大学生的身高
湖泊任意一点的深度
笼统的称为
总体X
或Y,Z等
总体用大写字母来表示
下面我们介绍样本
为了考察总体
从总体中随机抽取n个个体
X1,X2,···Xn
称为总体X的一个样本
记为向量X1,X2,···Xn
这里的n称为样本容量
也就是
样本中包含个体的个数
样本X1,X2,···Xn
是一个n维随机变量
样本值
每一次抽取
X1,X2,···Xn所得到的n个
确定的具体数值
记为x1,x2
一直到xn
那么这个具体取值称为样本X1,X2
Xn的一个样本观察值
看一个例题
为了了解数学专业本科毕业生的月薪情况
调查了某地区一百名2013届
数学专业的
本科生的月薪情况,试问
1.什么是总体
2.什么是样本
3.样本容量是多少
在这里总体是该地区2013届
数学本科毕业生的月薪
样本是被调查的一百名2013届
数学本科毕业生的月薪
样本容量是一百
下面我们介绍简单随机样本
若来自总体X的样本X1,X2...Xn
具有以下两个特点
第一
具有代表性
X1,X2,···Xn这些个体
每一个都与总体具有相同的分布
第二
X1,X2,···Xn
是相互独立的随机变量
具有上面两个特性的样本
我们称为简单随机样本
获得简单随机样本的抽样方法
称为简单随机抽样
下面我们介绍样本分布
我们看,样本是一个随机向量
是来自总体X的
简单随机样本,则X1,X2,···Xn的分布
称为样本分布
也就是向量的分布
是样本分布
我们看以下问题
第一,若总体X的分布函数为F(x)
怎样求样本的函数,则样本的函数
我们说是X1,X2,···Xn的
联合分布函数
因为Xi之间相互独立
所以等于边际分布函数的乘积
每个边际分布又和总体的分布是同分布的
所以样本的分布式
i从1到n,F(xi)相乘
如果总体是连续型随机变量
它的密度为f(x),则样本的
联合密度为边际密度的乘积
每个边际密度又和总体的
分布密度是一致的
所以联合密度等于
f(xi)从1到n相乘
若总体X是离散型的
具有分布列P(X=xi)的
概率记为p(xi)
则样本X1,X2,···Xn的
分布律为p(xi)
i从1到n相乘
看下列问题
设总体X服从参数为λ的泊松分布
X1,X2,···Xn是来自总体的样本
求此样本的联合分布列
首先总体的分布列为
X等于k的概率等于k的阶乘分之
λ的k次方,1的-λ次幂
k可以取0,1,2到无穷
因为X1,X2,···Xn相互独立
并且和总体同分布
所以
样本的联合分布律
P(X1=k1,···,Xn=kn)
等于边际分布列的乘积
P(Xi=ki),i从1到n
那么每个边际分布列和
总体的分布列是一样的
所以等于
ki分之λki
e的-λ次幂
i从1到n相乘
在这个乘积中,e的-λ次幂出现了n次
所以总的乘积是
e的-nλ次幂
那么每一项都有一个λki次幂
所以呢是λk1+k2
一直加到kn次幂
分母呢是k1的阶乘
乘以k2的阶乘,一直乘到kn的阶乘
这样我们就得到了样本的联合分布律
再看一个例题,设总体X的分布密度为
f(x)等于当x在0-1
之间的时候
是3x²,其它是0
现在我们求一下样本X1...Xn的
联合密度
联合密度等于边际密度的乘积
每个边际密度是3xi的平方
i从1到n
相乘
这里要求xi在0-1之间
因为只要有一个xi不在这个范围
联合密度就是零
所以我们要求
xi在0到1之间
取值
再看一个问题
设五个学生的数学考试成绩分别为五个值
70、81、95、95、64
第一问,写出由这五个学生的数学考试成绩
构成的总体的概率分布列
第二在该总体中抽取一个容量为2的样本
写出它的所有的观察值
三,写出该样本的联合分布律
首先我们看第一个问题
学生成绩的概率分布列
那么学生的成绩可以取
64、70、81、95
64、70、81这三个分数
各有一个值
所以呢概率都是
五分之一,也就是0.2
95这个分数有两个
所以概率是五分之二,是0.4
现在从总体中抽取一个容量为2的
简单随机样本
可以看作有放回抽取
抽取的样本呢,记作X1、X2
那么X1的取值可以取
64,70,81,95
X2的取值也可以取
64,70,81,95
所以观察值有四乘四个,是十六个
这样就得到了所有的观察值
第三问,样本的联合分布列
我们看一下
X1可以取64,70,81,95
X2也可以取
64,70,81,95
我们看
如果
X1取81,X2取70
它的联合分布列
这时候呢等于边际分布列的乘积
也就等于X1等于81
乘以X2等于70的概率是
五分之一乘以五分之一的概率
等于0.04
如果X1取81,X2取95
它的概率等于X1等于81的概率
等于五分之一,乘以X2等于95的概率
等于五分之二,是二十五分之二
是0.08
就把联合分布列
全都求出来了
这样我们讲了总体、样本
样本观察值
我们看一下它们的关系
大家看,为了研究总体
从总体中按照等可能原则抽取样本
获得了样本的观察值
x1,x2,···xn,我们利用
样本的观察值, 来估计总体的参数
或检验总体的参数
从而得到总体的分布
我们看,统计是从手中已有的资料——样本观察值
去推断总体的分布情况
下面我们介绍
统计量,我们由样本推断总体的时候
不是简单的用样本
而是对样本呢进行加工
这就需要构造一些样本的函数
这些函数把样本中包含的信息集中起来
这样的函数我们称为统计量
我们给出统计量的定义
设X1,X2,···Xn
是来自总体X的样本,称不含
未知参数的样本函数T(X1,X2,···Xn)
为总体X的一个
统计量
也就是
样本的函数称为统计量
不含有除样本以外的任何其它参数
我们看统计量是样本的函数
是一个随机变量
仅依赖于样本
下面我们介绍几个常用的统计量
第一个常用的统计量叫样本均值
Xi,i从1到n
求和
除以n,叫样本均值,记为X拔
它反映了总体均值的信息
它的观察值
也就是把Xi用它的观察值小xi替换
就得到了样本均值的观察值
用小x拔来表示
它的具体取值可以用于推断总体的均值
再看样本方差,是另一个常用的统计量
Xi减去X拔和起来的平方求和
i从1到n,然后除以n-1
得到的这个统计量
记为S的平方,称为样本方差
我们经常用它的变形,是后面这个形式
它的观察值把Xi用
观察值小xi来表示
X拔用样本观察值来替换
得到它的观察值,记作小s的平方
样本方差的观察值经常用来推断
总体的方差
我们看
第三个统计量叫样本k阶
原点矩
记作Ak
Ak等于n分之1
i从1到n,Xi的k次幂
k从1,2
一直取到无穷,可以取到无穷
我们看,当k等于1的时候
样本的1阶原点矩,就是我们前面学习的
样本均值
k阶原点矩的观察值是
用小ak来表示
也就是把样本k阶原点矩中
Xi用它的观察值小xi来替换
得到小ak
下面介绍样本的k阶中心矩
样本的k阶中心矩是
样本分量减去X拔括起来的k次幂
i从1到n求和,除以n
它的观察值也是将样本
用观察值来替换得到
我们看,当k等于2的时候
就是得到了B2,它和样本方差
有这样一个关系
从它的表达式呢,我们能够看出来
看一个问题
在某次期末考试中
随机抽取十三个学生
微积分成绩,得到一组样本值为
80,90,98
一直到78
十三个数值,试计算样本均值
样本方差及样本标准差
首先呢,我们计算样本均值的观察值
那么样本均值的观察值就是把
十三个考试成绩求和除以十三
得到80.92308
我们可以借助于软件来求
例如用matlab或者用
excel函数来求
样本方差的观察值
等于
(Xi-X拔)²
i从1到n,除以n-1
把数带进来以后呢,算出来的结果
是82.87692
这样的计算也可以通过matlab
或excel函数
来求出来
同样呢,我们可以把样本方差
通过S的平方啊
开根号就得到了样本标准差
再看一个问题,设总体X的k阶原点矩
X的k次幂均值等于μk存在
则样本的k阶原点矩依概率收敛于μk
证明
因为X1,X2,···Xn
是相互独立且与X同分布
所以X1的k次幂,X2的k次幂
Xn的k次幂,也相互独立
并且与X的k次幂同分布
那么我们可以得到X1的k次幂的
均值和X2的k次幂的
均值
一直到Xn的k次幂的
均值,都和总体
X的k次幂的均值相等
是等于μk,于是,根据辛钦大数定律
∀ε大于0,当n趋向无穷的时候
样本的k阶原点矩减去μk
小于ε的概率趋向于1,这样我们就
得到了样本的
k阶原点矩
以及概率收敛于μk
对总体的性质进行统计分析
我们看,往往是需要借助于统计量
例如,利用样本均值可以估计总体的均值
用样本方差可以估计总体的方差
用样本的k阶原点矩估计
总体的k阶原点矩等等
寻求合适的统计量,是解决许多
统计问题的关键
下面我们介绍分位数
分位数经常用于计算统计量的概率
首先我们给出分位数的定义
设统计量X服从某种分布
我们取α在(0,1)间的一个数
一般呢,我们取α小于二分之一
如果一个数x1减α满足
统计量X小于等于x1-α
这个概率是等于1-α
大家看,概率和X上界,小x1-α下标
是一致的
是一致的
如果X的密度积分
积到x1-α,概率是1-α
密度从x1-α积到正无穷的概率
就是α
所以我们称x1-α为X的
上α分位数,分位数也称为分位点
或临界值,分位数的下标始终与下侧的概率
是一致的
上α分位数即为随机变量
落在x1-α右侧的概率
从图像上看
若数xα满足X小于等于
xα概率等于α
我们称xα为X的下α分位数
好,我们看一下右边这个边界点
x1-α
那么它的右侧的面积
是α
所以x1-α
是关于α的上分位数
那么xα左侧的面积是α
所以xα是X关于α的
下侧分位数
再看一个问题
在统计中,标准正态统计量
我们常常称为U统计量
对标准正态统计量U
服从标准正态分布
它的上α分位数
根据分位数的记法
应该是u1-α
下α分位数记为uα
我们从图像上看一下
根据密度函数
从负无穷积到u1-α
那么这个积分呢
是负无穷到u1-α的概率
应该是和下标是一致的
是1-α
从图像上我们看一下
uα左侧的概率是α,u1-α
右侧的概率是α,标准正态分布的密度
是偶函数
所以我们说uα和u1-α的
相反数是相等的
这是偶函数的特点
下面我们介绍双侧分位数,对随机变量
它的密度如果是偶函数
那么就应该有双侧分位数
U分布关于α/2的上侧分位数
u1-α/2满足这样一个关系
U大于u1-α/2
概率是α/2
U小于u1-α/2相反数
也就是负的u1-α/2
也等于α/2
那么两边的概率和呢,是α
所以我们称
u1-α/2
为U分布关于α的双侧分位数
那么这个表呢,给出了标准正态分布
上α分位数的一些具体取值
我们要记住一些特殊的值
比如α取0.5,u1-α
也就是u0.5,分位数等于零
从图像上我们能够观察出这个结果的
也就是u0.5等于零
查一下u0.975
我们在书后面有一个常用的数学用表
有标准正态分位数表
从概率栏中找到u0.975,在左侧和
上一栏找到u的具体取值是1.96
好,我们再看u0.025
是等于负的1-α,那么α是0.025
所以是负的u0.975,上面值呢是1.96
所以这里呢是负的1.96
如果α等于0.01
我们求双侧分位数,大家看
u1-α/2
也就是u1减去
二分之零点零一
也就是0.995
查表得到2.57
今天我们学习了总体和样本,统计量,分位数
分位数主要用来计算统计量的概率
好,今天的课我们就上到这里
谢谢大家
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试