当前课程知识点:心理统计 > 5 Z分数 > 5.2 Z分数的分布及转换 > 5.2 Z分数的分布及转换
大家好
今天我们接着学习Z分数的相关知识
那么这一节课我们主要讲Z分数的分布和转换
在这一个部分我们主要让大家了解的内容
首先是使用Z分数将一个分布标准化
第二个是基于Z分数的另外的
一些其他的标准分布
最后我们还会讲到在统计推断中Z分数的应用
和异常值的确定
对于Z分数来讲的话
那么上一节课我们讲过了
Z分数它如何计算
我们回忆一下
我们知道说Z分数它实际上
就是每一个原始的分数减去
它所在的群体的平均分数除以标准差
而得来的
那么使用Z分数它可以把一个分布
转换到另外的一个分布上面
所转换得来的新的分布
我们把它叫做标准化
我们来看一下
也就是说通过Z分数的转换
分数中原来的数值X
就转换成了一个相应的Z分数
这时候原来的X的分布
就转换成了Z分数的这样的一个分布
转换得来的这个分布我们把它叫做标准化的转换
我们也可以说是把整个分布标准化了
我们来看一下
假如说有一个总体它的分布是服从
这样的一个正态分布了
平均数是一百
标准差是十
这是我们说原来的一个总体的这样一个分布
Z分数的转换
我们知道原来总体中的每一个X
都就转换为一个Z分数
现在转换后的Z分数
它所服从的分布应该是什么样的
原来的均值一百就转换到了Z分数等于0的
这样的一个位置
那么原来高于标准差
那么标准差是十
高于均值一个标准差的分数
也就是说110这个分数转化为Z分数以后
它呢Z就是等于1的
所以转换成了这样
那么原来的这样的一个分布
通过Z分数的转换就转换成了
也是这样的一个分布
我们来看它的分布的形态其实是一样的
只不过现在的尺度变了
均值转到了零的位置
高于一个标准差的110分
现在对应的Z分数是一低于均值一个标准差的
这个90分呢
它转成了Z等于负1这样的一个值
那么我们说这一种转换
我们又把它叫做通过Z分数
把一个原始的分布转换成了一个标准化的分布
这是我们说对于总体而言
下面我们来看一个样本数据的例子
也就是说如果说我们测查
得到的是一个样本的数据
这是一个样本的这样的一个数据了
我们如何通过Z分数的转换
把它转化到另外的一个分布上
同样的道理
在这个部分这是原始数据的分布
Z分数的转换就是每一个原始的数据X
通过一个变换
减去均值除以标准差
那么我们说在这一个样本数据里面
我们得到的样本均值是等于3
那么我们说这个部分这是它的样本的标准差了
那么我们可以算出来的一个数值
什么叫标准化
就是说所有的Z都减去一个均值除以标准差
那么我们现在就划到了这样的一个尺度上
那么这个分布就叫做一个Z分数转换以后
得来的这个分布
我们又把它叫做标准化的转换
这就是我们说首先使用Z分数
它可以把一个分布转换到另外的一个尺度上面
转换的这个尺度我们看到它有一个共同的特点
原来的平均数就对应于都是零了
比标准差大一的
现在对应的标准分数都是一
这是我们说分数分布的这样的一个转换
转换以后它有什么样的特点呢
那么我说它把原始的分布X的分布
转换为Z分数的分布以后具有哪一些性质
首先那么我们说Z分数的转换
它是一个线性的转换
它不会改变原始的数据在群体中的一个
位置的高低
因此那么我们说Z分数的转换
作为一个线性的转换
它同原始分数的分布的形态是完全相同的
如果说你原来的数据的分布是正态分布
转换完以后仍然会是一个正态分布
但是如果说你原来的分布它不是正态的
而是偏态的分布
那么这样的一个简单的Z分数的转换
它依然会是一个偏态的这样的一个分布
原始分数变成Z分数之后
它不会改变在分布中的一个相对的位置的高低
这是我们说它的第一个性质
另外X转化为Z以后
它都会以X的均值为中心点
也就是原来均值所对应的
Z分数里面Z分数的值都是等于0的
原来一个标准差转换了以后
那么我们说Z分数
它就会以这个标准差为单位了
所以Z分数就有一个很重要的性质
不管是什么样的分布
只要是转换为Z分数以后
Z分数的平均数将会是零
标准差永远都是一
这是我们说Z分数均值和标准差
正是因为它的平均数和标准差
有这样的一个特点
所以我们在统计上又把这样的转换
叫做标准化的分布的转换
也就是说我不管你原来的均值是多少
标准差是多少
只要通过Z分数的转换
转换完以后
这个Z分数的分布
它的均值一定是等于0的
标准差一定是等于1的
这样我们把它叫做标准化的分布
当然了基于Z分数
它同样也会有其他的解释上的一些局限性
虽然我们前面在说Z分数它的意义更加明确了
但是我们也知道Z分数通过这样的一个转换
它的平均数变成了零了
也就是说会有一些数值对应的Z分数是大于零的
有一些值是对Z分数来讲它是小于零的
那么这样子的话也就是说
转换以后的Z分数里面
它是包含有负值和一些小数的值的
在我们心理学的应用里面
比如说在我们心理测验的应用里面
经常大家对于这些小数的值或者对于负值
其实解释起来往往是有一些困难的
为了解决这样的一个问题
那么我们说我们经常还会把Z分数
再去做一个转换
也就是说转换得到的Z分数以后
再把它转换为预先设定好了的一个平均数
和标准差的这样的一个分布上面
我们构建这样的一个分布的目的
就是为了使得这个分数的
这样的一个它可解释性依然存在
而且从分数的表示上来讲更加容易理解
更加合理
那么我们说也就是通常在心理测量里面
我们讲的一个标准化的分数
也就是把Z分数再做一个转换
我们把它记作标准T分数
这个转换就是原始的分数转化为Z分数以后
那么我们说再把它去做一个线性的转换
那么我们说转换以后的T分数
它的平均分数就是这个b
标准差就是a
因此那么我们说它可以转换到
我们预先设定的一个均值
和标准差的这样的一个尺度上
比如说我们想要让转换以后的T分数
它的平均值是一百
那么我们只要让b等于100
如果我们想要让它的标准差是十
我们只要让这个a等于10就可以做到这一点
所以说测量上所用的这种标准的T分数的转换
其实是基于Z分数的转换而得来的一个转换
那么我们再来看一下
比如说那么我们说SAT的考试
和智力测验的一些分数
经常就是基于Z分数而转换得来的
另外一种形式的标准的分布
它通常第一步是把X转化为Z分数
所以我们知道这一步就是
每一个数字要减去它的平均值
再除以它的标准差
就得到Z分数
然后为了使得这个数据更加容易解释
再把Z分数转化为一个标准的T分数
那么T分数里面我们就可以转换到我们预想的
平均值和标准差
通过确定a和b的值
我们就可以转换到我们希望的这样的一个尺度上
那么这一个转换的过程
实际上是两步的线性转换了
两步的线性转换
它不会改变原始数据
在分布中的一个相对的位置
这是很重要的一点
那么我们说这样的一个分数的转换
它可以使得我们这个分数保持了Z分数
它的一个明确的意义的前提下
又符合我们的解释分数的习惯
我们来看一个例子
这是原始的数据的一个分布
那么原始的数据的分布
现在我们的平均值是57分
标准差是14
那么现在如果我想要把这个数据的分布
转换到另外的一个标准的这样的一个分布上
首先第一步我们去做Z分数的转换
也就是所有的分数要减去它的平均值57
再除以它的标准差14
那么我们把57就转到了零的这个位置
那么43就转换到了负1的这样的一个位置
如果我们想要让这个分数
它再到另外的一个尺度上
比如说我们现在想把它转换到一个
标准化的T分布的这样的一个分数上
使得它的均值等于50
标准差等于10
那么我们只要在我们转换的标准分数的基础上
做一个转换
50加上标准差是十
就是十乘以Z
所以我们的T分数的转换就是什么
T等于50+10Z
我们就会得到这样的一个分布
那么在这个分布里面
如果我们来看一个数值
比如说原来低于标准差一个标准差
那么也就是低于14分的这样的一个个体
43分
那么转化为标准分数
它对应的是负1
那么再转化为T分数
它对应的就是低于它的均值
一个标准差的位置也就是40分
这就是我们说这样的一个分数的转换
使得分数更加容易解释
而没有改变它在群体中的这样的一个位置
这是我们通过例子来说这一点
基于Z分数的转换
实际上在测验里面还是特别的常用
比如说我们经常大家会说到的IQ的这个分数
那么IQ的分数实际上来讲就是一个标准的
这样的一个T分数
也就是说首先是做了一个标准分数的转换
然后又把它转换到了平均值是一百
标准差是15的这样的一个分数上面
这在我们测验上经常会用到
那么里面就会用到一个Z分数和T分数
之间的这样的一个转换
希望大家能够理解这一点
那么我们知道了Z分数知道了一个Z分布以后
那么我们说我们就可以去判断
一个个体它到底是不是一个极端的一个个体了
怎么来讲这一件事呢
也就是说我们通常在统计里面
我们是希望通过样本的数据来推断总体的情况
或者说在心理学的研究里面
我们经常希望判断一个实验的处理
它会不会有效果
或者说它会不会对我们的实验结果有影响
如果为了判断这一点的话
我们经常就会去说
在一个样本里面我们对它做了一些处理
然后我们又去测量了
那么我们知道这个原始数据
如果我们把它转化为Z分数的话
我们怎么来看
如果说是一个典型的有代表性的个体
那么它转换完得来的Z分数
应该说在我的分布里面
它在靠近中间的位置
因为它靠近中间的位置的可能性是最大的
但是如果说接受完实验处理以后
我转换的这个Z分数它变成了一个和一般的这个个体
显著不同的这样的一个个体
我们可能就会去判断说这个个体
它可能是一个改变了的
或者说是和一般的个体有显著差异的
这样的一个个体
那么在后面的推断统计里面
我们还会返回来再去讲这一点
实际上我们说因为Z分数它可以表示一个数据
在群体中的这样的一个位置了
所以说通过我们计算它的Z分数就可以来判断
这个个体在它的这个样本的分布里面
它到底是不是一个极端的这样的一个个体
通过这一点我们经常也会用来
做异常值的一个确定
那么我们说做异常值的判断主要是来源于
下面的这一个结论
也就是说假如说一组数据它是服从正态分布的
那么我们说对于正态分布在平均数
上下一个标准差的位置
其实它所包含的这个个体的数量比例是一定的
比如说在正负1个标准差之内的区域范围
是包含了68.26%的数值
也就是说如果说一个分布是正态分布的
那么我们说这个数字
落在正负1个标准差之内的可能性就有68.26%
落在正负2个标准差之间的可能性是95.45%
落在三个标准差之内的可能性就有99.73%
也就是说如果说你随机的从一个正态分布中
去抽取一个个体的话
你抽到的这个个体落在正负3个标准差之内的可能性
是有99.73%的这样的一个可能的
正是根据这样的一个结论
我们就可以去判断一个个体
它会不会是一个极端的这样的一个数字
也就是说我们会利用
三个标准差的这样的一个原则
对于一个数据来讲
我们知道如果是一个随机的抽样
它落在三个标准差之外的可能性
其实不足0.27%了
那么我们说对于一个数据
我们就可以去计算它的标准分数
如果说它对应的标准分数的绝对值大于三了
那么我们可能就说这个数字
它是一个特别极端的值
也就是说它几乎不可能出现了
这样的一个值我们就把它
作为判断这个异常值的一个标准
这是我们说到的三个标准差的这样的一个原则
来做异常值的一个判断
那么我们说这是我们这一节课主要讲到的内容
那么在这一节课我们首先要清楚的就是说
原来的一个原始的分布
通过一个Z分数的转换
转换到另外的一个分布里面
这个分布它就有特别好的一个性质
不管原来的分布是什么样的
转换以后的Z分数的分布
它的平均值就会等于0
标准差是等于1的
因此我们又把这个分布叫做标准化的分布
对于标准化的分布
那么我们说依此我们还在测验中
去转换另外的一系列的标准分数
那么我们说基于Z分数
它和正态分布中的一个概率的关系
我们经常在推断统计
或者说作为极端数值的选取的时候
我们可能会用到的一个标准
就是来判断这个Z分数
是不是一个显著不同的这样的一个个体
也就是我们讲到的三个标准差的
这样的一个原则
这是我们这一节课主要讲的内容
好谢谢大家
-1.1 统计学的意义
-1.2 心理统计简介
-1.3 基本概念介绍1
-1.4 基本概念介绍2
-1.4 基本概念介绍2--作业
-1.5 研究方法
--1.5 研究方法
-2.1 统计表和统计图简介
--2.1 统计图表
-2.1 统计表和统计图简介--作业
-2.2 频数分布表
-2.2 频数分布表--作业
-2.3 频数分布图
-2.3 频数分布图--作业
-2.4 百分位数和百分等级
-2.4 百分位数和百分等级--作业
-3.1 平均数
--3.1 平均数
-3.1 平均数--作业
-3.2 中数
--3.2 中数
-3.2 中数--作业
-3.3 众数
--3.3 众数
-3.3 众数--作业
-4.1 全距和四分位距
-4.1 全距和四分位距--作业
-4.2 标准差和方差
-4.2 标准差和方差--作业
-4.3 差异系数
--4.3 差异系数
-4.3 差异系数--作业
-5.1 Z分数介绍
-5.1 Z分数介绍--作业
-5.2 Z分数的分布及转换
-5.2 Z分数的分布及转换--作业
-6.1 概率的基本概念
--6.1 概率与二项分布--作业
-6.2 概率与二项分布
-6.2 概率与二项分布--作业
-6.3 概率与正态分布
-6.3 概率与正态分布--作业
-6.4 抽样分布与推论统计
-6.4 抽样分布与推论统计--作业
-7.1 假设检验的一般原理
-7.1 假设检验的一般原理--作业
-7.2 假设检验的一般过程
-7.2 假设检验的一般过程--作业
-7.3 假设检验的不确定性和误差
-7.3 假设检验的不确定性和误差--作业
-7.4 有方向的假设与单侧检验
-7.4 有方向的假设与单侧检验--作业
-8.1 t统计量与t检验
-8.1 t统计量与t检验--作业
-8.2 单样本t检验的方法
-8.2 单样本t检验的方法--作业
-8.3 有方向的检验和单侧检验
-8.3 有方向的检验和单侧检验--作业
-9.1 独立样本t检验
-9.1 独立样本t检验--作业
-9.2 独立样本t检验的应用
-9.2 独立样本t检验的应用--作业
-10.1 相关样本t检验方法
-10.1 相关样本t检验方法--作业
-10.2 有方向的假设和单侧检验
-10.2 有方向的假设和单侧检验--作业
-11.1 效应量的测量
-11.1 效应量的测量--作业
-11.2 均值检验效应量
-11.2 均值检验效应量--作业
-11.3 统计检验力及其影响因素
-11.3 统计检验力及其影响因素--作业
-12.1 参数估计的基本内容
-12.1 参数估计的基本内容--作业
-12.2 用t统计量作参数估计
-12.2 用t统计量作参数估计--作业
-12.3 假设检验和参数估计
-12.3 假设检验和参数估计--作业
-13.1 方差分析的逻辑
-13.1 方差分析的逻辑--作业
-13.2 方差分析的计算
-13.2 方差分析的计算--作业
-14.1 完全随机单因素方差分析
-14.1 完全随机单因素方差分析--作业
-14.2 方差分析的测量效应和事后检验
-14.2 方差分析的测量效应和事后检验--作业
-15.1 重复测量单因素实验设计
-15.1 重复测量单因素实验设计--作业
-15.2 重复测量单因素方差分析的逻辑和计算
-15.2 重复测量单因素方差分析的逻辑和计算--作业
-16.1 完全随机两因素实验设计
-16.1 完全随机两因素实验设计--作业
-16.2 完全随机两因素方差分析的逻辑和计算
-16.2 完全随机两因素方差分析的逻辑和计算--作业
-16.3 简单效应检验
-16.3 简单效应检验--作业
-16.4 完全随机两因素方差分析的效应值和事后检验
-16.4 完全随机两因素方差分析的效应值和事后检验--作业
-17.1 相关概述
-17.1 相关概述--作业
-17.2.1 皮尔逊相关1
-17.2.1 皮尔逊相关1--作业
-17.2.2 皮尔逊相关2
-17.2.2 皮尔逊相关2--作业
-17.3 等级相关
-17.3 等级相关--作业
-17.4 点二列相关和二列相关
-17.4 点二列相关和二列相关--作业
-17.5 φ相关
--17.5 φ相关
-17.5 φ相关--作业
-18.1 简单线性回归
-18.1 简单线性回归--作业
-18.2 回归模型和回归系数
-18.2 回归模型和回归系数--作业
-18.3 线性回归的基本假设
-18.3 线性回归的基本假设--作业
-18.4 变异的分解
-18.4 变异的分解--作业
-18.5 回归方程的估计标准误
-18.5 回归方程的估计标准误--作业
-18.6 回归方差的有效性检验
-18.6 回归方差的有效性检验--作业
-19.1 二项检验
-19.1 二项检验--作业
-19.2 卡方检验
-19.2 卡方检验--作业
-19.3 四格表及列联表
-19.3 四格表及列联表--作业
-20.1 非参数检验概述
-20.1 非参数检验概述--作业
-20.2 单样本非参数检验
-20.2 单样本非参数检验--作业
-20.3 两独立样本非参数检验
-20.3 两独立样本非参数检验--作业
-20.4 多个独立样本非参数检验
-20.4 多个独立样本非参数检验--作业
-20.5 两个配对样本非参数检验
-20.5 两个配对样本非参数检验--作业
-20.6 多配对样本的非参数检验
-20.6 多配对样本的非参数检验--作业