当前课程知识点:医学统计学(高级篇) > 第六章 几种离散型变量的分布及其应用 > 6-5泊松分布的概念与特征 > Video
大家好
我是来自中南大学湘雅公共卫生学院的
杨芳老师
今天我们一起来学习第六章的第五个知识点
泊松分布的概念与特征
什么叫做泊松分布呢
如果我们讲一个随机变量
X它服从泊松分布的话
是指我们在足够多的N次独立的伯努力
实验当中
取值X的概率为
当然这个X的取值可以为0 1 2
一直到无穷大
其中这个式子当中
E字母E是自然数一
拉姆达是分布的参数
也就是说是泊松分布的总体均数
而且我们有所有的px的之和等于1
如果随机变量X能够服从一个这样的
概率分布的话
我们把X叫做服从以拉姆达为参数的
泊松分布记作
X服从P拉姆达
这个P就是泊松分布的英文名字poisson destribution
的第一个字母P
服从泊松分布的事件实际上有很多
在我们医学研究当中
比如说我们要研究人群当中的一些遗传缺陷
癌症等等这些发病率很低的非传染性疾病的话
我们研究他们的这些他们的发病人数或者
是患病人数的分布的时候
他们往往是服从泊松分布的
第二种类型就是我们经常要研究单位时间之内
或者是单位空间之内
或者是单位容积之类
某罕见事件发生次数的分布
比如说我们要分析在单位面积里面
或者是单位容积里面细菌数的分布
在单位空间里面
某种昆虫或者是野生动物数的分布等等
它们也是服从泊松分布的
那么泊松分布的适用条件是什么
假定我们在规定的观测单位内某个事件
我们把这个事件定义为阳性事件
它平均发生的次数是拉姆达的话
也就是说我规定的观测空间也叫做观测单位
阳性事件的平均发生次数是拉姆达
那么它的样本技术
X也就是说我从中间抽取一个样本
这个样本的阳性数X
当然这个X的取值可以从零一直取值到
无穷大
在满足下面三个条件的时候
是服从以拉姆达为均数的泊松分布的
那么满足哪三个条件呢
第一个条件
普通性
什么叫做普通性
就是在充分晓得观测单位上X的取值最多为一
这句话怎么来理解
比如说我们假定是研究罕见疾病的分布
比如说癌症
这些疾病的分布的话
如果我们以某个社区为观察单位
那么对于每一个居民阳性数取值最多为一
因为我们是研究某种癌症的人数的分布
如果我只研究一个居民
那么癌症的人数的取值最多为一
要么就是零
要么就是一
最多为一
这是第一个普通性
也就是我把这个社区有多少个居民
我就可以把它划分为多少个充分小的观测单位
在每一个观测单位上
癌症数取值最多为一
第二点
独立增量性在某个观测单位上
X的取值与前面个观测单位上X的取值
无关
也就是它们之间是互相独立的
我们刚刚说的是研究的癌症的罕见疾病的分布
它们之间不具有传染性
也就说这个体他的X的取值与前面其他的居民
各个观测单位上X的取值是无关的
它不具有传染性
这个代表它们之间是彼此独立的
第三点平稳性
X取值只与观测单位的大小有关
而与观测单位的位置无关
也就是我以这个一个社区做我的研究单位
我的观测单位
那么这个社区的患癌的人数只与我观测
单位的大小有关
我调查了多少人
人调查的人越多
那么画的数量肯定理论上是越多的
而与我的观测的位置无关
也就是说它们的分布应该是均匀分布的
而不是存在在某一个位置分布的多些
另外一个位置分布的少一些
这是他的第三个特点
平稳性
当X满足这三条性质的时候
他就服从以拉姆达为均数的泊松分布
接下来我们看看泊松分布的性质
泊松分布的性质
第一点就是它的总体均数拉姆达
与总体方差西格玛平方是相等的
这是泊松分布的一个非常重要的特征
也就说它的拉姆达是等于西格玛的平方的
也就是它的谬等于拉姆达
西格玛平方也等于拉姆达总体均数拉姆达与
与总体方差西格玛平方相等是他的一个
非常重要的特征
第二点N很大π很小N乘以π等于拉姆达
为常数的时候
二项分布就近似于泊松分布了
第三点就是拉姆达增大的时候泊松分布也
会接近正态分布了
一般而言拉姆达大于等于20的时候
我们泊松分布的资料都可以把它当作
正态分布来处理
第四点泊松分布具有可加性
也就说对于服从泊松分布的M个互相独立
的随机变量X1X2XM它们的之和也会
服从泊松分布
而且它的均数是这M个随机变量的均数之和
这是泊松分布的可加性
接下来我们看看泊松分布的图形
第一点不同的参数拉姆达
因为我们知道泊松分布就有一个参数拉姆达
拉姆达不同
对于不同的泊松分布
也就说拉姆达的大小就决定了泊松分布的
图形特征
我们从图6-3可以看出来
左上方的小图是拉姆达等于1
然后右边右上方就是拉姆达等于2
左下方是拉姆达等于3
接下来右下方是拉姆达等于5
这是给出了四个拉姆达的时候的不同的
泊松分布的图形
也就是说拉姆达的大小决定了泊松分布的
图形特征
你看
随着拉姆达的变化
图形的分布都发生了变化
第二点
我们再具体观察这个图形
拉姆达越小的时候分布就越偏态
大家可以看到上面的两个小图是
拉姆达等于1拉姆达等于2的时候
它们的分布是偏态的也就是不对称
在拉姆达慢慢增大的时候
比如说拉姆达等于3到拉姆达等于5的时候
分布就越来越对称了
而且当它越来越大的时候
泊松分布应该也类似于正态分布了
接下来我们再看看
当拉姆达大于等于1的时候
大家可以看到拉姆达等于2的时候
这个是拉姆达等于3的时候
这个是拉姆达等于5的时候
我们发现随着PX的值是先有一个增大
后减小的一个趋势的
但是当拉姆达很小
比如说它等于1或者是还比一还要小的时候
这是随着X取值的变大
PX值反而变小
因为它的拉姆达均数都比一要小
所以随着你这个X取值要变大的话
PX值肯定是要变小的
如果拉姆达为整数的时候
大家可以看到
拉姆达等于234的时候
我们发现PX值什么时候取得最大值就是
在拉姆达等于X
X等于拉姆达处和X等于拉姆达减一的位置
X等于拉姆达处和X等于拉姆达减一的位置
取得最大值
这是关于泊松分布的一些基本概念与特征
利用泊松分布来进行统计推断
也就是说我们可以利用它对样本的均数做
一个估计
或者是做一些样本之间均数差异的比较
也就说假设检验的问题
我们就不在这次课上赘述了
大家可以课后去看书
本知识点就介绍到这
-1. 医学统计学概述
--Video
-2.统计学的几个基本概念
--Video
-3.医学统计工作的基本步骤
--Video
-第一章 绪论--章节测试
-1.频数分布表与频数分布图
--Video
-2.集中趋势描述
--Video
-3.离散趋势描述
--Video
-4.正态分布
--Video
-5.医学参考值范围的制度
--Video
-6.常用相对数
--Video
-7.应用相对数的注意事项
--Video
-8.率的标准化法
--Video
-第二章 计量资料统计描述及计数资料统计描述--章节测试
-1. 均数的抽样误差与标准误差
--Video
-2.t分布
--Video
-3.总体均数的估计
--Video
-4.假设检验的基本原理与步骤
--Video
-5.t检验
--Video
-6.假设检验的注意事项
--Video
-第三章 章节测试
-第一节 方差分析的基本思想及应用条件
--Video
-第二节 完全随机设计资料的方差分析
--Video
-第三节 随机区组设计资料的方差分析
--Video
-第四节 多个样本均数间的多重比较
--Video
-第四章 多个样本均数比较的方差分析--章节测试
-5-1 卡方检验——卡方检验的基本思想
--Video
-5-2 卡方检验——独立样本四格表资料的卡方检验
--Video
-5-3 卡方检验——配对四格表资料的卡方检验
--Video
-5-4 卡方检验——四格表资料的确切概率法
--Video
-5-5 卡方检验——行×列表资料的卡方检验
--Video
-5-6 卡方检验——卡方检验的多个样本率间的多重比较
--Video
-5-7 卡方检验——卡方检验用于拟合优度检验
--Video
-第五章 x²检验--章节测试
-6-1二项分布的概念
--Video
-6-2二项分布的特征
--Video
-6-3二项分布的应用—总体率的区间估计
--Video
-6-4二项分布的应用—率的假设检验
--Video
-6-5泊松分布的概念与特征
--Video
-第六章 几种离散型变量的分布及其应用--章节测试
-第一节 秩和检验概述
--Video
-第二节 Wilcoxon符号秩检验
--Video
-第三节 Wilcoxon秩和检验
--Video
-第四节 Kruskal-Wallis H检验
--Video
-第五节 Friedman M检验
--Video
-第七章 秩转换的非参数检验--章节测试
-第一节 统计表
--Video
-第二节 直条图和直方图
--Video
-第三节 圆图和百分条图
--Video
-第四节 线图和半对数线图
--Video
-第五节 散点图与统计地图
--Video
-第六节 箱图
--Video
-第八章 统计表与统计图--章节测试
-第一节 -概述
--Video
-第二节 直线回归
--Video
-第三节 直线回归中的统计推断
--Video
-第四节 双变量回归与相关-直线相关
--Video
-第五节 回归与相关中的注意事项
--Video
-第六节 秩相关
--Video
-第九章 双变量回归与相关--章节测试
-第一节 多因素试验
--Video
-第二节 两因素析因设计资料的方差分析01
--Video
-第三节 两因素析因设计资料的方差分析02
--Video
-第四节 三因素析因设计资料的方差分析
--Video
-第五节 正交设计与方差分析
--Video
-第六节 嵌套设计资料的方差分析
--Video
-第七节 裂区设计资料的方差分析
--Video
-第十章 章节测试
-第一节 重复测量资料的反差分析
--Video
-第二节 重复测量数据的两因素两水平分析
--Video
-第三节 重复测量数据的两因素多水平分析
--Video
-第四节 重复测量数据的多重比较
--Video
-第十一章 章节测试
-第一节 协方差分析的基本思想和步骤
--Video
-第二节 完全随机设计资料的协方差分析
--Video
-第三节 随机区组设计资料的协方差分析
--Video
-第十二章 章节测试
-第一节 多变量数据的统计描述
--Video
-第二节 多变量数据的统计推断-单组比较
--Video
-第三节 多变量数据的统计推断-两组比较
--Video
-第四节 多变量数据的统计推断-多组比较
--Video
-第五节 重复测量设计的多变量分析
--Video
-第十三章 多变量数据的统计描述与统计推断--章节测试
-1.多元线性回归模型
--Video
-2.多元线性回归模型的假设检验
--Video
-3.多元线性回归模型自变量的选择
--Video
-4.多元线性回归模型应用及其注意事项
--Video
-第十四章 多元线性回归分析--章节测试
-1Logistic 回归分析——logistic回归分析的概述
--Video
-2Logistic 回归分析——logistic回归分析的概念
--Video
-3Logistic 回归分析——成组(非条件)logistic回归分析
--Video
-4回归分析—— 配对(条件)logistic回归分析
--Video
-5Logistic 回归分析—— logistic回归的应用
--Video
-第十五章 logistic回归分析--章节测试
-第一节 生存分析中的基本概念
--Video
-第二节 生存率的估计与生存曲线
--Video
-第三节 生存率的比较
--Video
-第四节 Cox比例风险回归模型
--Video
-第十六章 章节测试
-第一节 判别分析-概论
--Video
-第二节 判别分析-Fisher判别
--Video
-第三节 判别分析-最大似然和Bays公式判别法
--Video
-第四节 判别分析-Bayes判别法与逐步判别
--Video
-第十七章 章节测试
-第一节 聚类分析-概论
--Video
-第二节 聚类分析-系统聚类法
--Video
-第三节 聚类分析-动态样品聚类
--Video
-第十八章 聚类分析--章节测试
-第一节 SPSS-概述
--Video
-第二节 SPSS-数据文件的建立
--Video
-第三节 SPSS-数据文件的管理
--Video
-第四节 SPSS-计量资料的统计分析-描述性统计量
--Video
-第五节 SPSS-计量资料的统计分析-均数比较-t检验
--Video
-第六节 SPSS-计量资料的统计分析-均数比较-完全随机设计资料的方差分析
--Video
-第七节 SPSS-计量资料的统计分析-均数比较-随机区组设计资料的方差分析_医学统计学
--Video
-第八节 SPSS-计量资料的统计分析-均数比较-拉丁方设计资料的方差分析
--Video
-第九节 SPSS-计量资料的统计分析-均数比较-交叉设计资料的方差分析
--Video
-第十节 SPSS-计数资料的统计分析-样本率与总体率比较
--Video
-第十一节 SPSS-计数资料的统计分析-样本率比较
--Video
-第十二节 SPSS-配对计量资料比较的秩和检验
--Video
-第十三节 spss-两独立样本比较的秩和检验
--Video
-第十四节 spss-多个独立样本比较的秩和检验
--Video
-第十五节 spss-随机区组设计资料的秩和检验
--Video
-第十六节 SPSS-直线相关回归分析
--Video
-第十七节 spss多元线性回归
--Video
-第十八节 spss-logistic回归
--Video
-第十九节 spss-条件logistic回归
--Video
-第二十节 spss-有序logistic回归
--Video
-第二十一节 spss-无序多分类logistic回归
--Video
-常用综合评价方法
--Video
-第二十章 章节测试
-量表的研制方法
--Video
-第二十一章 章节测试
-医学文献的系统综述与Mata分析
--Video
-第二十二章 章节测试








