当前课程知识点:临床流行病学 > 第五章 描述性研究 > 4、现况研究抽样方法和样本量估算 > 现况研究抽样方法和样本量估算
大家好
我是中南大学湘雅公共卫生学院的严俊霞
今天要给大家讲的是
现况研究抽样方法和样本量估算
咱们在前面讲到现况研究
它分为普查和抽样调查两大类
那么常用的一种方法就是说抽样调查
咱们在研究人群中
随机抽取一部分有代表性的个体进行调查
通过这样的抽样代表性人群
我们来估计该人群中某病的患病率
或者某些特征
咱们是通过样本来估计总体
那么抽样调查要保证它的一个代表性
重要的一个问题就是要做到随机化
今天咱们就来看看几种随机化抽样
随机抽样方法包括以下几个方面
单纯随机抽样 系统抽样 分层抽样
整群抽样和多级抽样也叫多阶段抽样
我们先来看一下单纯随机抽样
单纯随机抽样也叫简单随机抽样
它是随机抽样中最基本的一种抽样方法
那么它怎么做呢
具体的一个方法就是说
我们比如说有N个研究对象
1到N这样的一个研究对象
我们对它进行编号
我们利用一个随机数或者抽签或者是一些软件
然后抽取N个个体
就是随机从里面抽取N个个体构成一个样本
它的优点就是咱们这样的
那咱看这样的一个方法
它非常简单随时可以用
就说我们可以利用一个编号之后
我们可以利用随机数字或者是抽签的方法
或者是计算机软件的方法随机抽取研究对象
非常简单 它的一个缺点就是说
我们在抽样前我们是先要知道全部研究对象
就是它要知道它的名单并进行编号
因为我们抽样的时候是根据这些编号来抽的
所以我们要知道所有的名单和编号
当我们的研究对象数量比较大的时候
工作量很大 就是编号可能就是没办法编号
那么在这个时候我们就很难做到简单随机抽样
另外一种方法是系统抽样
系统抽样又叫机械抽样
它是按照一定的顺序
机械地每隔一定数量的单位
抽取一个单位进入样本的抽样方法
具体来讲就是这样的一个
比如说我们有很多研究个体有N个研究个体
我们按某种标志先对它从1到N进行连续排号
然后我们根据总体数N和需要的样本量n
来确定我们的抽样间距
比如说这样的一个抽样间距
我们确定抽样间距
第三步是根据这样的一个抽样间距
我们在第一个抽样间距中
随机抽取一个研究对象
比如说5号 那么作为第一个样本单位
之后我们将第一个样本单位的号码
比如说5号加上我们的抽样间隔
得到第二个样本单位
以此类推 每个间隔里面我们都抽一个
那么最后得到我们的一个样本
它的一个优点
当样本量样本在整个人群中
如果分布比较均匀的时候
就是样本在整个人群中分布比较均匀
就是我们都抽到了
那么它的代表性比较好
事先不需要知道总体中的单位数就是有多少个
我们不需要知道
我们大致估算一个抽样间隔
然后在每个间隔中抽取我们的研究对象
它的缺点是什么呢
如果说我们的总体从各单位分布的时候
如果这些分布它具有规律性
比如说周期化变化
它是这样的一个变化趋势的话
有这样的一个周期的话
那么我们在抽取的时候
如果恰恰我们抽到了这样的一个点
或者是同期的一些点
那么就可能造成一个偏倚的产生
所以我们系统抽样最大的一个特点
如果说它的分布有这样的周期性趋势的时候
可能会产生偏倚
另外一个抽样是分层抽样
分层抽样是什么呢
就是我们的研究总体按照某种特征
然后分为不同的层
然后从每层中再抽取我们的研究样本
就是它按不同的特征分层
这些分层的特征一定是咱们的研究的
可能的一些影响因素
或者是一些混杂因素
我们要控制的一些因素
我们可以按这些特征进行分层
比如说按年龄 按性别 按疾病的严重程度
我们分成不同的层 分成若干层
然后在每层中再随机抽取我们的研究对象
那么分层的技巧的时候
一般是我们每个层间个体的变异越小越好
就是这一层它比较同质
层间的变异 层与层之间变异越大越好
那么这时候有利于我们后续的一些分析
分层抽样它又分为等比例抽样和非等比例抽样
等比例抽样
就是说这一层原来在研究总体中占多大的比例
那么我们再抽取的时候
抽的样本也在该层中占有同等的比例
非等比例抽样就说它占的比例不一样
分为等比例抽样和非等比例抽样
那么分层抽样它的一个优点
我们缩小了层内研究对象之间的差异
抽样误差比较小
就是我们按这些分层之后
我们在每层中都抽取 抽样误差比较小
样本的代表性相对来说比较好
那么层间研究对象的差异较大的时候
我们可以进行层间比较
它的缺点就是说我们在分层的时候
需要全面了解抽样人群的基本情况和相关特征
我们一定要知道这些特征之后
我们才可以根据这些特征进行分层抽样
还有一个随机抽样方法是整群抽样
整群抽样比较简单
是从研究总体中随机抽取若干个群
作为观察单位组成样本
比如说我们在全国抽样的时候
我们可能抽几个省然后我们做调查
那么这就是一个整群
或者是在一个学校 我们做调查的时候
抽取某一个班班里所有群体我们都进行调查
这样就是一个整群抽样
就是对群内的所有个体进行调查
它的优点就是在实际工作中
整群抽样它比较方便 比较为群众所接受
同时我们也可以节省一定的人力 物力
在大规模调查的时候我们一般常用整群抽样
它的缺点就是说我们在采用整群抽样的时候
如果群与群之间有很大的差异
那么它的抽样误差可能比较大
因此就说我们在样本量确定的时候
我们一般是在单纯随机抽样的基础上
再增加1/2的样本量
另外一个就是多级抽样
多级抽样又称多阶段抽样
就是我们进行大型流行病学调查的时候
常用这种抽样方法
它是具体怎么做的呢
比如说我从一个较大范围的
比如说中国的我要做一个调查
那么我可能先确定一个大的
比如说我们的省份
省 自治区 直辖市
我作为一个一级抽样单位
从这个一级抽样单位中
比如说我们抽到了河南
那么从里面我们再去抽
抽到了某个地市 逐级下去
这样的一个抽样单位
就是一级抽样单位 二级抽样单位
以此类推往下抽
抽到最小的一个单位作为我们的一个样本
比如说抽到最后抽到一个村或者抽到某个学校
作为我们的调查单位
它的一个优点就说我们在做多阶段抽样的时候
综合运用了各种抽样方法
在确保代表性的基础上
可以节约人力 物力和财力
但是我们在做多阶段抽样的时候
必须事先掌握各级抽样单位的详细资料
实施的时候困难也比较大
但是在我们的一些全国性的大型流调中
一般采用这样的多阶段抽样的抽样方法
确定了抽样方法之后
我们还要考虑我们的样本量
我们调查多少人 要做多少人
确定样本量有几个参数
有一个预期现患率
就是我们患病率的高低
患病率高那么我们可能调查比较少的人
咱们就能达到一定的统计学功效
另外一个还有咱们的一个研究精度的问题
研究精度要求高
咱们的样本量就比较大
还有一个显著性水平的问题
那么根据这些参数来计算咱们的样本含量
根据不同的资料类型
比如说技术资料和计量资料
我们有不同的样本量估算公式
大家可以根据这些样本量估算公式
估算我们的样本量
一般这些参数确定的时候有两种方法
一种是根据你的预调查
另外一种可能是根据既有的一些文献
来估计这些参数从而估计我们的样本量
那么根据我们不同的抽样方法
适当的增减样本量
今天就讲到这里 谢谢大家
-1、临床流行病学概述
--临床流行病学概述
-2、什么是临床流行病学
-3、临床流行病学研究常见的设计类型
-4、临床流行病学的主要研究范畴
-第一章测试
-1、临床研究问题与方法
-2、临床科研设计的一般原则
-3、临床研究对象的选择与样本量的估计
-4、临床研究因素的确定
-5、临床研究观察指标的选择
-6、临床研究的主要偏倚及其控制
-7、临床研究中对照的设置
-8、临床研究中的随机化与组间均衡
-9、临床研究中的盲法应用
-第二章测试
-1、流行病学暴露测量的内容
-2、流行病学暴露测量的方法
-3、流行病学暴露测量的误差
-4、疾病发病的测量
--疾病发病的测量
-5、患病与死亡的测量
--患病与死亡的测量
-6、疾病结局的测量
--疾病结局的测量
-7、疾病负担的测量
--疾病负担的测量
-8、流行病学效应的测量
-第三章测试
-1、诊断试验的评价设计
-2、诊断试验标准的确定
-3、真实性评价
--真实性评价
-4、诊断试验可靠性评价
-5、诊断试验收益的评价
-6、提高诊断试验效率的方法
-第四章测试
-1、描述性研究概述
--描述性研究概述
-2、现况调查概述
--现况调查概述
-3、现况研究设计和实施
-4、现况研究抽样方法和样本量估算
-5、生态学研究
--生态学研究
-第五章测试
-1、队列研究概述
--队列研究概述
-2、队列研究设计与实施
-3、人时及率的计算
--人时及率的计算
-4、效应指标的计算
--效应指标的计算
-5、病例对照研究概述
--病例对照研究概述
-6、病例对照研究设计类型
-7、病例对照研究设计与实施
-8、病例对照研究的整理
-9、分析性研究常见偏倚及控制
-10、衍生研究类型
--衍生研究类型
-第六章测试
-1、临床试验的基本概念与伦理原则
-2、常见的临床试验方法
-3、 新药临床试验
--新药临床试验
-第七章测试
-1、常用临床疗效评价指标的计算和应用
-2、临床疗效研究中常见的问题及其处理
-第八章测试
-1、疾病预后研究及其意义
-2、疾病预后研究设计
--疾病预后研究设计
-3、疾病预后研究的评定标准及原则
-第九章 测试
-1、健康相关生存质量概述
-2、常用健康相关生存质量量表
-3、健康相关生存质量量表评价
-4、健康相关生存质量量表的研制
-第十章测试
-1、临床经济学评价基本概念
-2、临床经济学评价——成本和收益测量
-3、成本效果分析
--成本效果分析
-4、成本效用分析
--成本效用分析
-5、成本效益分析
--成本效益分析
-第十一章测试
-1、Markov模型
--Markov模型
-2、决策树分析
--决策树分析
-3、临床决策分析的概述
-4、临床决策分析的评价指标
-5、决策模型的灵敏性分析
-第十二章测试
-1、流行病学病因的定义
-2、流行病学病因模型
--流行病学病因模型
-3、病因学研究的步骤和方法
-4、关联和因果关联
--关联和因果关联
-5、因果推断的标准
--因果推断的标准
-第十三章测试
-1、真实性与可靠性
--真实性与可靠性
-2、选择偏倚
--选择偏倚
-3、信息偏倚
--信息偏倚
-4、混杂偏倚
--混杂偏倚
-第十四章测试