当前课程知识点:社会研究方法 > 第六讲 抽样 > 6.6 概率抽样:几种特殊形式 > 6.6 概率抽样:几种特殊形式(中)-视频
但是有同学可能会说
即使是在一个社区内部
也可能包括几千户家庭
我们也不一定能够在这个社区中
找到包含每个家庭的一个抽样框
并且我们也未必有足够的人力物力
来对于抽中社区中的每一个家庭
去进行调查
那这里我们就可以考虑
一个更加复杂的抽样方式
叫做多阶段抽样
多阶段抽样就是我们将研究总体
首先分为不同层级的整群
来形成一个多级的抽样单元
比如对于城市家庭的调查
我们可以先在所有街道列表中
通过简单随机抽样
或者是系统抽样的方式
来选择若干的街道
那么街道就是我们第一级抽样单元
那对于抽中的街道
我们可以再分别编制社区居委会的列表
在每一个街道内再随机抽取若干个社区
那么社区就是我们的第二级抽样单元
当然按照刚才所说的
可能社区内的住户家庭也很多
那么我们可能无法得到所有住户的列表
那么我们这个时候可以再设想
第三级的整群抽样单元
也就是我们知道社区内
通常会包括许多栋类似的住宅楼
每个住宅楼有可能包括若干类似的单元
那么这样的话
我们就可以列出
所有住宅楼内所有单元的列表
然后对于单元进行随机抽样
那这样的话
单元就是我们的第三级抽样单元
然后我们可以对所有抽中的
住宅单元内的所有家庭
来进行调查
进入最终的样本
所以多阶段抽样就是先编制一个
初级抽样单元构成的列表
进行随机抽样
然后在选出的初级单元中
再编制包括次级抽样单元构成的列表
来分别进行随机抽样
形成次级单元的一个样本
如果说次级抽样单元内部规模还是太大
或者说我们没有办法获得一个抽样框
我们就还可以想办法
对于三级抽样单元
那么我们就还可以想办法
对于每一个次级抽样单元
再编制一个以第三级抽样单元
为列表的一个随机抽样
这样以此类推
直到我们认为可以对
最小的整群单元内部的
每个个体进行调查
或者说我们如果可以获得
这样的一个整群单元内的
所有个体的抽样框
那么我们就可以在这样的一个整群单元内
再进行一个随机抽样来获取个体的样本
那么这里给大家举一个简单的
两阶段系统抽样的例子
假如我们要在一个3万户家庭的城市
进行家庭抽样调查
我们的目标抽样比例是1%
也就是我们希望抽样到300户的家庭
由于我们无法获得所有3万户家庭的
个体层面的抽样框
那么我们选择两阶段的抽样方式
第一步我们通过调研知道
全市有120个社区
那么我们可以想办法
编制一个120个社区的名单
通过系统抽样抽取12个社区
也就是说社区是我们的第一级抽样单元
我们在社区这个整群的尺度上
来进行10%的抽样
第二个阶段对于选中的这十个社区
我们可以分别进行实地调研
来编制每个社区的家庭住址列表
然后进行一个系统抽样
由于我们知道整个调查的抽样比例是1%
而第一个阶段的抽样比例是10%
那么第二个阶段的抽样比例
也就是1除以10%
就也是10%
也就是说在每一个社区内部
我们都需要随机抽取10%的家庭
来作为样本
这里可以看到
多阶段抽样结合了整群抽样
和系统或者说分层抽样的优势
当研究总体规模庞大 分布分散
并且编制一个包括全部个体的抽样框
比较困难的情况下
多阶段抽样
可以让我们先抽取若干的整群
这样的话我们就只需要
对这些抽中的整群来编制抽样框
那这种情况下
我们就不需要去制作一个
包含全部个体的一个抽样框了
这样从实施的角度上来说
可行性会更高工作量也会更小
当然增加抽样效率的代价
是抽样精度的损失
多阶段抽样既然结合了整群抽样的优势
也就具有整群抽样的劣势
也就是说当整群之间的差异较大时
我们如果只抽取部分的整群作为样本
那么就可能会损失掉总体的一部分信息
从而增大抽样误差
特别是每当我们增加一级抽样单元
就会增加一次抽样误差
从而导致最终样本的误差
会大于直接进行系统抽样或者分层抽样
得到的样本误差
当然因为许多社会研究的研究对象总体
都是规模庞大的
多阶段抽样仍然是社会研究中
最常见的一种抽样方式
这里研究者需要考虑的是
如何去制定抽样方案
来尽可能减少抽样误差
当然减少抽样误差的一个办法
自然是增加样本量
样本量越大误差越小
只是在实际的工作中
研究者通常会受制于人力物力
和经费的约束
不可能无限制的增加样本量
那么实际上研究者是需要在
一定的目标样本量的约束下
来选择到底是应当抽取更多的群组
然后
给每个群组分配较少的个体样本量
还是应当抽取尽量少的群组
然后在每个群组内部增加样本量
群组数量和群组内的样本规模的选择
取决于研究总体的差异
主要是体现在群组之间还是群主内部
比如说
如果我们认为
学校的每个班级之间差异较小
而学生之间的差异主要是在班级内部
那么我们就可以抽取较少数量的班级
但是在每个班级中尽可能的多抽取学生
甚至是对班级内所有的学生都进行调查
另外一个相反的情况是
在城市的研究中
城市内不同社区之间的差异
通常是非常大的
有可能社区在住房的新旧
房价 地理位置 社区内部的环境
周边的设施条件等等
各种情况下都存在巨大的差异
而不同的居民
可能会选择住在不同的社区内
那么这样住在一个社区内的居民
通常是相对同质的
那在这样的情况下
我们就会建议
尽量增加选择的社区数量
而减少社区内的家庭的样本量
当然这也并不是说
可以无限制的增加社区数量
因为这样的话那就失去了
进行整群抽样的意义了
并且作为一项社会调查
我们也不能在社区中抽取太小的样本量
毕竟社区内部的居民之间
还是有一定差别的
并且概率抽样也要求
在保证一定样本量的情况下
才能够确保样本的代表性
-1.1 什么是社会研究
-1.2 什么是社会科学研究
-1.3 社会科学研究的出发点
-1.4 社会科学研究的核心
-1.5 社会科学研究的不同类型
-1.6 研究效度:评价研究的质量
-1.7 社会科学研究的伦理规范
-第一讲测试 理解社会科学研究
-2.1 研究设计的作用
-2.2 理论及因果关系
-2.3 基于变量的语言体系
-2.4 研究对象与分析单元
-2.5 研究的时间维度
-2.6 如何撰写研究计划书
-第二讲测试 研究设计
-3.1 研究问题的不同形式
-3.2 什么是好的研究问题
-3.3 研究问题与论证的逻辑
-3.4 选题从哪里来
-3.5 如何进行文献检索
-3.6 如何进行文献综述
-3.7 如何陈述研究选题
-第三讲测试 研究选题
-4.1 导言:研究方案设计
-4.2 研究策略选择I:检验因果效应
-4.3 研究策略选择II:因果机制与理论创新
--4.3 研究策略选择II:因果机制与理论创新(上)-视频
--4.3 研究策略选择II:因果机制与理论创新(下)-视频
-4.4 理解定量研究:基本过程和要点
-4.5 理解定性研究I:不同的范式基础
-4.6 理解定性研究II:基于建构主义的质性研究
-第四讲测试 研究策略
-5.1 导言:什么是概念化与测量
-5.2 从概念到变量:测量的基本过程
-5.3 测量的层次与方式
-5.4 概念的复合测量:指标体系与量表
-5.5 测量的信度
-5.6 测量的效度
-第五讲测试 概念化与测量
-6.1 导言:什么是抽样
-6.2 概率抽样:基本原理
-6.3 概率抽样:评估抽样误差
-6.4 概率抽样:抽样框的重要性
-6.5 概率抽样:基本形式
-6.6 概率抽样:几种特殊形式
-6.7 非概率抽样:基本原理与主要形式
-第六讲测试 抽样
-7.1 导言:什么是调查问卷?
-7.2 从研究问题到调查问卷
-7.3 确定问卷的结构
-7.4 选择提问的形式
-7.5 问题设计的注意事项
-7.6 问卷发放的不同形式
-7.7 问卷调查实施中的注意事项
-第七讲测试 问卷调查
-8.1 导言:什么是田野调查
-8.2 田野调查:基本过程
-8.3 田野调查中的数据收集
-8.4 观察:基本类型和要点
-8.5 定性访谈:基本类型与过程
-8.6 半结构式访谈:准备与实施
-第八讲测试 田野调查:观察与访谈