当前课程知识点:社会研究方法 > 第六讲 抽样 > 6.4 概率抽样:抽样框的重要性 > 6.4 概率抽样:抽样框的重要性-视频
那么要实现概率抽样
对于总体特征的准确估计
除了样本量要足够大以外
还有一个重要的条件
是抽样过程应当遵循随机抽样的原则
也就是要确保研究总体中的每个个体
有同样的概率被抽中
而要实现概率抽样的原则
最关键的是必须建立一个
包括研究总体中
全部个体的一个抽样框
抽样框是所有研究对象个体
依次排列的一个列表或者说名录
抽样框中的每一个个体
我们称为抽样单元
比如说如果我们要在某个学校中
对学生进行一个概率抽样
那么学校中所有学生的花名册
就可以作为我们的抽样框
其中的每一行
代表了某个特定的学生
及其所属班级等等信息
如果我们要在某个城市
来做一个企业调查
那么我们就需要想办法
来找来这个城市中所有企业的名录
而这个企业名录
不仅应当包括企业的名称
还应当包括相应的地址
或者联系人联系方式等等信息
这样我们才能确保
能够找到所抽取到的企业样本
来进行调查
如果我们要在这个城市中
抽取一百个社区
我们也需要得到
这个城市中所有社区的列表
其中应当包括
社区的名称及其地址等等信息
那么如果我们要在某个社区中
来随机抽取一百户家庭进行调查
什么可能是我们的抽样框呢
这个可能比较麻烦一点
当然一个可能性
是到社区居委会的工作人员那里
询问他们是否有社区内
所有家庭的花名册
但是在多数情况下
或者是居委会并不掌握
社区内所有家庭信息
并有一个完整的花名册
或者是由于现在
家庭的居住流动性越来越大
居委会即便曾经整理过这样的花名册
等到我们去调查的时候
多半都已经过时了
也有可能说这样的信息
往往会被认为是内部保密信息
而不能够轻易与研究人员分享
那么在这样的情况下
就需要研究者去寻找替代方案
在社区住户抽样调查中
如果没有所有住户的花名册
一个可能的替代方案
就是在社区内的所有住房的门牌号码
去做出一个清单
我们可以通过居委会
来获得社区内所有的住宅楼
单元楼层门牌号的信息
甚至也可以通过自己去进行实地考察
来列出所有住宅楼内所有门牌号
从而自己去制作一个花名册
来作为抽样框
抽样框在概率抽样中之所以重要
是因为我们只有有了一个明确的
研究对象的总体
才能去准确的评估
我们实际上的抽样概率
在一项实际的研究课题中
我们在提出研究问题的时候
往往只能是大致地知道
我们的研究对象
也就是我们想要观察
和研究的对象是谁
这个被我们称为是理论总体
比如我们要研究北京市家庭的平均收入
那么我们可以大致的说
研究对象的总体
是北京市的所有居民家庭
但是在实际的研究工作中
我们不一定能够接触到
所有的居民家庭
那么这时我们就需要去明确
我们能够接触到并开展观察的总体是谁
这个就是我们的研究总体
这个研究总体的范围
当然是越接近理论总体越好
但是实际上往往是会小于理论总体的
对于这个我们能够接触到的研究总体
我们需要明确
作为研究者来说
我们能够通过什么样的方式
去识别并且接触找到每一个个体
这样的话我们就能够编制出
一个包括研究总体的
每一个个体的一个抽样框
也就是我们实际能够观察的
每个个体的花名册
根据这个花名册
我们就可以来进行一个概率抽样
从这里可以看出来
如果抽样框不能够准确地
反映研究对象的总体
就有可能在抽样过程中出现重大偏差
这里有一个经典的案例
在1936年正值当时的美国总统大选
竞选双方是罗斯福和兰登
那么当时著名的美国杂志《文学文摘》
试图通过采用抽样调查的方式
来预测两位候选人在民众中的支持率
从而预测谁会胜选
那么这个杂志
从全国电话簿的车牌登记名单中
随机抽取了1000万人寄出调查问卷
最终
这个调查收到了200万人的回应
从抽样调查的结果显示
兰登的支持率为57%
罗斯福的支持率为43%
这个是一个相当巨大的差距
由此《文学文摘》杂志
预测兰登将以较大的优势胜选
当然这一次选举的结果
我们其实是知道的
罗斯福最终以61%的压倒性优势获胜
那么这里是出了什么问题呢
200万的最终样本量不可以说不大
并且我们也知道
杂志是遵循了随机抽样的原则
那么为什么最终调查结果
出现了如此巨大的偏差呢
这里实际上问题就出现在抽样框上
这一项民意调查的理论总体
是所有的美国选民
但是实际的抽样框
是电话簿中的车牌登记名单
也就是说
实际的研究总体
只是所有在电话簿中
登记了车牌的家庭
要知道在1936年
能够买得起车的美国家庭
是应当是美国所有家庭中
相对富裕的阶层
并且通常是白人
那么也就是说
在全体选民的这个理论总体中
这项调查的研究总体
是社会中相对富裕
以白人为主的选民
那么这个调查所得出的结论
就只能反映
这样一类特点的选民群体的意见
那实际上
罗斯福的主要票仓来源
是美国的大众工薪阶层
甚至是贫困家庭
那么这个调查所得出的结论
就出现了重要的抽样偏差
所以可以看出来
除了抽样过程中
是否遵循概率抽样的基本原则外
抽样框多大程度上
能够准确覆盖研究对象的理论总体
决定了最终抽样
是否会出现重大的抽样偏差
如果抽样框本身只是反映一部分个体
那么即便进行了概率抽样
并且样本量巨大
那也不能够减少抽样偏差
这个抽样偏差
和我们前面提到的抽样误差
是不一样的
抽样偏差
是由于研究的抽样设计出现的问题
所导致的代表性问题
而抽样误差是所有的抽样中
都可能会存在的抽样结果
与真实值出现的一定程度上的差异
这个是不可避免的
那么和刚才1936年这个案例形成对照的
是1968年的一个抽样调查的案例
当年盖洛普的美国民意调查研究所
仅用2000人作为样本
就成功地预测了
总统候选人尼克松的得票率
盖洛普的抽样调查预测
尼克松的支持率为43%
而最终大选的实际得票率是42.9%
那么这里我们再来看几个例子
比如说假如我们想在清华大学
对于学生进行一个问卷调查
来了解学生的未来职业发展意向
那么如果在这里我们采取这样一个办法
我们可以在某一天的上午
在图书馆门口来进行调查
对于进入图书馆学习的同学
每隔十个人来选择一个作为样本
那么这个是不是符合概率抽样的原则呢
我们可以具体来分析一下
在这项研究中
我们的理论总体是清华大学的学生
我们实际研究的
只是当天上午在我们的调查时段内
进入图书馆的学生
可能很多人是上午不去图书馆的
或者当天碰巧没有去图书馆
或者是压根不去图书馆学习
那么我们这样的抽样过程
实际上更容易调查到的
是经常去图书馆学习的学生
或者是早上不睡懒觉
而选择学习的同学
而更不容易调查到的
是那些从不去图书馆的同学
而经常去图书馆的同学
他们的职业发展意向
很可能与从不去图书馆的同学
他们的职业发展意向大不相同
那么这样的一个抽样方式
所得出的结果就会存在重大的偏差
那么类似的
如果我们从电话黄页中
来随机选取居民进行电话访问调查
这种抽样方式实际上也是没有抽样框的
或者说这种调查所能够接触到的
实际研究总体
是那些有电话
并且在电话黄页中
登记了电话号码的居民
而调查不到那些
没有电话
或者选择不登记电话号码的人群
再比如
电视台的节目
可能会邀请观众打进电话来发表观点
这样的方式在抽样上会存在哪些问题呢
一个
这样的方式它实际的研究总体
也只是那些节目播出时
正在观看电视的人
而无法接触到那些
没有看电视习惯的人
第二
其中一般是比较积极发表观点
特别是愿意通过参与电视节目
来表达观点的人
才更有可能参与这种互动
而一般不愿意表达观点的人
即便当时正在看电视节目
也不会参与调查
这就导致了在抽样的过程中
没有遵循概率抽样的原则
也就是没有确保
研究总体中的每个个体
有同样的概率被抽中
-1.1 什么是社会研究
-1.2 什么是社会科学研究
-1.3 社会科学研究的出发点
-1.4 社会科学研究的核心
-1.5 社会科学研究的不同类型
-1.6 研究效度:评价研究的质量
-1.7 社会科学研究的伦理规范
-第一讲测试 理解社会科学研究
-2.1 研究设计的作用
-2.2 理论及因果关系
-2.3 基于变量的语言体系
-2.4 研究对象与分析单元
-2.5 研究的时间维度
-2.6 如何撰写研究计划书
-第二讲测试 研究设计
-3.1 研究问题的不同形式
-3.2 什么是好的研究问题
-3.3 研究问题与论证的逻辑
-3.4 选题从哪里来
-3.5 如何进行文献检索
-3.6 如何进行文献综述
-3.7 如何陈述研究选题
-第三讲测试 研究选题
-4.1 导言:研究方案设计
-4.2 研究策略选择I:检验因果效应
-4.3 研究策略选择II:因果机制与理论创新
--4.3 研究策略选择II:因果机制与理论创新(上)-视频
--4.3 研究策略选择II:因果机制与理论创新(下)-视频
-4.4 理解定量研究:基本过程和要点
-4.5 理解定性研究I:不同的范式基础
-4.6 理解定性研究II:基于建构主义的质性研究
-第四讲测试 研究策略
-5.1 导言:什么是概念化与测量
-5.2 从概念到变量:测量的基本过程
-5.3 测量的层次与方式
-5.4 概念的复合测量:指标体系与量表
-5.5 测量的信度
-5.6 测量的效度
-第五讲测试 概念化与测量
-6.1 导言:什么是抽样
-6.2 概率抽样:基本原理
-6.3 概率抽样:评估抽样误差
-6.4 概率抽样:抽样框的重要性
-6.5 概率抽样:基本形式
-6.6 概率抽样:几种特殊形式
-6.7 非概率抽样:基本原理与主要形式
-第六讲测试 抽样
-7.1 导言:什么是调查问卷?
-7.2 从研究问题到调查问卷
-7.3 确定问卷的结构
-7.4 选择提问的形式
-7.5 问题设计的注意事项
-7.6 问卷发放的不同形式
-7.7 问卷调查实施中的注意事项
-第七讲测试 问卷调查
-8.1 导言:什么是田野调查
-8.2 田野调查:基本过程
-8.3 田野调查中的数据收集
-8.4 观察:基本类型和要点
-8.5 定性访谈:基本类型与过程
-8.6 半结构式访谈:准备与实施
-第八讲测试 田野调查:观察与访谈