当前课程知识点:社会研究方法 > 第六讲 抽样 > 6.2 概率抽样:基本原理 > 6.2 概率抽样:基本原理-视频
当我们谈到抽样的时候
狭义的理解一般指的是概率抽样
那么顾名思义
概率抽样
就是说研究总体中的每一个个体
都有同样的概率在总体中被抽中
概率抽样对于某一些类型的社会研究
尤为重要
特别是如果我们要对于总体特征
进行描述性的推论
就需要尽可能的
按照概率抽样的原则来实现
所谓的描述性推论
就是说抽样的目的
是通过在总体中
选取一部分有代表性的样本
对于这些代表性的样本的某些基本特征
进行统计描述
并且通过这些样本的统计值
来去推断研究总体的一些基本特征值
比如说上一节我们所提到的
对于一千户家庭的抽样调查
来估记北京市居民的平均家庭收入
那么对于这样的一个研究
我们的研究对象总体是北京市的所有家庭
而我们实际所观察的样本
是所抽取出的这一千户家庭
这一千户家庭是总体中的一个部分
那么通过调查我们得出
这一千户样本的平均收入是39000元
这个被我们称为是样本的统计值
我们通过对于统计值的计算
来估计的是北京市的平均家庭收入的
这样一个总体均值
我们称为是总体参数
对于同一群研究对象的总体来说
总体参数是一个固定的值
这个值通常是未知的
是我们想要通过研究来估计出的
那么估计的方法
就是通过抽样来得出统计值
并用来去估计总体参数
那么我们为什么可以通过概率抽样
来进行这样的描述性推论呢
这里所依据的是抽样中的中心极限定理
中心极限定理的意思是说
当我们对于一个总体进行抽样时
如果所抽取的样本足够大
并且是基于随机抽样的原则
那么样本均值的抽样分布
就是近似于服从正态分布的
这个是什么意思呢
这实际上是假设
我们可以对于同一个研究对象总体
来重复进行抽样
比如我们想要知道
北京市所有家庭的收入均值
这个作为一个总体参数是一个固定的值
只是我们并不知道这个值的真实大小
那么按照刚才所说的
假如我们开展了一次抽样调查
可能得到的统计值是39000元
但同时也可能有许多其他的学者
也在开展类似的抽样调查
那每次抽样所选取出来的样本家庭
多半是不一样的
而所得到的家庭收入的样本统计值
也可能会不同
可能有学者抽取出的一千户样本家庭
他们的平均收入是41000元
也有一些学者
可能得到的平均收入是38000元
那假设我们有一百位学者
开展了这项研究
我们就会得到一百个
基于抽样的平均收入统计值
那么这一百个样本均值可能一样
但更有可能不一样
这个就形成了样本均值的抽样分布
那根据中心极限定理
如果说这一百次抽样
都是遵循了随机抽样的过程
并且因为每次抽样的样本量都足够大
那么这样一百个样本均值的抽样分布
就会近似于服从正态分布
也就是说每次抽样结果
都会围绕某个均值
呈现出一个对称分布的特点
这一百次抽样得到的
一百个样本统计值的均值
我们叫做样本均值的均值
而这个值就应当是
等于研究总体的平均值
也就是总体参数
换句话说
每一次抽样得到的样本统计值
所形成的抽样分布
是一个以研究总体均值为中心的正态分布
那这个时候可能有同学就会说了
我们也不可能对于每一个研究问题
都去重复做一百次抽样
那多数情况下我们都是只能做一次抽样
那这个时候我们又怎么能知道
单次抽样所得到的统计值
是不是能够反映总体的特征值呢
那么这里
根据中心极限定理
和正态分布的基本特点
我们会知道
如果我们能够重复进行抽样
那么所得到的样本均值的大多数
都应当是等于或者是接近于总体参数的
确切地说
应当会有26%的抽样
所得到的样本统计值
会落在了总体参数
也就是样本均值的均值的
正负1个标准差范围内
有95.44%的抽样统计值
应当是在总体参数的
正负2个标准差的范围内
99.7%的抽样统计值应当会落在
总体参数的正负3个标准差的范围内
那么这个样本均值的正态分布的标准差
我们叫做抽样的标准误
等于研究总体的方差
除以抽取的样本量数之后的平方根
那么从这个公式可以看出来
对于同一个研究总体
每次抽样的样本量越大
样本均值的分布
它的标准差就越小
也就是说当抽样的样本量足够大时
我们是可以判断出来
我们单次抽样所抽到的统计值
有95%的可能性是接近总体均值的
虽然这个可能会存在一定的差别
但是这个差距不会特别的大
那么我们如何
去评估一个概率抽样的误差有多大呢
那么在下一节
我们会具体来介绍
如何去估计一个抽样的抽样误差
以及如何去确定需要多大的样本量
才能确保一定的抽样质量
-1.1 什么是社会研究
-1.2 什么是社会科学研究
-1.3 社会科学研究的出发点
-1.4 社会科学研究的核心
-1.5 社会科学研究的不同类型
-1.6 研究效度:评价研究的质量
-1.7 社会科学研究的伦理规范
-第一讲测试 理解社会科学研究
-2.1 研究设计的作用
-2.2 理论及因果关系
-2.3 基于变量的语言体系
-2.4 研究对象与分析单元
-2.5 研究的时间维度
-2.6 如何撰写研究计划书
-第二讲测试 研究设计
-3.1 研究问题的不同形式
-3.2 什么是好的研究问题
-3.3 研究问题与论证的逻辑
-3.4 选题从哪里来
-3.5 如何进行文献检索
-3.6 如何进行文献综述
-3.7 如何陈述研究选题
-第三讲测试 研究选题
-4.1 导言:研究方案设计
-4.2 研究策略选择I:检验因果效应
-4.3 研究策略选择II:因果机制与理论创新
--4.3 研究策略选择II:因果机制与理论创新(上)-视频
--4.3 研究策略选择II:因果机制与理论创新(下)-视频
-4.4 理解定量研究:基本过程和要点
-4.5 理解定性研究I:不同的范式基础
-4.6 理解定性研究II:基于建构主义的质性研究
-第四讲测试 研究策略
-5.1 导言:什么是概念化与测量
-5.2 从概念到变量:测量的基本过程
-5.3 测量的层次与方式
-5.4 概念的复合测量:指标体系与量表
-5.5 测量的信度
-5.6 测量的效度
-第五讲测试 概念化与测量
-6.1 导言:什么是抽样
-6.2 概率抽样:基本原理
-6.3 概率抽样:评估抽样误差
-6.4 概率抽样:抽样框的重要性
-6.5 概率抽样:基本形式
-6.6 概率抽样:几种特殊形式
-6.7 非概率抽样:基本原理与主要形式
-第六讲测试 抽样
-7.1 导言:什么是调查问卷?
-7.2 从研究问题到调查问卷
-7.3 确定问卷的结构
-7.4 选择提问的形式
-7.5 问题设计的注意事项
-7.6 问卷发放的不同形式
-7.7 问卷调查实施中的注意事项
-第七讲测试 问卷调查
-8.1 导言:什么是田野调查
-8.2 田野调查:基本过程
-8.3 田野调查中的数据收集
-8.4 观察:基本类型和要点
-8.5 定性访谈:基本类型与过程
-8.6 半结构式访谈:准备与实施
-第八讲测试 田野调查:观察与访谈