当前课程知识点:基于R语言的社会统计分析 > 第六章:统计推断 - 区间估计 > 6.3 置信水平 > Video
在构建这个置信区间的过程之中呢有一个非常非常重要的概念
叫做置信水平
置信水平也就是1-α
当我们说这个置信水平
控制在95%的时候我们的意思是说
我有95%的信心相信
我构建的这个置信区间会把真实值涵盖
那在承认95%的同时实际上我也接受了
就是说在构件的置信区间中
有5%的可能是无法涵盖参数真实值的
但凡我们使用样本去推测总体
我们总是不免犯错所以这一定是我们要接受的啊
既然我们拿不到全数据用小小的星星点点的数据去
推测总体就一定有犯错的可能
所以你要承认错误的存在
当然我一定是希望犯错的可能越小越好
那有的同学经常很纠结过来问我说
说我写论文我写毕业论文或者是
我交一些学术的这个
投一些学术的杂志的时候我应该选择什么样的置信水平
那你们可以翻一翻现在的发表
你发现一般情况下置信水平都会
控制在95%左右
为什么偏偏是95
其实已经是约定俗成了啊
没有什么特别的原因啊
是这么多人大家都这么用
所以它慢慢就成了一种
英文叫做rule of thumb一个通用的标准
当然对于某一些特别的情境
5%的错误可能也是
不明显啊我觉得5%的错误
犯错的可能仍然是太高了这个时候我就需要
调整一下我的置信水平要把
置信度增加到99%有的时候甚至是更高
那增加置信度会对你这个置信区间
的模样产生什么样的影响呢
那我们看一下
这个置信区间的通用形式
都是π(hat)也就是点估计值
加减Z二分之α
乘以根号下这个π(hat)乘以1减π(hat)除以n
这个东西是标准误
也就是说一定是点估计加减某一个倍数
乘以标准误的结果
这个倍数乘以标准误呢就是我们所说的边际误差
所以要增加置信度
或者要减少置信度吧
只要我希望调整置信水平
就一定会影响到我的边际误差
那你想象一下如果说我要增加置信度的话
实际上你的边际误差是增加了还是减少了
我信心更足了
什么样的情况下信心会更足
一定是实际上我的这个置信区间更宽了
我置信区间越宽
那涵盖真实值的概率就越大
但你发现了没
就是说在你增加置信水平的
前提下你会有所损失你的损失是
丧失了精确度就是我的
置信区间变得很宽那我的精确度又一定要被牺牲掉了
恩所以呢
这个Z二分之α就是说调整
控制置信水平的时候会受到影响的东西
然后
如果说你已经很习惯的话95%所对应的
这个倍数的取值呢是1.96
然后如果说我调的高一点99%
那它所对应的值呢就是
实际α就会等于0.01了
那0.01除以2呢就等于0.005
Z0.005呢等于
2.58
那有同学说这都是旧时代查表算出来的但其实我们有了R呢
就不需要用查表那么那么老土的方式了啊
很简单的一条命令
这儿给大家做了一个很简短的截屏的演示
用到的一个语句是qnorm
也就是说你看我
qnorm你可以就在括号里面写这个α除以2以后的取值了啊
然后如果说你还不放心
那只直接把这个α除以2带进去
比如说我举这个例子啊
当我的置信水平是95%的时候
qnorm
括号里是0.05
α就等于5%了0.05除以2
然后它会给你一个取值是
-1.95
它实际上给你的是
左尾的这个概率也就是左尾的那个
cut off值
切分的值
然后以此类推如果说你想把
置信度改到百分之九十九的话那就是
qnorm0.01除以2等于-2.58
当然这也是左尾取值所以
实际上Zα是
正的2.58
然后
如果你还有其它的很个别的置信水平的需要呢
你可以只要就是很简单的随便根据你的需要
调整一下你的置信度就可以了
然后置信区间的宽度
这是一定要注意的啊就是置信水平
和置信区间宽度的关系
置信区间的宽度
必然是随着置信水平的增加而增加的
你想想我的置信区间如果宽了
涵盖真实值的概率就会变得很大
你有这么大个怎么着我也得把你涵盖进去
然后如果说你想
在保证
置信水平
的前提下你还希望
你的置信区间窄那唯一的办法就是增加样本量
所以
总结一下置信区间的宽度会随着置信水平的增加而增加
会随着样本量的增加而减少
好下面我们就画一张图给大家演示一下怎么样才能把置信区间理解成
一个一系列的长期的重复过程的结果
好还是我们画一个
理想中的在知道总体真实参数值情况下抽样分布的情况
我们想想一下我们抽样分布这个
总体的均值μ在这个地方啊或者我们把它改一改不是μ是π
π在这个地方
然后我的95%的置信区间
这儿是
π减去1.96σπ(hat)
这边是π加上1.96σπ(hat)
然后你要想象你实际上每次抽样的时候
都会构建一个置信区间
于是乎你有
这样的一个置信区间我们先说这是
这是总体的真实值我一直把它画下来
然后我又
又抽了一个样本
得到一个均值在这个地方啊我又构建了一个置信区间
以此类推
我做了好多好多置信区间啊
你想象一下我又是抽了一千个一万个样本
生成了一千一万个样本均值
然后构造了这么多的置信区间以后
你会发现
其中95%的区间
刚好成功的
把真实值包含起来了
但是也有一些落网之鱼其中5%的置信区间
没有涵盖真实值
所以这说明什么我们每次得到的置信区间啊我们会有一定的
信心去相信它会把真实值涵盖
但我并不能百分之百的确定它就一定是真实值了
所以呢由
一个样本获得的置信区间可能包含真实值
也可能恰好我们
很不幸运啊没有把真实值包括
但是重复操作很多次我们可能构建好多好多的置信区间
它们的95%
可以包含而5%会错过
那在实际应用中
这一定要理解啊在实际应用中呢我们没有那么幸运我们没有办法去抽样
一千次一万次
我们可能只抽一次然后用
这一个固定的样本去构建一个置信区间
然后在这一个固定的样本情况下呢
我们并不能确定这个置信区间涵盖的真实值
但我们可以控制我们可以控制我们想要相信的程度
这个程度可能是95%也可能是99%也可能是
如果是百分之七十八十情况下你的区间可能会很窄啊
但是大部分情况下
95%是一个比较常用的置信度水平
那有一点可以肯定
我们希望
样本量越大越好为什么呢
样本量越大
我的抽样分布就是后面的这个分布
它就越接近于正态分布
那我们用样本比例替代
总体比例的标准误也就会更接近真实的标准误
然后老问题
多大的样本算大呢
其实这个要求
并不是特别高啊好多同学都特别爱问我说
说这个到底要多大样本才可以
构建出这样的置信区间呢
其实一般我们现在用到的大型社会调查的要求都可以满足
它要求
每一个分类之中
至少有15个观测值
也就是说
每一道题啊我问你是不是非常不同意我有
是非常不同意的也有并不是非常不同意的
每一种选择的人都要大于15
那如果真不巧你的数据不满足这个条件
那你就要考虑一些非参数的方法了
当然非参数的方法又是另外另外一个非常大的统计学的分支
我们这节课内容就不涵盖了啊我们会
关注在参数的方法
那前面说那么多我们需要做一个
比较精简的总结啊
也就是说我们前面学了半天
总体比例的置信区间到底是一个什么东西
我们说
对于一个随机样本
基于样本比例的估计
π尖儿或者π(hat)
而得出的总体比例π的置信区间
这个置信区间为π(hat)
加减Z二分之α乘以
根号下π(hat)1减π除以n
那这个Z二分之α
实际上就是标准正态曲线下
使得变量在均值左右Z二分之α个
标准误的范围内的概率
等于置信水平的值
然后在置信水平为
95%和99%的时候呢
Z值的取值
分别为1.96和2.58
样本量需要足够大
大到什么程度
大到每一类的观测值都需要大于15
这就是我们所要讲我们对总体比例置信区间的一个总结
-1.1 什么是统计学?
--视频1.1
-1.2 数据
--视频 1.2
-1.3 随机化原则
--视频 1.3
-1.4 数据收集方法
--视频 1.4
-第一章:绪论--1.5 习题
-2.1 描述统计概述 - 社会学概念的量化问题
--Video
-2.2 变量的分类
--Video
-2.3 描述统计方法 I: 制表法 Tabular Method
--Video
-2.4 描述统计方法 II: 绘图法 Graphical Method
--Video
-2.5 描述统计方法 III: 数值法 Numerical Method
--Video
-第二章:描述统计--2.6 习题
-3.1 探索性数据分析
--视频3.1
-3.2 EDA的制图原则
--Video
-3.3 R语言初体验
--R 语言初体验
-3.4 CRAN 和学习资源
-3.5 R 基础知识
--Video
-3.6 图形和数值
--Video
-4.1 概率的基本概念
--Video
-4.2 离散型与连续型变量的概率分布
--Video
-4.3 正态分布
--Video
-4.4 抽样分布
--Video
-第四章:概率分布--4.5 习题
-5.1 用抽样分布来代表抽样的变异性
--Video
-5.2 样本均值的抽样分布
--Video
-5.3 中心极限定理
--Video
-5.4 点估计和区间估计
--Video
-第五章:统计推断 - 估计--5.5 习题
-6.1 区间估计
--Video
-6.2 总体比例的区间估计
--Video
-6.3 置信水平
--Video
-6.4 总体均值的区间估计
--Video
-第六章:统计推断 - 区间估计--6.5 习题
-7.1 绪论
--Video
-7.2 一个显著性检验的五个部分
--Video
-7.3 均值的显著性检验
--Video
-7.4 比例的显著性检验
--Video
-7.5 检验中错误的类型
--Video
-第七章: 统计推断 - 显著性检验--7.6 习题
-8.1 预备知识
--Video
-8.2 比较两组比例
--Video
-8.3 比较两个独立样本的均值
--Video
-8.4 比较两个相依样本的均值
--Video
-8.5 方差分析(选学)
--Video
-第八章:两组比较和多组比较--8.6 习题
-9.1 变量间的关联分析
--Video
-9.2 列联分析
--Video
-9.3 定序变量间的关联关系
--Video
-第九章:变量间的关联分析--9.4 习题
-10.1 简单线性回归模型概述
--Video
-10.2 模型系数估计
--Video
-10.3 评价系数估计的准确性
--Video
-10.4 评价模型的准确性
--Video
-10.5 R Lab: 用R构建简单线性模型
--Video
-第十章:简单线性回归--10.6 习题
-11.1 多元线性回归概述
--Video
-11.2 多元线性回归
--Video
-11.3 潜在问题及解决方案
--Video
-11.4 用R语言进行多元线性回归
--Video
-第十一章:多元回归--11.5 习题
-12.1 社会科学中的分类问题
--Video
-12.2 Logistic回归概述
--Video
-12.3 Logistic回归系数估计
--Video
-12.4 Logistic回归模型评价
--Video
-12.5 其他多元统计方法
--Video
-12.6 R语言实践
--Video
-12.7 结束语
--Video