当前课程知识点:基于R语言的社会统计分析 > 第六章:统计推断 - 区间估计 > 6.1 区间估计 > Video
刚刚我们了解了点估计
那么现在呢我们就来聊聊区间估计
光知道点估计一个点的最好的猜测在哪里
还远远不够
因为我们希望知道这个点估计到底有多精确
于是乎我们需要找一个区间
来为我们推断提供有效的信息
那我们需要知道呢这个点估计
与总体的真实参数到底有多接近
点估计的精确程度就是靠这个区间
更确切的说是靠这个区间的宽窄
来体现的
那区间估计呢是以点估计为中心的一个区间
它被设计用来
以某一选定的接近于1的概率
包含参数值
这个概率呢其实就是我们信心的大小
区间估计以特定的置信度
包含参数值
所以常常呢就直接被称为置信区间了
那下面呢我们给一个置信区间更加确切的定义
它的意思是一个参数的置信区间
是我们相信
这个参数会落入的一个数值区间
这种方法产生的一个区间会包含参数真实值的概率
被称为置信水平
代表置信水平的数值呢
通常都接近于1
比如0.95或者是0.99
因为我们需要这个概率足够大
让我们有足够的信心相信这个区间会包含真实值
那下面的问题就是
这个数值到底应该如何构建呢
对了你可能已经想到了
要想知道
区间怎么构建
我们又需要回到上面讲到的抽样分布的知识了
因为我们需要知道
抽样分布到底是什么情况我想知道
所有的可能取值以及这个每一个取值可以出现的概率
那像前面中心极限定理告诉我们的
只要是你抽到的样本足够大
我们就可以认为
抽样分布呢近似的服从一个正态分布
这个正态分布呢可以进而决定估计值落入
某一个区间的概率究竟是多少
举一个例子
如果我们希望这个概率是
95%
那么估计值会落入距离真实值几个标准误
应该是依靠之前的经验法则是
两个左右的标准误的范围内
那如果说我们想特别特别的确定
将近99.8%的确定说
这个区间会包含真实值呢
那估计值会落入距离真实值三个标准差的范围内
那不难想象
置信区间应该会采取一个什么样的形式呢
实际上置信区间一定会
以点估计为中心
然后加减一个边际误差
这个边际误差也就是我们容忍的可以出错的范围
所以置信区间的基本形式是点估计
加减边际误差
那这里面边际误差又是怎么算出来的
它一般的形式
是标准误的某个倍数
也就是刚才我们说的我说
距离
真实值的距离是
两倍的标准差还是三倍标准差
具体这个是标准误的几倍
要根据我们的置信水平来决定
那它们应该有什么关系
你想想如果说我们的置信水平高
也就是我们希望
我们有足够的信心来相信
这个区间会包含真实值
那你觉得区间应该是大了还是小了
如果是信心大了
实际上这个倍数就会大
置信区间就会越来越宽这样我们就更安全
对吧
然后呢
要一些牺牲
如果你置信区间很大
就说明你的点估计的精确度就降低了
那相反呢
如果说我的置信水平低
那倍数就小
置信区间呢就窄
那好处是
显得你的点估计的精确度很高
就是它那个置信区间
很窄说明每次我的这个
样本的猜测值不会离真实值太远
那下面呢我们就要看看具体的对于
样本比例还有样本均值来说
它这个置信区间的
构造过程
-1.1 什么是统计学?
--视频1.1
-1.2 数据
--视频 1.2
-1.3 随机化原则
--视频 1.3
-1.4 数据收集方法
--视频 1.4
-第一章:绪论--1.5 习题
-2.1 描述统计概述 - 社会学概念的量化问题
--Video
-2.2 变量的分类
--Video
-2.3 描述统计方法 I: 制表法 Tabular Method
--Video
-2.4 描述统计方法 II: 绘图法 Graphical Method
--Video
-2.5 描述统计方法 III: 数值法 Numerical Method
--Video
-第二章:描述统计--2.6 习题
-3.1 探索性数据分析
--视频3.1
-3.2 EDA的制图原则
--Video
-3.3 R语言初体验
--R 语言初体验
-3.4 CRAN 和学习资源
-3.5 R 基础知识
--Video
-3.6 图形和数值
--Video
-4.1 概率的基本概念
--Video
-4.2 离散型与连续型变量的概率分布
--Video
-4.3 正态分布
--Video
-4.4 抽样分布
--Video
-第四章:概率分布--4.5 习题
-5.1 用抽样分布来代表抽样的变异性
--Video
-5.2 样本均值的抽样分布
--Video
-5.3 中心极限定理
--Video
-5.4 点估计和区间估计
--Video
-第五章:统计推断 - 估计--5.5 习题
-6.1 区间估计
--Video
-6.2 总体比例的区间估计
--Video
-6.3 置信水平
--Video
-6.4 总体均值的区间估计
--Video
-第六章:统计推断 - 区间估计--6.5 习题
-7.1 绪论
--Video
-7.2 一个显著性检验的五个部分
--Video
-7.3 均值的显著性检验
--Video
-7.4 比例的显著性检验
--Video
-7.5 检验中错误的类型
--Video
-第七章: 统计推断 - 显著性检验--7.6 习题
-8.1 预备知识
--Video
-8.2 比较两组比例
--Video
-8.3 比较两个独立样本的均值
--Video
-8.4 比较两个相依样本的均值
--Video
-8.5 方差分析(选学)
--Video
-第八章:两组比较和多组比较--8.6 习题
-9.1 变量间的关联分析
--Video
-9.2 列联分析
--Video
-9.3 定序变量间的关联关系
--Video
-第九章:变量间的关联分析--9.4 习题
-10.1 简单线性回归模型概述
--Video
-10.2 模型系数估计
--Video
-10.3 评价系数估计的准确性
--Video
-10.4 评价模型的准确性
--Video
-10.5 R Lab: 用R构建简单线性模型
--Video
-第十章:简单线性回归--10.6 习题
-11.1 多元线性回归概述
--Video
-11.2 多元线性回归
--Video
-11.3 潜在问题及解决方案
--Video
-11.4 用R语言进行多元线性回归
--Video
-第十一章:多元回归--11.5 习题
-12.1 社会科学中的分类问题
--Video
-12.2 Logistic回归概述
--Video
-12.3 Logistic回归系数估计
--Video
-12.4 Logistic回归模型评价
--Video
-12.5 其他多元统计方法
--Video
-12.6 R语言实践
--Video
-12.7 结束语
--Video