当前课程知识点:机器学习概论 >  第五章 假设检验 >  5.3 置信度和置信区间 >  置信度和置信区间(2)

返回《机器学习概论》慕课在线视频课程列表

置信度和置信区间(2)在线视频

下一节:置信度和置信区间(3)

返回《机器学习概论》慕课在线视频列表

置信度和置信区间(2)课程教案、知识点、字幕

所以我们现在可以直接回答第二个问题

如果你的测试的样例集就是你的测试集有N个样例

而且它们是和你的假设独立地选取的 random独立地选取的

然后你的测试样例>=30 这是为了服从(正态分布)

我们可以把二项分布近似成正态分布 那么你就可以有95%的概率

这个error_S就是你的样本的错误率是在真实的错误率

你的样本的错误率它是落在真实的错误率加减1.96倍的σ之间的

这个就是我们之前推导过的σ

那1.96是因为它是95%对应的那个区间的系数

那么同样的相互倒换一下 就是换一个位置是等价的

真实的错误率也就是在你的样本错误率加减1.96倍的

这个error_D乘以1减error_D的这个范围内除以n 那现在我们说这个真实错误率

我们这两个是equivalent 是等价的 下一步不等价了

只能近似 是因为我们的样本错误率的期望值等于真实错误率

所以它近似的等于样本错误率加减1.96倍的error_S乘以1减error_S乘以n

瞧 我们的置信度置信区间和你的这个估计就出来了

所以更进一步其实我们有的时候

我们有时候不是想说我的错误率大于多少并且小于多少

我们有时候不关心错误率大于多少

我们其实主要关心的是错误率小于一个什么值 所以呢

我们其实要用到一个单边 单边就是我们已经知道了它的下界和上界

就是你的这个置信区间

那我们其实只是想知道错误率小于U的这个只看一边 一边怎么做呢

很好呀 那个 正态分布的第二个性质

我们刚才说就是性质之一是对称性 我们就拿来用了

因为正态分布是对称的 所以呢 你的这个左右两边

比如说我现在是有95%的概率 95%的曲线面积 也就是有95%的置信度

它在正负1.96之间

那么也就意味着这个面积之外的两个阴影部分是5%

因为就是1-95%就是5% 它又是对称的

所以呢 这一边的时候 这一边其实它只有2.5%

所以呢 你如果说我的这个错误率小于1.96这个值的话

它的上界是1.96 不关心它的下界的时候呢

你就是97.5% 因为右边只有2.5% 所以这个面积就是1-2.5%

这个很简单 利用到了正态分布的对称性

如果你还是想我置信度不需要那么高 我只需要置信度是95%就行了

那置信度为95%的单边的这个曲线其实就是

下一个就是1.645这个范围

所以事实上这是我们对错误率估计的单边和双边的变化

所以我们现在回顾一下 我们第一个问题呢

应该基本上回答完了 怎么回答的呢

我们首先需要满足几个条件 第一 你需要是你的测试样例集

我们再次重复你要是random sample 而且不能拿来训练过

而且测试样例集要>=30 并且你的那个错误率就是np乘以1减p要大于5的

就是你如果那个p 太变态了

就是 嗯 就是太不正常了也不行

然后呢 我们真实错误率

你可以认为它以N%的的置信度存在于这样的一个置信区间内

这个置信区间的大小是可以算得出来的

然后呢 具体的系数 Z_N这个系数可以查表出来

然后我们下面呢 稍微再多给大家一些关于置信区间的一些信息

更general的来说 就是我们把这个问题再稍微泛化一些

你如果我们怎么样去估计置信区间呢

第一步 你要确定你要估计什么 确定一个估计量

比如说我们在这里面刚才错误率估计里面

我们想估计的是真实错误率 这个估计量

第二步呢 你要确定你用什么东西去估计

那我们刚才的实验里面是用样本错误率去估计你的真实错误率

那么别忘了 在这个时候估计的时候你要服从条件就是无偏的

最小方差的无偏估计 然后呢 你要去确定一下你估计的这个均值和方差

就是你的这个σ和你的μ是什么

那接下来呢 你就可以发现 我就可以用 用你的就是用N%的置信度

来就是估计有N%的置信度

你的估计量它落在L和U的这两个置信区间内

这个我们不是 在这里呀 我们说的不是正态分布

对于正态分布来说 你的置信度 置信区间是非常容易计算的

对于别的分布不一定是这样的

那这样就觉得好像这个问题只有碰巧它正好是正态分布才可以 对吗

好吧 那么我们其实想说

我怎么知道你的均值和方差

而且万一它不是正态分布怎么样呢 怎么办呢

我们接下来跟大家补充第二个知识

回忆一下补充第二个知识是我们曾经学过的

中心极限定理

我相信大家所有人都还记得中心极限定理这个名字

但是中心极限定理到底是在干什么呢

可能有很多同学不记得了 中心极限定理我们来说

在我们这个场景下我为大家解释一下它是什么

就是我们首先要一些设定第一就是问题是

就是你的随机变量是独立同分布的

我们再次提到独立是你的每次实验相互之间不干扰

同分布就是它们服从的是同一个分布

然后呢 第二个是我们其实对于任意的分布

就是对于中心极限定理来说 它数描述的是说对于任意分布

你呢 你可能不知道那个分布是什么样

你甚至可以是一个非常乱七八糟的一个这样的分布 没关系

这个分布呢 你只要知道它的均值是μ

然后它的有限的方差是这个σ平方 那么你是一组实验

就是你有一组观察量 我们现在来看一看

这个观察量它的平均 它的mean变量

就是等于你的每一个观察量的均值

就是好 中心极限定理告诉我们 不管你原来这个分布是什么

当你的N趋近于无穷的时候

它的均值的这个变量一定是服从正态分布的

而且这个正态分布的均值就是μ 跟你原来的那个μ是一样 分布的μ一样

这个均值变量它的 它的那个方差是你原来的σ平方再除以2

这就是我们在现在这个场景下解释什么是中心极限定理

我看到有很多同学感到有些震惊了 确实当我们想起这

当我看到这的时候我也很震惊 就是中心极限定理

所以我越来越觉得它是一个特别特别了不起的定理 非常伟大

你原来的这个分布可以乱七八糟 什么都可以

你只需要你观察的每一个实验

你的观察这个变量的多次观察是独立同分布的

如果你观察的足够多 重复足够多次

当然对中心极限定理是说 当N趋近于无穷的时候

它们的平均值这个变量是服从正态分布的

然后一服从正态分布非常多的问题就 就有解了

然后另外它的μ和方差是这样 那你就很容易

而且正态分布非常容易把它转换成一个均值为0

标准差为1的这样一个分布

为什么我们这样说 我不知道大家 我们回

大家recall一下我们上周给大家留的那个实验

就上上周的贝叶斯实验 我们是不是跟大家说你要重复这个实验重复很多次

现在去想想为什么让大家重复很多次呢

当然其实你重复的次数还不够多

一般来说我们在实验里面经常会重复一百次或者更多

你重复的次数越多 N越大 你每一次实验

你最终背后的那个哪怕它不管它服从的是什么 你得到

我们让你report的是重复多次实验之后的平均错误率

就是你每一次你会有一个不同的错误率

有时候你可能精度率90% 有时候精度是85%

有时候甚至精度只有72% 它是会抖动的

但是你重复多次之后你的平均值它其实是服从正态分布的

机器学习概论课程列表:

第一章 绪论

-1.1 课程介绍

--课程介绍(1)

--课程介绍(2)

-1.2 机器学习的背景

--机器学习的背景

-1.3 什么是机器学习

--什么是机器学习

-1.4 机器学习系统设计

--机器学习系统设计(1)

--机器学习系统设计(2)

-第一章作业

-第一章课件

第二章 决策树学习(I)

-2.1 决策树的基本概念

--决策树的基本概念

-2.2 决策树的实例和发展历史

--决策树的实例和发展历史

-2.3 经典决策树算法ID3

--经典决策树算法ID3(1)

--经典决策树算法ID3(2)

--经典决策树算法ID3(3)

-2.4 过拟合和前剪枝

--过拟合和前剪枝

-第二章作业

-第二章课件

第三章 决策树学习(II)和贝叶斯学习

-3.1 下午茶时间:勒索软件

--下午茶时间:勒索软件

-3.2 后剪枝

--后剪枝

-3.3 决策树的改进和归纳学习假设

--决策树的改进和归纳学习假设

-3.4 贝叶斯学习的背景

--贝叶斯学习的背景

-3.5 极大似然假设、朴素贝叶斯和最小描述长度

--极大似然假设、朴素贝叶斯和最小描述长度

-第三章作业

-第三章课件

第四章 马尔可夫模型和隐马尔可夫模型

-4.1 下午茶时间:微博的垃圾检测

--下午茶时间:微博的垃圾检测

-4.2 马尔可夫模型

--马尔可夫模型

-4.3 隐马尔可夫模型

--隐马尔可夫模型

-4.4 评估问题

--评估问题(1)

--评估问题(2)

-4.5 解码问题

--解码问题

-4.6 隐马尔可夫模型的应用

--隐马尔可夫模型的应用

-第四章课件

-第四章作业

第五章 假设检验

-5.1 下午茶时间:图灵奖

--下午茶时间:图灵奖(1)

--下午茶时间:图灵奖(2)

-5.2 假设评估

--假设评估(1)

--假设评估(2)

--假设评估(3)

-5.3 置信度和置信区间

--置信度和置信区间(1)

--置信度和置信区间(2)

--置信度和置信区间(3)

-5.4 有限数据下的比较

--有限数据下的比较

-第五章课件

-第五章作业

第六章 基于实例的学习

-6.1 下午茶时间:黑洞照片

--下午茶时间:黑洞照片

-6.2 基于实例的学习的基本概念

--基于实例的学习的基本概念

-6.3 最近邻算法

--最近邻算法

-6.4 K邻近算法

--K近邻算法

-6.5 KD树

--KD树

-6.6 距离加权的K近邻算法

--距离加权的K近邻算法

-第六章课件

-第六章考试

第七章 支持向量机(I)

-7.1 支持向量机的背景

--支持向量机的背景

-7.2 线性支持向量机

--线性支持向量机(1)

--线性支持向量机(2)

--线性支持向量机(3)

--线性支持向量机(4)

--线性支持向量机(5)

-第七章课件

-第七章作业

第八章 支持向量机(II)和无监督学习

-8.1 核函数支持向量机

--核函数支持向量机:向量空间

--核函数支持向量机:核函数(1)

--核函数支持向量机:核函数(2)

-8.4 支持向量机总结

--支持向量机总结

-8.5 无监督学习简介

--无监督学习简介(1)

--无监督学习简介(2)

-8.6 层次聚类

--层次聚类

-8.7 K-means聚类和K-medoids聚类

--K-means聚类和K-medoids聚类

-第八章课件

-第八章作业

置信度和置信区间(2)笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。