置信度和置信区间(2)慕课视频播放-机器学习概论-MOOC慕课视频教程-柠檬大学

所以我们现在可以直接回答第二个问题

如果你的测试的样例集就是你的测试集有N个样例

而且它们是和你的假设独立地选取的 random独立地选取的

然后你的测试样例>=30 这是为了服从（正态分布）

我们可以把二项分布近似成正态分布那么你就可以有95%的概率

这个error_S就是你的样本的错误率是在真实的错误率

你的样本的错误率它是落在真实的错误率加减1.96倍的σ之间的

这个就是我们之前推导过的σ

那1.96是因为它是95%对应的那个区间的系数

那么同样的相互倒换一下就是换一个位置是等价的

真实的错误率也就是在你的样本错误率加减1.96倍的

这个error_D乘以1减error_D的这个范围内除以n 那现在我们说这个真实错误率

我们这两个是equivalent 是等价的下一步不等价了

只能近似是因为我们的样本错误率的期望值等于真实错误率

所以它近似的等于样本错误率加减1.96倍的error_S乘以1减error_S乘以n

瞧我们的置信度置信区间和你的这个估计就出来了

所以更进一步其实我们有的时候

我们有时候不是想说我的错误率大于多少并且小于多少

我们有时候不关心错误率大于多少

我们其实主要关心的是错误率小于一个什么值所以呢

我们其实要用到一个单边单边就是我们已经知道了它的下界和上界

就是你的这个置信区间

那我们其实只是想知道错误率小于U的这个只看一边一边怎么做呢

很好呀那个正态分布的第二个性质

我们刚才说就是性质之一是对称性我们就拿来用了

因为正态分布是对称的所以呢你的这个左右两边

比如说我现在是有95%的概率 95%的曲线面积也就是有95%的置信度

它在正负1.96之间

那么也就意味着这个面积之外的两个阴影部分是5%

因为就是1-95%就是5% 它又是对称的

所以呢这一边的时候这一边其实它只有2.5%

所以呢你如果说我的这个错误率小于1.96这个值的话

它的上界是1.96 不关心它的下界的时候呢

你就是97.5% 因为右边只有2.5% 所以这个面积就是1-2.5%

这个很简单利用到了正态分布的对称性

如果你还是想我置信度不需要那么高我只需要置信度是95%就行了

那置信度为95%的单边的这个曲线其实就是

下一个就是1.645这个范围

所以事实上这是我们对错误率估计的单边和双边的变化

所以我们现在回顾一下我们第一个问题呢

应该基本上回答完了怎么回答的呢

我们首先需要满足几个条件第一你需要是你的测试样例集

我们再次重复你要是random sample 而且不能拿来训练过

而且测试样例集要>=30 并且你的那个错误率就是np乘以1减p要大于5的

就是你如果那个p 太变态了

就是嗯就是太不正常了也不行

然后呢我们真实错误率

你可以认为它以N%的的置信度存在于这样的一个置信区间内

这个置信区间的大小是可以算得出来的

然后呢具体的系数 Z_N这个系数可以查表出来

然后我们下面呢稍微再多给大家一些关于置信区间的一些信息

更general的来说就是我们把这个问题再稍微泛化一些

你如果我们怎么样去估计置信区间呢

第一步你要确定你要估计什么确定一个估计量

比如说我们在这里面刚才错误率估计里面

我们想估计的是真实错误率这个估计量

第二步呢你要确定你用什么东西去估计

那我们刚才的实验里面是用样本错误率去估计你的真实错误率

那么别忘了在这个时候估计的时候你要服从条件就是无偏的

最小方差的无偏估计然后呢你要去确定一下你估计的这个均值和方差

就是你的这个σ和你的μ是什么

那接下来呢你就可以发现我就可以用用你的就是用N%的置信度

来就是估计有N%的置信度

你的估计量它落在L和U的这两个置信区间内

这个我们不是在这里呀我们说的不是正态分布

对于正态分布来说你的置信度置信区间是非常容易计算的

对于别的分布不一定是这样的

那这样就觉得好像这个问题只有碰巧它正好是正态分布才可以对吗

好吧那么我们其实想说

我怎么知道你的均值和方差

而且万一它不是正态分布怎么样呢怎么办呢

我们接下来跟大家补充第二个知识

回忆一下补充第二个知识是我们曾经学过的

中心极限定理

我相信大家所有人都还记得中心极限定理这个名字

但是中心极限定理到底是在干什么呢

可能有很多同学不记得了中心极限定理我们来说

在我们这个场景下我为大家解释一下它是什么

就是我们首先要一些设定第一就是问题是

就是你的随机变量是独立同分布的

我们再次提到独立是你的每次实验相互之间不干扰

同分布就是它们服从的是同一个分布

然后呢第二个是我们其实对于任意的分布

就是对于中心极限定理来说它数描述的是说对于任意分布

你呢你可能不知道那个分布是什么样

你甚至可以是一个非常乱七八糟的一个这样的分布没关系

这个分布呢你只要知道它的均值是μ

然后它的有限的方差是这个σ平方那么你是一组实验

就是你有一组观察量我们现在来看一看

这个观察量它的平均它的mean变量

就是等于你的每一个观察量的均值

就是好中心极限定理告诉我们不管你原来这个分布是什么

当你的N趋近于无穷的时候

它的均值的这个变量一定是服从正态分布的

而且这个正态分布的均值就是μ 跟你原来的那个μ是一样分布的μ一样

这个均值变量它的它的那个方差是你原来的σ平方再除以2

这就是我们在现在这个场景下解释什么是中心极限定理

我看到有很多同学感到有些震惊了确实当我们想起这

当我看到这的时候我也很震惊就是中心极限定理

所以我越来越觉得它是一个特别特别了不起的定理非常伟大

你原来的这个分布可以乱七八糟什么都可以

你只需要你观察的每一个实验

你的观察这个变量的多次观察是独立同分布的

如果你观察的足够多重复足够多次

当然对中心极限定理是说当N趋近于无穷的时候

它们的平均值这个变量是服从正态分布的

然后一服从正态分布非常多的问题就就有解了

然后另外它的μ和方差是这样那你就很容易

而且正态分布非常容易把它转换成一个均值为0

标准差为1的这样一个分布

为什么我们这样说我不知道大家我们回

大家recall一下我们上周给大家留的那个实验

就上上周的贝叶斯实验我们是不是跟大家说你要重复这个实验重复很多次

现在去想想为什么让大家重复很多次呢

当然其实你重复的次数还不够多

一般来说我们在实验里面经常会重复一百次或者更多

你重复的次数越多 N越大你每一次实验

你最终背后的那个哪怕它不管它服从的是什么你得到

我们让你report的是重复多次实验之后的平均错误率

就是你每一次你会有一个不同的错误率

有时候你可能精度率90% 有时候精度是85%

有时候甚至精度只有72% 它是会抖动的

但是你重复多次之后你的平均值它其实是服从正态分布的

机器学习概论课程列表：

第一章绪论

-1.1 课程介绍

-1.2 机器学习的背景

-1.3 什么是机器学习

-1.4 机器学习系统设计

-第一章作业

第二章决策树学习（I）

-2.1 决策树的基本概念

-2.2 决策树的实例和发展历史

-2.3 经典决策树算法ID3

-2.4 过拟合和前剪枝

-第二章作业

第三章决策树学习（II）和贝叶斯学习

-3.1 下午茶时间：勒索软件

-3.2 后剪枝

-3.3 决策树的改进和归纳学习假设

-3.4 贝叶斯学习的背景

-3.5 极大似然假设、朴素贝叶斯和最小描述长度

--极大似然假设、朴素贝叶斯和最小描述长度

-第三章作业

-第三章课件

第四章马尔可夫模型和隐马尔可夫模型

-4.1 下午茶时间：微博的垃圾检测

-4.2 马尔可夫模型

-4.3 隐马尔可夫模型

-4.4 评估问题

-4.5 解码问题

-4.6 隐马尔可夫模型的应用

-第四章作业

第五章假设检验

-5.1 下午茶时间：图灵奖

-5.2 假设评估

-5.3 置信度和置信区间

-5.4 有限数据下的比较

-第五章作业

第六章基于实例的学习

-6.1 下午茶时间：黑洞照片

-6.2 基于实例的学习的基本概念

-6.3 最近邻算法

-6.4 K邻近算法

-6.5 KD树

--KD树

-6.6 距离加权的K近邻算法

--距离加权的K近邻算法

-第六章课件

-第六章考试

第七章支持向量机（I）

-7.1 支持向量机的背景

-7.2 线性支持向量机

-第七章作业

第八章支持向量机（II）和无监督学习

-8.1 核函数支持向量机

-8.4 支持向量机总结

-8.5 无监督学习简介

-8.6 层次聚类

-8.7 K-means聚类和K-medoids聚类

--K-means聚类和K-medoids聚类

-第八章课件

-第八章作业

置信度和置信区间(2)在线视频

置信度和置信区间(2)课程教案、知识点、字幕

机器学习概论课程列表：

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习

置信度和置信区间(2)笔记与讨论

也许你还感兴趣的课程:

置信度和置信区间(2)在线视频

置信度和置信区间(2)课程教案、知识点、字幕

机器学习概论课程列表：

第一章 绪论

第二章 决策树学习（I）

第三章 决策树学习（II）和贝叶斯学习

第四章 马尔可夫模型和隐马尔可夫模型

第五章 假设检验

第六章 基于实例的学习

第七章 支持向量机（I）

第八章 支持向量机（II）和无监督学习

置信度和置信区间(2)笔记与讨论

也许你还感兴趣的课程:

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习