有限数据下的比较慕课视频播放-机器学习概论-MOOC慕课视频教程-柠檬大学

就这个东西 Given D加上0.1 我们接下来怎么做呢

我们把这个等式两边都加上一个0.1

那么这个就左边就是D加上0.1>behind

就是大于我们的样本错误率的差值0.1

这一步是一个很简单的一个变换

好那么这个东西呢你看这个东西看起来跟我们看到的μ加减z_N×σ

大家不知道有没有在这堂课上你能把它联系上来了它是一个上界

好我们来看一下所以其实我们事实上我们知道这个d head

它的上界是小于μ+0.1的因为我们这个

这个正态分布的这个D就等于等于μ 它的期望值是μ

好那现在μ+0.1 这个就有意思了你看啊我们从这个μ

d<μ+0.1能让我们联想起来 d其实是<μ加减Z_N×σ

所以现在σ标准差我能算呀

σ的标准差比如说我们刚才的这个数值出来这个标准差呢

它是等于两个方差之和再开根号

你把这两个的错误率和n代进来就会发现标准差是0.061

你看我们既然d小于μ μ也是知道的对吗

μ+0.1 那我们d就<μ加上你的标准差是0.061

标准差乘以Z_N等于等于这个就是等于0.1

所以你的Z_N就是1.64喽 1.64是什么呀我们提了好几遍

1.64可能大家逐渐熟悉它是90%的双边的置信度

90%的双边置信度相当于95%的单边置信度

所以现在我们这个问题可以回答了就在真实的情况下

你呢事实上在这样的设置下样本错误率分别是0.3和0.2

而且各在100个上面去测试的那么真实情况下

你的A的错误率还比B大的概率是置信度是95%

这个的计算我们利用到了两个正态分布的叠加还是正态分布

所以我们看的是它的错误率的差值然后把它就是把它

我们做的所有的事情都是把这个形式把它描述成d<μ加上

就是加减我们只看上限加上Z_N×σ这个形式然后σ是计算出来的

已经知道了的然后μ呢我们也是知道的就是μ其实没那么大关系

σ知道的然后我的Z_N×σ是你的差值也知道

你只要求出来Z_N就可以了然后查表就可以知道了

就是你知道了那个置信区间的系数你就可以知道它的置信度

刚才我们说N=100 如果你的测试样例集是30的话

那么这个时候你的标准差会更大标准差变成了0.111

这个标准差乘以一个系数等于我们这个差值0.1

那么这个系数就会更小只有0.9 系数0.9 就是区间更窄

区间更窄呢 0.9相当于双边的68%的置信度

也就等于单边的84%的置信度当你的训练

当你的测试样例集太小的时候你这个估计的置信度就也会小

如果从100减成了30 你现在两个测试

然后那你的置信度在同样的错误率条件下

就置信度从95%变成了84% 所以我们要有足够多的训练样例

最后我们来回答一下第三个问题第三个问题是说

如果数据很有限怎么办这个问题我们不用花很多时间

因为其实我们在做实验时候已经交给你们了

很有限怎么办呢我们有一种做法就是把它分出来

就是我们把这个数据集呀我们本来想做的是在两个不同的集合

A和B上测试但是现在呢我们其实能够做的就是用一个holdout

就是我们我们在同样的一个抽出来同样的一个数据集

就是测试集来去而不是在random的随便的那个数据集上去做

我们在同样的sample的集合里面去分出来一个test set

然后这个而且这个test set一定是(再次重复)不能是训练过的集合

好那么其中还有一个做法特别重要的是如果你比较两个方法的时候

是用的完全一样的数据集完全一样的测试集

那么这个时候你算法得到的那个置信的区间就会更窄

置信区间窄就是你估计的更准一点就是你的置信区我们举一个例子

这是一个特别常用的做法叫做K—fold cross validation

这个大家其实在实验里面已经用了对吗

因为我们上节课已经在教给大家这个理论之前先让大家用一用

什么是K—fold cross validation呢就是我把样例

我把这个集合平均的分成了K份每次拿一份去测试

拿剩下的其他份来训练每次拿一份去训练然后这个时候呢

你会发现这个时候你的N次实验每次的测试不独立了不独立了

因为你在每次测试的时候你的那个model啊

它是相关的那个model相关是因为你会有K减2份的训练集是重叠的

虽然测试集独立但是你的训练集重叠

训练集重叠就意味着你的那个模型H本身是重叠的

然后呢这个时候呢我们每次好用一份来去测试

然后用其他份来去训练重复多次就得到了一个平均的测试的那个精度

这是平均值

好这个时候呢我们会发现它你的这个不能再用正态分布的Z_N

因为不符合独立同分布了那么这种情况下呢

我们会告诉大家有一个问题是有一个分布是T分布

它呢有类似的性质 T分布呢

可以写成你的这个均值加减T系数和S这个标准差标准差呢

你会看到跟刚才的那个标准差很像

但是前面乘以了一个K乘以K减1分之一的系数

这个我们把它叫做自由度就是我们把这个K

就是我们的K份把它叫做自由度

所以呢你还是能够计算出它的标准差来然后呢会有T分布的一个系数

然后所以这个时候呢我们就可以它就有了一个更紧的置信度

什么是更紧的置信度就是你原来估计那个那个小女孩年龄

年龄是3岁到60岁你现在呢可以把她估计成16到18岁

这个就是置信区间就更紧了一个更紧的置信区间表示你的

你的估计更准确为什么在这种T分布下估计更准确呢

因为这个时候你是用同样的一份数据来去对比两个结果

两个实验结果同样的一个数据就是我们的pair t—test

pair T—test的意思就是如果你一个实验是是这样做的

Kfold 如果我现在让你比较两棵决策树或者两个模型的好坏

你每次是有同样的测试集去比较得到一个结果

再用同样的测试集去比较又得到第二个结果

这个时候你做的就是pair 的t—test 而不是对第二个方法重新采样

重新分了K份的话你如果是用完全一样的数据去测试的时候

这个时候两个算法之间的差异完全取决于这两个算法本身的差异

而不是数据带来的差异这个是pair的t—test

如果两个算法它在同一个那个集合上测试集上去比较的时候

那么这个时候你是一个pair t—test 然后可以用这个T分布来去估计

好那么这个就是我们今天讲过的所有的内容

这个呢事实上我们简单回顾一下

我们首先估计了假设的精度这个假设精度我们利用了

我们发现精度估计假设的精度估计是一个伯努利实验

可以用二项分布来刻画当你的N足够大的时候

它可以近似成一个正态分布

然后我们就用正态分布的置信度和置信区间去估计

这是最最重要的第二个是对比两个方法对比两个实验的时候

如果你都random去取你就可以用用那个

利用正态分布的叠加还是正态分布

以及中心极限定理的平均的效果我们还可以进行两个实验

两个方法的模型的对比如果你数据很有限你就这么多数据

没办法random的分成两份然后给两个实验分别去做

我们可以做K—fold cross validation 然后这个时候呢

我们如果做pair t—test的时候我们它得到了一个更紧的这个置信区间

而且用K—fold cross validation的时候它是服从一个T分布的

这是我们今天的所有的信息感兴趣的同学可以再看这些reference

以及如果对正态分布感兴趣的同学

我推荐这两个科普类的文章非常很有趣说的挺清楚的

叫正态分布的前世今生那个链接在这里

今天会留一个Homework 第一个Homework是这个题是说

你希望它的区间是这么多那么有多少样例才足够

提示大家你还是用这个公式万变不离其宗还是用那个

还是用这个错误率估计的公式去做就行了第二个是

你要分析一下你自己的实验结果因为我们的实验结果让你

让大家做过5%的训练集和50%的训练集你分别有一个精度

请你对比在这两个训练集合下你的方法的错误率的估计

用我们今天介绍的方法因为你的测试集

我不确定每个同学的测试集是否一样的然后去看一看

你到底A和B相比哪一个更好而且有多大的置信度

这个大家学以致用一下

就能够用我们今天的东西把以前讲的东西都连接到一起了

机器学习概论课程列表：

第一章绪论

-1.1 课程介绍

-1.2 机器学习的背景

-1.3 什么是机器学习

-1.4 机器学习系统设计

-第一章作业

第二章决策树学习（I）

-2.1 决策树的基本概念

-2.2 决策树的实例和发展历史

-2.3 经典决策树算法ID3

-2.4 过拟合和前剪枝

-第二章作业

第三章决策树学习（II）和贝叶斯学习

-3.1 下午茶时间：勒索软件

-3.2 后剪枝

-3.3 决策树的改进和归纳学习假设

-3.4 贝叶斯学习的背景

-3.5 极大似然假设、朴素贝叶斯和最小描述长度

--极大似然假设、朴素贝叶斯和最小描述长度

-第三章作业

-第三章课件

第四章马尔可夫模型和隐马尔可夫模型

-4.1 下午茶时间：微博的垃圾检测

-4.2 马尔可夫模型

-4.3 隐马尔可夫模型

-4.4 评估问题

-4.5 解码问题

-4.6 隐马尔可夫模型的应用

-第四章作业

第五章假设检验

-5.1 下午茶时间：图灵奖

-5.2 假设评估

-5.3 置信度和置信区间

-5.4 有限数据下的比较

-第五章作业

第六章基于实例的学习

-6.1 下午茶时间：黑洞照片

-6.2 基于实例的学习的基本概念

-6.3 最近邻算法

-6.4 K邻近算法

-6.5 KD树

--KD树

-6.6 距离加权的K近邻算法

--距离加权的K近邻算法

-第六章课件

-第六章考试

第七章支持向量机（I）

-7.1 支持向量机的背景

-7.2 线性支持向量机

-第七章作业

第八章支持向量机（II）和无监督学习

-8.1 核函数支持向量机

-8.4 支持向量机总结

-8.5 无监督学习简介

-8.6 层次聚类

-8.7 K-means聚类和K-medoids聚类

--K-means聚类和K-medoids聚类

-第八章课件

-第八章作业

有限数据下的比较在线视频

有限数据下的比较课程教案、知识点、字幕

机器学习概论课程列表：

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习

有限数据下的比较笔记与讨论

也许你还感兴趣的课程:

有限数据下的比较在线视频

有限数据下的比较课程教案、知识点、字幕

机器学习概论课程列表：

第一章 绪论

第二章 决策树学习（I）

第三章 决策树学习（II）和贝叶斯学习

第四章 马尔可夫模型和隐马尔可夫模型

第五章 假设检验

第六章 基于实例的学习

第七章 支持向量机（I）

第八章 支持向量机（II）和无监督学习

有限数据下的比较笔记与讨论

也许你还感兴趣的课程:

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习