课程介绍(2)慕课视频播放-机器学习概论-MOOC慕课视频教程-柠檬大学

接下来跟大家说一下我们的课程信息

这个课程我特别重要

要强调的是大家在这个课上要学到什么

我们又说它是一个很重要的领域这个领域又涉及面非常广

又是很多工作的基础然后我们学的又叫概论

大家要学到什么特别重要的是你在课上要学到基本概念

就是在这里为大家未来的学习打好基础

基本概念是每一个方法

每一类似方法体系都要有它各自的基本概念

包括我们机器学习本身也有它的基本概念

还有就是基础的学习理论

学习理论其实有很多可讨论的

我们在今天在我们这门课上讨论的是比较基础的一部分

但是也是你理解了这些才能够更好地理解到其它的部分

然后以及第三个部分是那些经典的算法

但是经典的算法即使这样

我们也不可能把所有的每一个分支的算法都给出来

但是会考虑到大家的接受程度和其它课程的关联

我们一会儿会谈到都会有哪些领域的算法会得到讨论

在每一个算法里面并不是说大家一定要记住这个问题

我们不是一个数据结构课我们不是叫算法课

我们是机器学习和这个课程涉及到算法

第一你要弄明白的不是这个算法怎么设计完全不是

第一你要弄明白的是问题本身是什么

你要解决什么问题你想要解决什么背景的问题

它在实际应用里面可能是面临着什么样的问题

要把问题定义清楚

然后第二个才是我们基本思想想要解决这个问题

我打算怎么做你的基本的思想因为解决一个问题

他可能会有好几个挑战的小的问题需要去解决

你是不是把这几个都能解决的了

还是我要关注其中一个去解决

我打算怎么做这个是你的基本思想

这两个有了才是第三点你怎么去设计这个算法

这才涉及到那个算法是怎么设计的

为什么算法要这样做其实和前面紧密相关的

所以并不是说我学了机器学习我知道Decision Tree

然后我就会写Decision Tree

你就搞清楚了机器学习

不是这样的你得先把问题是什么问题的定义

然后你的基本的想法搞定了才是这个以及future work

没有任何一个算法是完美的

所有的算法都会有他自己的不合理的地方

或者是解决不了的问题

我们这个算法没解决的是什么问题

你需要去搞明白

事实上在机器学习里有一个非常著名的一句话

没有任何一个算法是从总的来说比其他算法都好的

可能大家说不会啊你看现在深度学习横扫了机器学习领域

然后深度学习那么好但我们仍然要说

在很多时候深度学习的算法的效果

没有传统的算法效果好并不是放之四海皆准的万能的

没有一个万能的金钥匙

甚至会有一个定理就是说

你如果是把所有的问题拿下来拿过来

把所有的算法都试一试就会发现

平均的来看所有的算法效果都差不多

它们效果是怎么样呢就是会比随机猜要好那么一点点

其实你要想说我学了一个什么算法

我知道什么算法你一定要知道这个算法适用什么场景

能解决什么问题它的不足在哪里

这些知道了才是你掌握的东西

然后也并不是到算法就够了

我们在这个课上你还需要掌握的是第四个问题

就是分析对问题的分析

对特征的分析特别重要

具体在具体的问题上面有的时候你会发现

在传统的机器学习里面可能你换了算法调了半天参数

你的性能可能只提高了2% 5%

但是可能你突然发现你换一换特征换一换数据

就补充了一些数据换了一些漏掉的特征

增加了一些特征或去掉一些特征

带来了10%的提升

所以算法并不是一切

虽然我并不是说算法不重要

那么我之所以这样强调

是因为有太多的人过于强调算法本身

而忽略了其他这些非常重要的东西特征的分析

问题的分析是特别重要的以及结果的分析

而这个其实不太容易那样教到

因为我不太可能跟大家穷举说都有哪些种不同的特征

而且这些特征会和实际问题所关联

但是我们在课堂上会专门设有一个专门的环节

叫做下午茶时间

然后这个专门的环节是为了让大家来去理解

具体问题分析的我们稍后会谈到

所以总的来说我们希望大家经过机器学习概论课后

也具有了一定的解决实际问题的能力

实际问题可能是一个实际的应用场景

也有可能是你的一个研究的问题

那么大家的学习的材料参考书

我们说最重要的其实是我们这个课件和你记的笔记

因为课件上面是提纲挈领的东西

可能我会提到一些信息反复强调的

我建议大家还是好记性不如烂笔头

记一些重要的信息下来

这个会对大家对这个课程的理解也很有帮助

然后我们没有一个教材

我们不拿其中一本书作为教材

但是我们其实会有一些推荐的重要的参考书

比如说这本书是重要的参考书之一

机器学习然后他这本书稍微早一点

然后比较经典一些

这本书上大概会有50%左右的内容会是我们这门课上会教的

当然他也是只是覆盖我们这本这个课上讲的内容的

百分之五六十然后有一些习题我也会从这本书上来选

还有我们其实还有其他非常好的参考书

也建议大家也可以就相关的问题时不时的借来读

比如说机器学习导论还有比如说模式分类

这个模式分类是特别经典的教材

很长时间了但是很经典

以及这些年出的比较新的南大周志华老师的机器学习

这些书都是还不错的我应该没有完整的列下来

还有一些统计机器学习等等

我可能还没有把所有的可以值得参考的书列下来

但是这些是相对选出来比较重要的

大家可以多做一些参考和讨论的

我们在不同的地方

在后面的章节里面会陆续提到一些来给大家参考

接下来说一下我们这门课里面一共都要介绍哪些部分的内容

首先是基本的机器学习系统的介绍

以及课程介绍是我们今天这堂课的内容

然后接下来是我们蓝色画线画出来的这些方法

比如说决策树的学习然后贝叶斯学习

我们会以朴素贝叶斯为例

然后还有隐马尔科夫模型其实它是马尔科夫模型

和隐马尔科夫模型一个系列的代表

还有就是核方法就是kernel-based learning

然后会以其中的SVM为例

再有就是基于实例的学习

其中会有KNN 经常会用到的KNN以及它的各种变种

以及无指导的学习

其中无指导学习里面我们会以聚类方法

大概会有四五种不同的聚类的方法给大家介绍

基本上每一行就是一堂课的内容

他们覆盖了蓝色这部分覆盖了最经典的

最基础的机器学习的方法不同的方法的体系

然后差不多各自各成一个分支

接下来我们大概会在这学期的后一半的时间里面

提到一些高级的话题高级话题包括比如说集成学习

集成学习里面我们也会介绍三种至少三种不同的算法

比如说weighted majority 有bagging和boosting等等

还有就是概率图模型

这个概率图模型其实它和前面的隐马尔科夫模型

可以认为它一脉相承下来为什么我们这里去介绍

因为大家现在人工智能发展的很红火的时候

大家会对统计的方法有非常多的强调这是在前些年

但是在最近的十年

人们开始发现在机器学习方法

以及更大范围的人工智能的方法里面单靠统计是不够的

单靠最早能提出人工智能和方法规则式的方法也是不够的

我们是想要把推理想把知识放进来

放到我们的统计学习里面把它们融合起来

人们认为它是一个而且人们也已经开始在做

它是一个非常非常重要的一个方向

也是一个值得探讨的的方向之一

那么概率图模型它给了我们一些简要的一些推理

我们只是以它把它以一个例子让大家可以管中窥豹地说

我们可以在分析的时候在统计的方法

在概率的方法之上加入一些推理加入一些理解

然后后面当然还有要提一些deep learning的东西

这是我们这几年加上来的

然后还有Transfer Learning就是迁移学习

迁移学习也是提出来的比较早

但是在这些年的研究的越来越重要

所以事实上也有人会说机器学习发展的几大方向

比如说十大方向八大方向或者20个研究问题等等

不管怎么说其中总会有一个占有一席之地

的就是深度的迁移学习

所以我们在这里面会跟大家做一些简单的初始

给大家铺垫基础知识以概论的形式给大家介绍

还有一个就是要看情况看我们课程和学校放假的情况

就是会有一些缺失问题下的参数估计问题

这个问题对本科生的同学来说略有一些难度

但是在研究生以及未来你们研究的过程中用的挺多的

以及和他和其他的方法的结合都还用的挺多

在现在深度学习的里面也有人在用这种参数估计的方法

所以如果有时间我们会尝试给大家介绍一下

如果没有时间但对这个感兴趣的同学也欢迎

随时来跟我们做一些沟通和交流

然后以及学习的理论

学习理论我们会涉及到学习的偏置还有评价的问题

还有可能近似正确学习这些我们会分两堂课来讲

因为理论的学习对大家来说可能会相对稍微难一点

我们第一堂课会放在期中这个时间来给大家介绍

因为他跟大家的实验和后面的实验的分析也都很有关系

第二堂课会在学期末的时候会讲第二堂理论相关的课程

以及在第15周的时候会给大家做一个总复习

到这里可能我相信大家说不定已经有一点点晕了

说原来我要讲这么多东西

因为我们不是说用几堂课来讲这个算法

我们可能是一堂课会讲几个算法

它代表一个分支的基本思想

但是没关系我们会在overview的那堂课里面

把整个讲过的东西把它串起来

让大家有一个更好的概念和理解

在这个过程中大家如果有任何问题都欢迎

随时问题随时打断我上课都没问题

另外我每周一的下午四点到五点是我的开放交流时间

大家如果想提问的时候也可以提前在Info网上预约一下

机器学习概论课程列表：

第一章绪论

-1.1 课程介绍

-1.2 机器学习的背景

-1.3 什么是机器学习

-1.4 机器学习系统设计

-第一章作业

第二章决策树学习（I）

-2.1 决策树的基本概念

-2.2 决策树的实例和发展历史

-2.3 经典决策树算法ID3

-2.4 过拟合和前剪枝

-第二章作业

第三章决策树学习（II）和贝叶斯学习

-3.1 下午茶时间：勒索软件

-3.2 后剪枝

-3.3 决策树的改进和归纳学习假设

-3.4 贝叶斯学习的背景

-3.5 极大似然假设、朴素贝叶斯和最小描述长度

--极大似然假设、朴素贝叶斯和最小描述长度

-第三章作业

-第三章课件

第四章马尔可夫模型和隐马尔可夫模型

-4.1 下午茶时间：微博的垃圾检测

-4.2 马尔可夫模型

-4.3 隐马尔可夫模型

-4.4 评估问题

-4.5 解码问题

-4.6 隐马尔可夫模型的应用

-第四章作业

第五章假设检验

-5.1 下午茶时间：图灵奖

-5.2 假设评估

-5.3 置信度和置信区间

-5.4 有限数据下的比较

-第五章作业

第六章基于实例的学习

-6.1 下午茶时间：黑洞照片

-6.2 基于实例的学习的基本概念

-6.3 最近邻算法

-6.4 K邻近算法

-6.5 KD树

--KD树

-6.6 距离加权的K近邻算法

--距离加权的K近邻算法

-第六章课件

-第六章考试

第七章支持向量机（I）

-7.1 支持向量机的背景

-7.2 线性支持向量机

-第七章作业

第八章支持向量机（II）和无监督学习

-8.1 核函数支持向量机

-8.4 支持向量机总结

-8.5 无监督学习简介

-8.6 层次聚类

-8.7 K-means聚类和K-medoids聚类

--K-means聚类和K-medoids聚类

-第八章课件

-第八章作业

课程介绍(2)在线视频

课程介绍(2)课程教案、知识点、字幕

机器学习概论课程列表：

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习

课程介绍(2)笔记与讨论

也许你还感兴趣的课程:

课程介绍(2)在线视频

课程介绍(2)课程教案、知识点、字幕

机器学习概论课程列表：

第一章 绪论

第二章 决策树学习（I）

第三章 决策树学习（II）和贝叶斯学习

第四章 马尔可夫模型和隐马尔可夫模型

第五章 假设检验

第六章 基于实例的学习

第七章 支持向量机（I）

第八章 支持向量机（II）和无监督学习

课程介绍(2)笔记与讨论

也许你还感兴趣的课程:

第一章绪论

第二章决策树学习（I）

第三章决策树学习（II）和贝叶斯学习

第四章马尔可夫模型和隐马尔可夫模型

第五章假设检验

第六章基于实例的学习

第七章支持向量机（I）

第八章支持向量机（II）和无监督学习