当前课程知识点:R语言数据分析 >  下部:博术 >  第14章 庐山烟雨浙江潮 >  第14章 庐山烟雨浙江潮

返回《R语言数据分析》慕课在线视频课程列表

第14章 庐山烟雨浙江潮在线视频

返回《R语言数据分析》慕课在线视频列表

第14章 庐山烟雨浙江潮课程教案、知识点、字幕

大家好

欢迎来到《R语言数据分析》课程

不知不觉我们这个课已经接近尾声了

在这门课快要结束的时候

我们先简单温习一下我们相关的内容

我首先想和大家一块做一个小游戏

就是成语连连看

当然这个成语的话

毫无疑问是我们小学 初中早就学过的

但我想说的是

就是我们即便在目前学的一些

最新的一些方法模型

其实是可以和

以前脑海里面早就有的一些知识

我们可以融会贯通的

我们把看似比较陌生的

或者不怎么熟悉的内容

和我们已经有的特别熟悉的内容

已经融入我们血液的一些知识点

结合起来的话

那相应的这些内容应该学得更好了

这个时候我们是把我们在这个课里面

涉及到一些机器学习这些方法一些概念

我们列在左侧

右侧的话是我们一些常见的一些成语

然后现在我们要做的事情是

把我们这里面相关的一些概念

和我们已有的一些成语连起来

通过哪个成语可以形容它相应的特点

我们先看一看

第一条 发现历史数据背后的规律

发现历史数据背后的规律

用哪个成语来形容它比较恰当

当然我们这里面为了简化这个问题

我们将每一个特点都和单一的成语进行连接

单线连就好了

就是最接近的一个 最贴切的一个

咱们先看第一个

发现历史数据背后的规律

它用哪个成语来形容比较合适

可以这样

叫万物并作 吾以观复

什么意思

因为我们说是历史数据背后的规律

我们发现规律是想什么

想把历史的数据拿过来之后

我发现其中的模式

并且外推到未来

我们之所以有这种可能是什么

因为万物并作 吾以观复

因为它是什么

周而复始的

很多规律是有延续性的

在过去存在之后

在未来还会延续下去

只有这种可能

我们才能做数据分析

才能发现数据背后的规律

第二条 特征提取与分类

我们看一看

这里面我们可以把它和见貌辨色

揣骨听声结合起来

其实也就是

比如中医

中医里面的望闻问切

包括我们之前讲的什么看云识天气

都是一样的意思

就我有相应的特征

提完之后

我根据这个特征来做相应的类别的划分

因为机器学习(的核心)就是分分类

根据特征做分类

这是见貌辨色 揣骨听声这么一个过程

我们再看这个梯度下降

梯度下降可以用哪个成语来形容

因势利导 渐入佳境

无论是我们前面讲的极大似然函数

我要估计相应W

我来逐步的达到最大值

还是说我根据这个梯度下降方法

刚才是梯度上升 达到最大值

或者说根据这个代价函数

梯度下降求到最小值

它其实什么 都是因势利导

求这个偏导

这个梯度

然后怎么样

渐入佳境

找到那个谷底

或者找到山峰

就完成了我们这个学习的过程

参数估计好之后

其实完成那个模型的选择

完成这个模型的学习了

咱们再看 前面刚讲到了聚类分析

聚类分析应该是哪个呢

数同类者无远 数异类者无近

就通过数据本身

看你在数据空间里面这个数据点

它离得远一点还是离得近一点

离得近一点的怎么样

它同一簇

离得远一点的另外一簇

这所谓的聚类分析

一种无监督的学习方法

那咱们再看这个

经验风险最小化

它是什么

其实我们可以用这个

知错能改 善莫大焉 来形容它

其实所有的机器学习过程

和我们以前所接触过的

比如说那个控制里面的

利用偏差 消除偏差

它其实意思是

其实策略是一样的

都是知错能改的过程

根据我这个代价函数 让它最小

然后实现这个模型的选择

从模型集里面选出最好的那一个

从而完成我这个学习的过程

再看下面这个模型泛化与迁移

当然它是一个非常难的事情

我们希望是这个模型

过去的模式在未来得以延续

在一个情景里面的模式

比如在北京的训练好的模型

我能推广到上海去

但是这个过程本身比较复杂

所以我们用

橘生淮南则为橘 生于淮北则为枳

用它来形容

下一个模型参数的设置

模型参数的设置

这应该是什么

用哪个

接下来这个选项已经不多了

这个四个里面用哪个

应该是量体裁衣的过程

量体裁衣的过程

我们讲了

其实我们在做机器学习的时候

它其实和裁缝差不多

对吧

我先选定一个什么 先选定一个款式

先把模型集先给框定下来

然后从模型集里面选择最好的那一个

也最贴身的那一个

就这个经验风险最小化

来量体裁衣

特征选择不当

特征选择不当会出现什么问题

其实相当于

缘木求鱼 问道于盲

我们在讲方法论的时候说到

特征和数据决定了

机器学习的上限

假如特征选择不当的话

那就相当于缘木求鱼问道于盲

再怎么训练

特征选不好 参数调到老

咱们再看下一个

垃圾数据未清理

垃圾数据未清理的话 相当于什么

鱼目混珠 混淆视听

这个噪声会

对我们模型训练本身产生影响

我们前面也讲了一个简单提一下

这个异常检测相当于

相当于是卓尔不群 鹤立鸡群

当然可能是好的地方也可能是不好的地方

就比如分数特别高

或者分数特别低

都有可能

这个时候我们可以看出来

这些我们前面讲的一些概念一些方法

一些理念

其实可以和我们已有的一些

耳熟能详的一些成语结合起来

当然在我们这里是九牛一毛

举了其中一些小例子

但我们更希望就同学们在课下

多和已有的知识结合起来

当我们这个新学的知识和已有的知识

连成网之后

它自然就变成我们自己的一部分

简单温习完我们这个相应的一些内容之后

我们这个课程也就基本接近尾声了

我们就想利用一首诗 这首诗的名字叫观潮

来结束我们这个课程

这首诗作者是谁

苏轼

苏轼当然我们都知道他是一个大文豪

但他其实写了好多诗

都很有禅意

很有哲理

比如观潮这首诗

他怎么说的

庐山烟雨浙江潮

未到千般恨不消

及至归来无一处

庐山烟雨浙江潮

首尾两句都是一样的

首尾两句都是一样的

当然这首诗其实不同人有不同的理解

这边我可以谈谈我自己的理解

庐山烟雨浙江潮

庐山的烟雨 浙江的潮都是非常美的

我听别人说完之后 还是非常非常好

这个东西太好了

这跟我们所学机器学习也是一样

一听人工智能 一听机器学习

它能发现很多意想不到的规律

发现很多模式我都觉得非常好

未到千般恨不消

当我不了解的时候

我就念念不忘这个事情

我总想去

未到千般恨不消

及至归来无一处

我已经去过了

我已经学过了

然后怎么样

最后这一句

庐山烟雨浙江潮

当然这里面 最后这句话有不同的理解

有人说是去过之后发现不过如此

也有人说去过之后说原来如此

原来这么好

那我们怎么理解它

一旦学完了之后

一旦去过之后

一旦学完之后发现它是平凡的

但它又是美好的

就平凡又美好

这应该是我们对于

庐山烟雨浙江潮的一个态度

同时也是我们对于

我们模型算法的一个态度

所以我们想用这个平凡而又美好

来形容我们所学到的算法模型

包括我们在讲的R语言

包括我们这门课的主题数据分析

其实平凡而又美好

甚至可以说是一个对世界的一个态度

对我们那个算法模型 R语言也好

数据分析也好

也是一样

我不了解它时候觉得它很神秘

那个时候它不平凡

我一旦了解了之后

它是很平凡的

但是我能体会到里面

各种算法设计巧妙的地方

它又是是美好的

也希望大家在日后的学习和生活中

多使用这个R语言

从这个数据的角度来认识问题

分析问题

渐入佳境

当然咱们这课基本到此结束

但是相信我们这个课是一个结束

但是对绝大部分的小伙伴来讲

都应该只是一个起点而已

希望大家在入门之后 能登堂入室

本次课到此结束

谢谢大家

R语言数据分析课程列表:

上部:问道

-第1章 气象万千、数以等观

--第1章 气象万千、数以等观

--第1章 作业

-第2章 所谓学习、归类而已

--2.1 所谓学习、归类而已(I)

--2.2 所谓学习、归类而已(II)

--2.3 所谓学习、归类而已(III)

--2.4 所谓学习、归类而已(IV)

--第2章 作业

-第3章 格言联璧话学习

--第3章 格言联璧话学习

--第3章 作业

-第4章 源于数学、归于工程

--第4章 源于数学、归于工程

--第4章 作业

-讨论题

--如何发挥人工智能的头雁效应

中部:执具

-第5章 工欲善其事、必先利其器

--第5章 工欲善其事、必先利其器

--第5章 作业

-第6章 基础编程——用别人的包和函数讲述自己的故事

--6.1 编程环境

--6.2Mini案例

--6.3 站在巨人的肩膀上

--6.4 控制流

--6.5 函数(I)

--6.6 函数(II)

--第6章 作业

-第7章 数据对象——面向数据对象学习R语言

--7.1 向量与因子(I)

--7.2 向量与因子(II)

--7.3 矩阵与数组(I)

--7.4 矩阵与数组(II)

--7.5 列表与数据框(I)

--7.6 列表与数据框(II)

--第7章 作业

-第8章 人人都爱tidyverse

--第8章 人人都爱tidyverse

--第8章 作业

-第9章 最美不过数据框

--第9章 最美不过数据框

--第9章 作业

下部:博术

-第10章 观数以形

--10.1 一维数据空间(I)

--10.2 一维数据空间(II)

--10.3 二维数据空间

--10.4 高维数据空间

--第10章 作业

-第11章 相随相伴、谓之关联

--11.1 导引

--11.2 关联规则(I)

--11.3 关联规则(II)

--11.4 关联规则(III)

--第11章 作业

-第12章 既是世间法、自当有分别

--12.1 导引

--12.2 近邻法(I)

--12.3 近邻法(II)

--12.4 决策树(I)

--12.5 决策树(II)

--12.6 随机森林

--12.7 朴素贝叶斯

--12.8 逻辑斯蒂回归

--12.9 人工神经网络(I)

--12.10 人工神经网络(II)

--12.11 支持向量机

--第12章 作业

-第13章 方以类聚、物以群分

--13.1 导引

--13.2 划分方法

--13.3 层次方法

--第13章 作业

-第14章 庐山烟雨浙江潮

--第14章 庐山烟雨浙江潮

--第14章 作业

第14章 庐山烟雨浙江潮笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。