当前课程知识点:R语言数据分析 > 上部:问道 > 第2章 所谓学习、归类而已 > 2.4 所谓学习、归类而已(IV)
大家好
欢迎来到《R语言数据分析》课程
今天和大家交流
《所谓学习 归类而已》的最后一部分内容
在讲解具体内容之前
我们先看两个选择题
我们前面讲到机器所学习到的
其实最终都是表现为
规律 知识 模式或者说模型
那好 我们考虑一下
我们所学习到的这些
模式也好 知识也好 模型也好
可以用哪些形容词来形容它呢
下面有这么几个选项
比如说正确的 有趣的 有用的
令人新奇的
说我这个模型是正确的
我这个模型是有趣的
是有用的
还是令人新奇的
或者是其它一些
大家看一看是选哪一个
这是第一道题
第二道题呢
就逻辑推理方式而言
机器学习也好 数据挖掘也好
它是属于哪一种
我们这边有几个选项
归纳 演绎
或者说这两个都是
或者说都不是
大家考虑一下
这两个选择题里面
答案分别是什么
第一个是多选题
第二个单选题
其实我们要是第二个题的答案知道之后
第一个答案自然也就出来了
所以我们先从第二道题开始讲起
就所谓的推理方式
机器学习 数据挖掘
它究竟属于哪一种推理方式
我们都知道
就科学推理的方式而言
它主要有两种
一个是归纳 一个是演绎
所谓归纳 就是从特殊到一般
而演绎正好是相反 从一般到特殊
这么两个逻辑过程
我们举个例子
比如说我每次走过隔壁老王家的小卖部
它们家的狗都要对我大声的叫
但是不咬我
一次又一次 都有一个特殊的事例
一次一次都对着我叫
但是它不咬我
好 那我就归纳出了一个一般的结论了
下次我再走过去的时候
它肯定也就对我叫而已
但是不会咬我
就是这个狗会对我叫但是不咬
这是一个一般的结论
就是从特殊的事例推出了一个一般的结论
这就所谓的归纳
演绎就是从一般到特殊
从普遍性的结论
或者说一般性的事理
推导出个别的结论
我们还是以这个事情为例
这个演绎有很多方式
但是最典型的就是亚里士多德的三段论
它分为大前提 小前提 结论
大前提是什么
针对我们这个事情来讲
就是叫声大的狗都不咬人
我假定这个大前提是成立
那好 隔壁老王家的狗它叫声很大
隔壁老王家的狗叫声很大
有了这个大前提之后
那毫无疑问
隔壁老王家的狗它是不会咬人的
假如大前提成立的话
那我自然就可以得到后面这个结论了
这就是所谓演绎的方式
我们要是从集合的角度来讲的话
所谓的归纳是什么
就是从集合里面一个又一个的子集
然后推导出这个全集合
这个全局的一个结论
然后所谓这个演绎
是我先有了关于这个集合总体的一个结论
然后我再把它应用到
这个集合的某一部分里面去
这其实是两种方式
那好 归纳和演绎是科学推理的两种方式
那我们对机器学习而言
或者数据挖掘而言
它是哪一种
我们看看专著里面
一些文献里面一些教材里面
是怎么说的
阿培丁
他在《机器学习导论》
这本书里面怎么说的
几乎所有的科学领域都在用模型拟合数据
科学家们设计实验进行观测并收集数据
然后呢 通过找寻能解释所观测数据的简单模型
尝试抽取知识
该过程称为归纳
称为归纳
是一组从特别的示例中提取通用规则的过程
从一组特别的示例提取通用的规则
那毫无疑问是从特殊到通用 到一般的过程
所以它就是归纳
同样 周志华老师
他在《机器学习》这本专著里面也说到
归纳和演绎是科学推理的两大基本手段
机器学习从样例中学习
显然 毫无疑问是一个归纳的过程
那从这两个专著里面我们可以看得出来
就机器学习 数据挖掘而言
它的推理方式应该是以归纳为主
那好 归纳道理何在呢
我们《道德经》里面有一句话叫什么
万物并作 吾以观复
纪晓岚《阅微草堂笔记》里面也说到
无往不复 天之道也
也就是什么意思
过去发生的很多很多的事情
所呈现的很多很多的模式
它有一个延续性
在未来也会发生
也就是说由于在历史上一次又一次出现
我们观测到这个模式了
那我们有理由相信
它在未来也会延续
为什么
因为万物并作 吾以观复
无往而不复
所以它总是有一个延续性
假如我们要认识这个世界的话
或者说我们这个世界是可以认识的话
那毫无疑问它必须有这个重复的过程
也正是因为有这么一个所谓的反反复复的过程
我们才有认识这个世界的可能
才有说通过这个机器学习 数据挖掘
来挖出这个模式
并且应用于未来的可能
但是我们虽然说这个归纳法
这种根据历史上的模式
外推的未来是有道理的
但需要指明的是什么
归纳法它一般来讲
是不会穷举所考察对象的全体的
也没有办法穷举
我们对任何一个系统进行观测的时候
我只能观测到已有的发生的事情
对未来事情我观测不到
所以我这个归纳法没有办法穷举
假如能穷举的话
那我机器学习也没有意义
那正是因为它没有办法穷举所有的对象
所以它是属于似真推理
或然性的推理
也就是说 归纳所得出的结论
它不能说是正确的
因为它是似真推理是或然性的推理
假如要确保归纳所得出知识
或者说结论是正确的话
那有一个前提是自然是齐一的
也就说过去和未来是完全一样的
或者说在一个领域和另外一个领域的模式
也是完全一样的
这个时候才有可能由过去推广到未来
外推到未来
或者说由一个领域的知识
推广到另外一个领域去
但毫无疑问
自然是齐一的这是没办法保证
所以我们说这个归纳法所得出的结论
没有办法说它是正确的
只能说它是一个似真推理
是一个或然性的推理
即便我们一次又一次证实了它
但是没有办法证明它
为了说明这一点
我们看两个小的例子
看两个故事
第一个故事是什么
你看这边 黑天鹅
我们在好多股市(的报道)里面
在好多其它一些领域
都有一个所谓的黑天鹅事件
所谓黑天鹅事件什么意思
欧洲人观察了成百上千年
发现天鹅都是白的
因此它们得到一个结论
天鹅就是白的
因为它一次又一次观测
我发现了这么一个结论了
得到这么一个结论了
但是它一旦发现了澳洲
一上岸之后发现天鹅居然是黑的
它观察了成百上千年的结论被推翻掉
这所谓的黑天鹅事件
所以说它归纳出来的结论
在一个新的情境里面
或者说想外推的时候
其实它并没有办法保证它是正确的
咱们再看另外一个例子
这不是黑天鹅了
是老母鸡 一只老母鸡的故事
有一只老母鸡被养了将近三年
它归纳总结了一千天的经验模式
这相当于得到一千天的训练的数据
一千条数据记录
这个模式是什么
主人对我真好
每次伸手过来的时候都是喂我吃好吃的
但是 大年三十那天
主人伸手过来的时候 没有给它喂好吃的
而是一把抓住它的脖子
然后把它炖成了母鸡汤
所以我们看得出来
它虽然归纳出这一千条
或者甚至更长时间的一个数据记录
基于更长时间的数据记录
来进行观测
所得到的结论也好 模式也好
其实没有办法证明它是正确的
即便在这个大年三十之前
一次又一次被验证了
但是没有办法证明它是正确的
为什么
后面这个老母鸡的惨案就证明了这一点
同样对于机器学习而言
也有这个问题
我们也是通过归纳法得到相应的模式
相应的模型
提取了相应的规律
或者发现了相应的知识
但是因为它是归纳法得到的
所以它也像这个老母鸡惨案一样
有可能在未来它不一定是正确的
这个时候其实我们就可以重新再审视一下
审视一下我们前面这两个题目
第二个题目
这个答案基本已经出来了
应该说除了A之外
都是错的
它是一个归纳法
就是学习的过程
这个模型的学习的过程应该属于归纳
那第一个问题
应该说除了A之外都是正确的
就是除了A之外都是对的
第二个题目除了A之外都是错的
就是可以用来形容这个
机器学习所学到的模型 规律 知识 模式
你可以说我这个知识
这个模型这个模式是有趣的 有用的
令人新奇的
或者其它的
比如说先前未知的 等等
但是恰恰你不能说它是正确的
不要说我机器学习 数据挖掘
挖到的模型是正确的
因为它是归纳法得到的
所以它没有办法证明它是正确的
咱们看一看
相应的一些文献
一些专著里面是怎么来形容
我们所谓的规律 知识 模式 模型的
韩家炜老师这部里程碑式的著作
《数据挖掘: 概念与技术》
它这本书怎么说的
数据挖掘是从大量的数据中
挖掘出有趣的模式和知识的过程
是有趣的
它绝对没有说正确的
这个时候大家可能就会想
这个话好像说得不怎么严肃
有趣的 很随意是不是
这里面的有趣其实有很深的内涵
它跟我们说感兴趣的还有些区别
同学们可以看一看
可以看这本书
究竟韩老师怎么定义它这个所谓的有趣
另外一本 《数据挖掘导论(完整版)》
这本书怎么说的
这本教材是说
数据挖掘是大型的数据存储库中
自动地发现有用信息的过程
数据挖掘技术用来做什么
探查大型数据库
发现先前未知的 有用的模式
先前未知的有用的模式
我们再看下面这个文献
这个文献里面
这个形容词就多一点了
叫识别出巨量数据中
有效的 新颖的
潜在有用的
最终可理解的一个模式
当然可能有些模式
比如说我们经常说的
啤酒和尿不湿的故事
在买尿不湿的同时也顺便买啤酒
类似这种
其实我们先前可能确实不知道
或者说假如没有别人告诉我们这个关联关系的话
我们觉得是一个很吃惊的事情
仿佛这个大人喝啤酒喝太多
还需要用尿不湿
类似这样的故事的话
类似这样的规则这种模式
我们先前可能不一定知道它
但恰恰是先前未知的模式
它才体现了这个数据挖掘的价值所在
而且我们最终也可以从业务的角度来理解它
为什么有这么一些令人惊奇的模式的存在
这是我们相应的一些专著一些文献里面
对于我们所谓的模式 模型
它是怎么形容它的
可以看得出来
除了“正确”之外 可以有很多选项
有趣的 先前未知的
有效的 新颖的 等等
那咱们这门课怎么来形容它
大概这样总结了一下
机器学习或者说数据挖掘
是从大量的数据中归纳出
因为它推理方式就是归纳
归纳出先前未知的
有用或有趣关系结构的过程
当然这个先前未知
这不是一个必选的
我们希望我们拿到的知识
我们所挖出来知识是先前未知的
否则的话你只是通过数据验证而已
可能别人早就知道这个知识
早就知道这个模式了
那都属于事后诸葛亮
我们更希望
发现一些先前未知的模式
这个模式要么是有用的
要么是有趣的
就像我们做人一样
既要做个有用的人
也要做个有趣的人
有用或者有趣的关系结构的过程
当然我们稍微补充一下
这个归纳这一块
假如我一旦归纳出一个模式之后
比如说我从训练集里面
归纳出了这个相应的模型
相应的模式已经识别出来了
当应用于预测的时候
其实可以将它视为
也可以视为一个演绎的过程
这其实就是所谓机器学习
从这个逻辑推理的方式来讲
它主要是归纳的过程
就是模型的学习过程是归纳过程
它也就决定了
相应的所挖出来的这个关系结构
或者说模式 模型 知识 规律
它只能是有用有趣的或者其它的一些属性
但是恰恰不能说是正确的
当然我们在很多专著教材里面
对于这个所谓的逻辑推理方式也好
包括这个如何来形容这个关系结构模式
可能相对阐述得比较少
但我们这个课里边还专门把它
专门拎出一节来讲
相信对这个推理方式的了解
了解更多一点
以及如何形容这个模式 模型
我们有更深的理解之后
对于机器学习 数据挖掘
应该有更深的认识
本次课到此结束
谢谢大家
-第1章 气象万千、数以等观
--第1章 作业
-第2章 所谓学习、归类而已
--第2章 作业
-第3章 格言联璧话学习
--第3章 作业
-第4章 源于数学、归于工程
--第4章 作业
-讨论题
-第5章 工欲善其事、必先利其器
--第5章 作业
-第6章 基础编程——用别人的包和函数讲述自己的故事
--6.1 编程环境
--6.4 控制流
--第6章 作业
-第7章 数据对象——面向数据对象学习R语言
--第7章 作业
-第8章 人人都爱tidyverse
--第8章 作业
-第9章 最美不过数据框
--第9章 作业
-第10章 观数以形
--第10章 作业
-第11章 相随相伴、谓之关联
--11.1 导引
--第11章 作业
-第12章 既是世间法、自当有分别
--12.1 导引
--第12章 作业
-第13章 方以类聚、物以群分
--13.1 导引
--第13章 作业
-第14章 庐山烟雨浙江潮
--第14章 作业