当前课程知识点:人工智能 >  第六章 不确定性推理 >  6.1不确定性量化 >  Video

返回《人工智能》慕课在线视频课程列表

Video在线视频

Video

下一节:Video

返回《人工智能》慕课在线视频列表

Video课程教案、知识点、字幕

这一章开始来讲一下不确定性推理

智能体要在一个部分可观察和不确定性的环境当
中进行理性决策

那么它首先要用概率来量化不确定性

我们看到这里At表示航班起飞前t分钟出发前往机

那At能否保证准时到达机场是不确定的

因为道路状况我们智能体不可能全面掌握

交通状态它也不可能全面知晓

而且动作的执行结果也是不确定的

如果发生爆胎怎么办

所以At能否准时到达机场是一个不确定的

我们用概率怎么样来量化这种不确定性呢

就是给它一个数字 就像A25一样

提前二十五分钟能否按时到达机场呢

我们可以说在目前所掌握的信息条件下

提前二十五分钟能让我到达的概率是0.04

所以它用这个0.04来量化A25的不确定性

那么智能体如何在这种不确定性的条件下做理性
的决策呢

假设智能体用概率量化好了不确定性的信息

在给定条件下提前25分钟准时到达的概率是0.04

提前90分钟准时到达的概率是0.7

提前120分钟准时到达的概率是0.95

提前1140分钟准时到达的概率是0.9999

那它如何应该做一个理性的决定呢

这依赖于我们的概率理论

通过概率理论呢 推理出实现各个目标的可能性

然后再依据效能理论 依据智能体的偏好

来选择一个动作进行执行

就像这里一样 可能提前九十分钟出发前往机场

是一个比较理性的决策 因为概率有0.7

等待时间可能也不会太长

概率论的基本元素是随机变量

也就是说这个变量的取值是不确定性的

我们后面例子中涉及到的随机变量类型有两种

一种是bool型随机变量 一种是离散型随机变量

像我的牙齿有没有虫洞 这么一个变量就是bool型
随机变量 要么是真 要么是假

那么weather就是一个离散型随机变量

它的取值只有这四种 天晴 下雨 多云 下雪

那么给随机变量赋一个值就可以形成一个原子命

比如说给weather赋一个值sunny就表示今天是晴

给Cavity赋一个值假就表示我的牙齿没有虫洞

那么这个可以简写成非Cavity

就表示我没有虫洞

首字母为大写的表示变量

首字母为小写的用来表示一种特定的取值

那么符合命题就可以由原子命题和逻辑连接词构

像这里就表示今天是晴天或者我的牙齿没有虫洞

那么原子事件是什么意思呢

就是在不确定的环境下对状态的一个完整描述

相当于一个原子事件对应着一个状态

像这里假设环境由两个bool型变量来描述

一个是Cavity 一个是Toothache

那么这个环境有多少种不同的状态呢

这个取值是两种 这个取值是两种

2乘2等于4 所以它就有4个不同的状态

那么每一种状态其实上就对应着一种原子事件

所以我们就说这个环境有四个不同的原子事件

比如说这里第一个原子事件就是表示我的牙齿没
有虫洞

并且我的牙不疼

那么先验概率是什么意思 先验概率的意思就是

在没有没有获得证据条件下的概率

就是没有条件的概率 根据经验得出的概率

像这里一个普通的人它的牙齿有虫洞的概率就是
0.1

一个随机变量对应的概率分布呢

就是给出所有可能的赋值对应的概率值

比如说天气的概率分布

就是要给出晴天的概率 雨天的概率

多云天的概率 下雪的概率

那么概率分布 所有这些概率值的和要加起来要等
于1的

那么联合概率分布就是多个变量概率分布

那么你就要给出任何一个由随机变量集构成的环
境中的原子事件的概率值

那么原子事件我们前面讲过就是给这个随机变量
集赋一种值得到的一个事件

所以你这个随机变量集有多少种不同的赋值可能

就要给出多少个不同的概率值来

那么比如说我们这里天气和牙齿有没有虫洞这两
个变量的联合概率分布 就是这么一个概率分布

那么我们天气有四种取值可能 牙疼有两张取值可

所以他们两个组合在一起就有八种不同的取值可

那么每一种取值可能就对应着一个原子事件

所以它有八个概率值

比如说这里0.144表示的就是晴天并且我的牙齿有
虫洞的概率是0.144

同样的道理这个联合概率分布表里面这些概率值
加起来的和要等于1

因为这两个变量的所有取值都在这里面

它只能取这里面的一种

所以这8个概率值加起来要等于1的

那么条件概率的意思就是有条件之后这个变量的
概率

就是它获得信息证据之后随机变量的概率是多少

所以也叫后验概率

像这里在病人告诉他牙疼之后

医生对他有没有虫洞给出来的概率就是0.8

那么条件概率里面我们会涉及到一些

与问题领域知识相关的东西

可以简化这个条件概率

像这里一样如果病人告诉你我牙疼

然后还告诉你今天是晴天

那么这个病人牙齿有没有虫洞的概率

其实上是和天气没有一点关系的

晴天这个证据对于牙齿有没有虫洞是没有影响的

所以它就等于你只告诉他你的牙齿痛 这个牙齿有
没有虫洞的概率

再看第二个 第二个就是说病人告诉你我牙疼

我的牙齿有一个虫洞

那么既然人家都已经告诉你了牙齿有虫洞

所以牙齿有虫洞的概率就等于1了

条件概率的分布就要给出不同条件下的不同分布

像这个它的条件是牙疼 所以你要给出疼和不疼下
的分布

那么疼下的分布是 有虫洞0.680 没虫洞0.320

牙不疼条件下的分布 有虫洞的概率是0.72

没虫洞的概率是0.28

所以这个分布这两项加起来等于1 这两项加起来也
等于1

因为这个是一个分布 这个是一个分布

接下来我们来看一下关于条件概率的三个非常有
用的公式

第一个公式就是条件概率的定义

也就是说a在b条件下的概率就等于ab同时发生的
概率除以b的概率

这个b的概率不能等于零

然后

然后第二个公式就是我们的乘法法则

ab同时发生的概率就等于a在b条件下的概率乘以b
的概率

也等于b在a条件下的概率乘以a的概率

然后由乘法法则进行推广可以得到链式法则

链式法则就是n个变量的联合概率

就等于这n个变量的条件概率的乘积

那么这个是怎么来的呢就是运用乘法法则n次

那么第一次的时候就是把前n-1个变量当成一个整

把Xn当成另一个变量运用一次乘法法则得到这个
式子

然后再运用一次的时候就把前n-2个变量当成一个
整体

然后Xn-1这个变量当成另外一个变量拆分一次

然后拆分n次就可以得到这个式子

这就是我们的链式法则

人工智能课程列表:

第一章 绪论

-1.1 人工智能概念

--1.1 人工智能概念

-第一章 绪论--1.1 人工智能概念

-1.2 什么是理性智能体

--1.2理性智能体

-第一章 绪论--1.2 什么是理性智能体

第二章 无信息搜索策略

-2.1.1问题求解智能体

--2.1.1问题求解智能体

-第二章 无信息搜索策略--2.1.1问题求解智能体

-2.1.2问题形式化

--Video

-2.1.3 树搜索算法

--Video

-第二章 无信息搜索策略--2.1.2问题形式化

-2.1.4树搜索算法的实现

--Video

-2.2.1搜索策略

--Video

-第二章 无信息搜索策略--2.1.3树搜索算法

-2.2.2宽度优先搜索

--Video

-2.2.3一致代价搜索

--Video

-第二章 无信息搜索策略--2.1.4树搜索算法的实现

-2.3.1深度优先搜索

--Video

-2.3.2有限深度搜索

--Video

-2.3.3迭代深入搜索

--Video

-第二章 无信息搜索策略--2.2.2宽度优先搜索

-2.3.4迭代深入深度搜索性能分析

--Video

-2.4无信息搜索策略小结

--Video

-第二章 无信息搜索策略--2.2.3一致代价搜索

-第二章 无信息搜索策略--2.3.1深度优先搜索

-第二章 无信息搜索策略--2.3.2有限深度搜索

-第二章 无信息搜索策略--2.3.3迭代深入搜索

-第二章 无信息搜索策略--2.3.4迭代深入深度搜索性能分析

-第二章 无信息搜索策略--2.4无信息搜索策略小结

第三章 有信息搜索策略

-3.1贪婪搜索算法

--Video

-3.2.1A星搜索算法

--Video

-第三章 有信息搜索策略--3.2.1A星搜索算法

-3.2.2A星搜索算法的最优性

--Video

-3.2.3可采纳的启发式函数

--Video

-第三章 有信息搜索策略--3.2.2A星搜索算法的最优性

-3.3爬山搜索算法

--Video

-3.4模拟退火搜索算法

--Video

-第三章 有信息搜索策略--3.2.3可采纳的启发式函数

-3.5遗传算法

--Video

-第三章 有信息搜索策略--3.3爬山搜索算法

-第三章 有信息搜索策略--3.5遗传算法

第四章 约束满足问题

-4.1.1什么是约束满足问题

--Video

-第四章 约束满足问题--4.1.1什么是约束满足问

-4.1.2约束满足问题的标准搜索形式化

--Video

-4.2.1回溯搜索算法

--Video

-第四章 约束满足问题--4.1.2约束满足问题的标准搜索形式化

-4.2.2回溯搜索的变量赋值顺序策略

--Video

-4.2.3回溯搜索的前向检查及约束传播

--Video

-第四章 约束满足问题--4.2.1回溯搜索算法

-4.2.4 AC-3弧相容算法

--Video

-4.3约束满足问题的局部搜索方法

--Video

-第四章 约束满足问题--4.2.2回溯搜索的变量赋值顺序策略

-第四章 约束满足问题--4.2.3回溯搜索的前向检

-第四章 约束满足问题--4.3约束满足问题的局部搜索方法

第五章 对抗搜索

-5.1博弈及极小极大值概念

--Video

-5.2极小极大值决策算法

--Video

-第五章 对抗搜索--5.2极小极大值决策算法

-5.3.1剪枝的概念

--Video

-5.3.2 alpha-beta算法

--Video

-5.3.3 alpha-beta剪枝示例

--Video

-5.4 不完美的实时决策

--Video

-第五章 对抗搜索--5.3.3 alpha-beta剪枝示例

-第五章 对抗搜索--5.4 不完美的实时决策

第六章 不确定性推理

-6.1不确定性量化

--Video

-第六章 不确定性推理--6.1不确定性量化

-6.2使用完全联合分布进行推理

--Video

-6.3贝叶斯规则及其应用

--Video

-6.4贝叶斯网络推理

--Video

-第六章 不确定性推理--6.2使用完全联合分布进行推理

-6.5隐马尔可夫模型

--Video

-6.6卡尔曼滤波器

--6.6

-第六章 不确定性推理--6.4贝叶斯网络推理

-第六章 不确定性推理--6.3贝叶斯规则及其应用

-第六章 不确定性推理--6.6卡尔曼滤波器

-结课测试

Video笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。