当前课程知识点:人工智能 > 第六章 不确定性推理 > 6.2使用完全联合分布进行推理 > Video
在智能体学习得到他所处环境的联合概率分布表
之后
它就可以利用这个分布表进行不确定性推理
就像这里一样智能体所处环境由三个随机变量来
描述
一个是牙齿疼不疼 另外一个是牙龈有没有感染
还有一个就是牙齿有没有虫洞
这三个随机变量都是bool型的
所以它对应着有八个不同的状态
也就是八个不同的原子事件
那么我们的联合概率分布表就会给出所有这八个
原子事件的概率值
然后在这个基础之上就可以进行不确定性的推理
那么一种推理方法就是枚举推理方法
也就是说任意命题φ为真的概率就是
所有当它为真时包含的原子事件概率和
要求φ为真的概率只要把概率分布表里面它所对应
的原子事件的概率值累加起来就行
就像这里一样 要求牙疼的概率
就把牙疼对应着的原子事件找出来
那么牙疼对应着的原子事件就这四个
把这四个原子事件的概率值累加起来等于0.2
那么比如说像这个原子事件是什么原子事件呢
是牙疼 牙龈感染了 并且牙齿有虫洞的概率是
0.108
那么这个原子事件当然就是牙疼包含的原子事件
那么再看这个牙齿有虫洞或者牙疼的概率
那么这个命题对应的原子事件有哪些呢 就是有这
六个
牙齿有虫洞对应着这四个原子事件
那么这个牙疼对应着这四个原子事件
所以呢其实上牙齿有虫洞或者牙疼
联合起来就对应着这六个原子事件
联合起来就对应着这六个原子事件
那么把这六个原子事件的概率值累加起来就等于
0.28
所以我们就推出牙齿有虫洞或者牙疼的概率是
0.28
同样的根据给定联合概率分布表通过枚举推理
可以计算条件概率
像这里一样 计算牙疼情况下牙齿没有虫洞的概率
那么根据乘法法则它就等于
牙齿没有虫洞并且牙疼的概率除以牙疼的概率
首先看到牙疼对应的原子事件是这四个
牙齿没有虫洞对应的原子事件是这四个
所以它们的交集对应的原子事件就是这两个
绿色框框住的这两个 加起来就在这里
然后再看分母牙疼对应的原子事件是这四个
所以把这四项加起来最后算出来等于0.4
所以牙疼这个证据情况下牙齿没有虫洞的概率是
0.4
那么牙疼这个证据情况下牙齿有虫洞的概率是多
少呢
那是1-0.4=0.6
如果要用公式来计算我们也可以知道
这个分母是一样的 只是这个分子这个非
变成了牙齿有虫洞
所以呢我们可以把分母看成一个归一化常数α
不用计算的
所以要算一个随机变量的条件概率分布的时候
我们的分母是不用计算的
因为我们的分母都是一样的
这个变量取不同值的时候
它的概率计算的时候分母是一样的
所以分母不用计算并且这个概率分布最后它两项
的和等于1
所以呢你只需要最后进行一个归一化
所以把这个α看成一个归一化常数就行
那么像这里一样我们要计算牙疼情况下
牙齿有没有虫洞的一个条件概率分布
那么它就等于一个归一化常数α 就是我们的分母
乘以分子 分子就是两个同时发生的概率
那么这两个同时发生的概率对应不到具体的原子
事件
那么如果你要对应到具体的原子事件
还要考虑一个变量就是这个catch
因为我们联合概率分布表里面的每个原子事件
都要给三个变量赋值
所以呢需要把你隐藏的那个变量catch
给它枚举出来
就是说既然你要算的是牙齿有没有虫洞
以及牙疼情况下的概率
那么它包含的原子事件应该是牙齿有没有虫洞
牙疼以及牙龈感染或者牙龈没有感染情况下的概
率
所以我要把隐藏的牙龈有没有感染这个变量
它的不同取值对应的原子事件概率累加起来
所以它就等于这两项相加
那么首先看到第一项牙疼又牙龈感染了就对应着
这一列
也就是说在牙疼牙龈感染下牙齿有没有虫洞它的
的概率是
0.108 0.016给它罗列在这里
然后另外一项就是牙疼 牙疼在这里
牙龈没有感染在这里 所以它对应着这一列
也就是说在牙疼牙龈没有感染情况下
我们的牙齿有没有虫洞的概率分布是0.012和
0.064
然后把这两种可能都加起来就等于0.12和0.08
再对它进行归一化
因为我们知道我们的条件概率分布它的和要等于1
所以呢这个归一化就是每一项除以所有项的和
像这里一样0.12除以0.12加上0.08就等于0.6
然后0.08除以0.12加上0.08就等于0.4
就可以得到这个条件概率分布
那么由这个例子我们就可以总结如下
假设x是用来描述问题的随机变量集
通常情况下我们感兴趣的就是
在给定证据变量E的特定值情况下
查询变量Y的后验联合分布
就像刚才一样我们的描述问题的随机变量集是
牙疼 牙龈有没有感染 牙齿有没有虫洞
也就是说X这三个随机变量
然后证据变量就是牙疼 也就是说就是这个条件
查询变量Y的后验联合分布
我们要拟推理计算的就是这个牙齿有没有虫洞
这个就是我们的查询变量Y
那么隐藏变量就是既不是查询变量又不是证据变
量
就像刚才一样 我们的牙龈有没有感染
这个catch就是一个隐藏变量
那么在告知你 证据变量告知你查询变量之后
我们如何来求这个后验分布呢
它就等于一个归一化因子乘以这个查询变量
和证据情况下的联合分布
然后它也等于什么呢 那些原子事件的和呢
就是把所有的隐藏变量的所有取值可能
对应的这些概率累加起来
就像刚才一样 把牙龈感染和不感染
两种情况下的概率累加起来 最后进行归一化
就可以得到我们的查询变量的后验联合分布
那么这种利用联合概率分布表进行枚举推理会存
在什么问题呢
首先第一个它的时间复杂度和空间复杂度都很高
它的时间复杂度呢是d的n次方
这里的n就是用来描述问题的随机变量总共有n个
这里的d就是我们这n个随机变量的最大取值范围
原子事件的数量级就是d的n次方
所以呢我们的空间复杂度也是d的n次方
来存储这个联合分布
所以它的时间复杂度和空间复杂度都很高
那么还有一个问题就是
你要从这么庞大的一个联合概率分布表里面
找到你所需要的原始事件
如何找得到 如何来找也是一个很大的问题
那么后面我们都会讲到如何来简化这个联合概率
分布表
-1.1 人工智能概念
-第一章 绪论--1.1 人工智能概念
-1.2 什么是理性智能体
--1.2理性智能体
-第一章 绪论--1.2 什么是理性智能体
-2.1.1问题求解智能体
-第二章 无信息搜索策略--2.1.1问题求解智能体
-2.1.2问题形式化
--Video
-2.1.3 树搜索算法
--Video
-第二章 无信息搜索策略--2.1.2问题形式化
-2.1.4树搜索算法的实现
--Video
-2.2.1搜索策略
--Video
-第二章 无信息搜索策略--2.1.3树搜索算法
-2.2.2宽度优先搜索
--Video
-2.2.3一致代价搜索
--Video
-第二章 无信息搜索策略--2.1.4树搜索算法的实现
-2.3.1深度优先搜索
--Video
-2.3.2有限深度搜索
--Video
-2.3.3迭代深入搜索
--Video
-第二章 无信息搜索策略--2.2.2宽度优先搜索
-2.3.4迭代深入深度搜索性能分析
--Video
-2.4无信息搜索策略小结
--Video
-第二章 无信息搜索策略--2.2.3一致代价搜索
-第二章 无信息搜索策略--2.3.1深度优先搜索
-第二章 无信息搜索策略--2.3.2有限深度搜索
-第二章 无信息搜索策略--2.3.3迭代深入搜索
-第二章 无信息搜索策略--2.3.4迭代深入深度搜索性能分析
-第二章 无信息搜索策略--2.4无信息搜索策略小结
-3.1贪婪搜索算法
--Video
-3.2.1A星搜索算法
--Video
-第三章 有信息搜索策略--3.2.1A星搜索算法
-3.2.2A星搜索算法的最优性
--Video
-3.2.3可采纳的启发式函数
--Video
-第三章 有信息搜索策略--3.2.2A星搜索算法的最优性
-3.3爬山搜索算法
--Video
-3.4模拟退火搜索算法
--Video
-第三章 有信息搜索策略--3.2.3可采纳的启发式函数
-3.5遗传算法
--Video
-第三章 有信息搜索策略--3.3爬山搜索算法
-第三章 有信息搜索策略--3.5遗传算法
-4.1.1什么是约束满足问题
--Video
-第四章 约束满足问题--4.1.1什么是约束满足问
-4.1.2约束满足问题的标准搜索形式化
--Video
-4.2.1回溯搜索算法
--Video
-第四章 约束满足问题--4.1.2约束满足问题的标准搜索形式化
-4.2.2回溯搜索的变量赋值顺序策略
--Video
-4.2.3回溯搜索的前向检查及约束传播
--Video
-第四章 约束满足问题--4.2.1回溯搜索算法
-4.2.4 AC-3弧相容算法
--Video
-4.3约束满足问题的局部搜索方法
--Video
-第四章 约束满足问题--4.2.2回溯搜索的变量赋值顺序策略
-第四章 约束满足问题--4.2.3回溯搜索的前向检
-第四章 约束满足问题--4.3约束满足问题的局部搜索方法
-5.1博弈及极小极大值概念
--Video
-5.2极小极大值决策算法
--Video
-第五章 对抗搜索--5.2极小极大值决策算法
-5.3.1剪枝的概念
--Video
-5.3.2 alpha-beta算法
--Video
-5.3.3 alpha-beta剪枝示例
--Video
-5.4 不完美的实时决策
--Video
-第五章 对抗搜索--5.3.3 alpha-beta剪枝示例
-第五章 对抗搜索--5.4 不完美的实时决策
-6.1不确定性量化
--Video
-第六章 不确定性推理--6.1不确定性量化
-6.2使用完全联合分布进行推理
--Video
-6.3贝叶斯规则及其应用
--Video
-6.4贝叶斯网络推理
--Video
-第六章 不确定性推理--6.2使用完全联合分布进行推理
-6.5隐马尔可夫模型
--Video
-6.6卡尔曼滤波器
--6.6
-第六章 不确定性推理--6.4贝叶斯网络推理
-第六章 不确定性推理--6.3贝叶斯规则及其应用
-第六章 不确定性推理--6.6卡尔曼滤波器
-结课测试