当前课程知识点:人工智能 > 第六章 不确定性推理 > 6.4贝叶斯网络推理 > Video
我们前面讲过用全联合分布进行枚举推理的时候
由于表条目非常的多
导致时间和空间复杂度都非常的高
那么条件独立性可以有效的减少分布的表条目
那么我们的贝叶斯网络呢 就是
一种用图形来表示条件独立知识的方法
它可以紧凑的描述全联合分布
那么在贝叶斯网络里面这个结点
表示的是随机变量
也就是说一个结点对应着一个随机变量
那么网络里面的有向弧表示的是
两个变量之间有直接的依赖关系
那么每一个结点 也就是说每一个随机变量
都关联着一个条件分布
比如说xi这个随机变量它对应的条件分布就是
在它直接依赖的父亲结点条件下它的概率分布
条件分布一般表示成一个条件概率表
也就是给出在父结点不同取值情况下
这个结点的概率分布
这里就是一个贝叶斯网络
这个贝叶斯网络总共有五个结点
也就是说明智能体所处的环境
由五个随机变量来描述
那么这里这五个随机变量都是bool型的
Burglary表示有没有发生入室盗窃
Earthquake表示有没有地震发生
Alarm表示警报有没有响
JohnCalls表示约翰有没有打电话来
MaryCalls表示玛丽有没有打电话来
那么Burglary没有直接依赖于其他变量
所以它没有父亲结点
那么和它关联的条件概率表就是一个先验概率
因为它是一个bool型变量 所以
它这个概率表只需要给出一个表目就行
这里表明Burglary为真
也就是发生入室盗窃的概率是0.001
那么为假的概率就是1-0.001
所以它只需要存储一个表条目就行
Earthquake也是一样
发生Earthquake的概率是0.002
不发生就是1-0.002
那么Alarm这个变量它有两个父亲结点
那么我们需要给出这两个父亲结点
在不同取值组合下的分布
这两个父亲结点都是bool型
所以它有四种不同的取值
就需要给出这四种情况下的分布
这里表明Burglary为true
Earthquake为true情况下Alarm的分布是
它为真的概率0.95 那么为假就是1-0.95
所以也没必要要存储两项 只要存储一项就行
这个表明Burglary为真Earthquake为假
Alarm为真0.94 为假就是1-0.94 其他类似
JohnCalls它有一个父亲结点
所以要它给出父亲结点在不同取值情况下的分布
为真的时候的分布就是
约翰会打电话来的概率是0.9
不打电话来就是1-0.9
警报没响的时候约翰打电话来的概率是0.05
不打电话来就是1-0.05 也就是0.95
MaryCalls它的父亲结点也是一个Alarm
所以要给出父亲结点在不同取值情况下它的分布
那么这个表明警报响的时候
玛丽打电话来的概率是0.7不打电话来就是0.3
警报不响的时候玛丽打电话来的概率是0.01
不打电话来的概率是0.99
所以贝叶斯网络是由结点 有向弧
以及和节点关联的条件概率表构成的
贝叶斯网络建立起来之后我们就可以进行推理了
我们来看到这个例子
我在上班邻居约翰打电话说我家的警报响了
但邻居玛丽并没有打电话来
有的时候警报是由小地震引起的
那到底要不要回家呢 是不是发生了入室盗窃呢
所以你需要做出一个决策
那如何根据建立起来的贝叶斯网络进行推理呢
看到这个贝叶斯网络 它涉及的变量就是这四个
入室盗窃 小地震 警报 约翰打电话 玛丽打电话
它反映的因果知识就是小偷会引起警报
小地震会引起警报
警报会引起玛丽打电话 警报也会引起约翰打电话
那么如何根据贝叶斯网络进行推理呢
我们也是利用前面讲过的枚举推理方法
就是根据全联合分布去查找对应着某一个命题的
原子事件 将原子事件对应的概率值进行汇总
计算出来某个事件发生的概率
只不过是有了贝叶斯网络之后呢我们的全联合分
布呢
就定义成局部条件分布的乘积
因为贝叶斯网络体现了变量之间的依赖关系
所以 n个随机变量的全联合分布呢
它就等于这n个变量的条件分布的乘积
只需要根据每一个变量关联的条件分布表
就可以得到全联合分布
然后根据全联合分布进行枚举推理
就像这里一样 比如说你要计算
约翰玛丽都打电话来了 警报也响了
但是没有发生入室盗窃 也没有发生小地震
这么一个原子事件的概率
就可以通过这个一个公式计算出来
它就等于各个变量的条件概率的乘积
那么我们第一个变量 约翰打电话来只依赖于警报
然后玛丽他只依赖于警报
我们的警报它依赖于入室盗窃和地震
然后入室盗窃和地震它是不依赖于其他变量了
这些都可以从贝叶斯网络里面查询得到
所以这个值是可以算的出来的
那么我们例子里面用大写字母来表示变量
用小写字母来表示它的特定取值
像j m a就表示
约翰打电话玛丽打电话以及警报为真的取值情况
那么非b就表示入室盗窃为假的情况
非e就表示地震为假的情况
再回到刚才的例子 这个问题里面涉及到的证据是
玛丽没有打电话 但是约翰打了电话
那就要去判断是不是真的有入室盗窃发生
然后你再做出决策是不是要回家
那我们前面讲过利用全联合分布进行
枚举推理的公式就是这么一个公式
在证据变量情况下要计算查询变量的条件分布
那他就等于一个归一化因子乘以查询分布和证据
的联合概率
这个是根据我们的贝叶斯法则得到的
然后呢它又等于把隐藏变量的所有可能情况
考虑进来的概率和 乘以一个归一化因子
所以我们套用这个公式就可以得到这么一个式子
那么这里我们的查询变量就是Burglary
就是是否有入室盗窃发生
证据就是玛丽没有打电话来 约翰打电话来了
隐藏变量就是警报以及地震
所以要把警报和地震这两个隐藏变量的所有取值
可能考虑进来
那么这两个隐藏变量都是bool型的
所以他们有四种取值组合
所以这个式子呢就等于四个式子相加
再乘一个归一化因子
那么这四个不同的情况就是
第一种就是B因为要求它的分布
证据是玛丽没打电话约翰打电话来了
隐藏变量的第一种取值就是警报没响 没有地震
隐藏变量的第二种取值就是警报没响有地震
隐藏变量的第三种情况就是警报响了 没有地震
第四种情况就是警报响了也有地震
那么把这四项分别计算出来 进行汇总
我们来举例说明一下其中的第一项
如何根据我们的贝叶斯网络计算得到
我们的贝叶斯网络在这里 第一项在这里
那么刚才讲了贝叶斯网络的全联合分布
是等于各个变量的条件概率的乘积
根据贝叶斯网络这个pB就等于
也就是说Burglary这个变量的分布就等于0.001
0.999
也就是说它为真的时候是0.001 为假的时候是
0.999
也就是说如果是用大写字母的表示是变量那么要
求的是它的分布
如果用小写字母表示的是它的取值 这种取值情况
下的概率
那么第二项我们去这个表里面查
在警报为真的情况下 就是这一种情况下
玛丽不打电话来的概率 这里给的是打电话来的概
率
所以不打电话来的概率是0.3 所以写到这里
然后再看第三项 也同样是在警报为真的情况下
所以对应的是这种分布
约翰打电话来的概率 为true的概率是0.9
所以是0.9 再看这一项 e的概率
e为真的概率这里给出来的是0.002 所以你就乘到
这里
再看这一项 它有两个条件 一个是B
B是以变量形式给出的
所以它对应这两种不同的情况 真 假
那么这个e表示Earthquake为真
所以它对应着这两行
那么在这两种情况下a为真的概率
那么第一种情况下就是0.95 就写到这里
对应的是B为真的情况下
然后呢 第二种情况就是对应着B为假的情况下
它是0.29 所以就写到这里
那么把这个乘积乘起来 当然这里矢量的乘法也是
点乘
那么乘出来我们就得到这么一个式子
这个式子就是什么情况呢
就是我们这个B为真的时候 这个原子事件的概率
在这里
B为假的时候原子事件的概率在这里
所以它对应着两个原子事件
所以呢我们的第一项就这么的求出来
其他的项类似的求出来 求出来之后呢
把它加起来 然后再进行归一化
就可以求出在玛丽没有打电话情况下
约翰打电话情况下
到底发生入室盗窃的概率是多少
然后再做出一个理性的决策
这个就是贝叶斯网络推理
-1.1 人工智能概念
-第一章 绪论--1.1 人工智能概念
-1.2 什么是理性智能体
--1.2理性智能体
-第一章 绪论--1.2 什么是理性智能体
-2.1.1问题求解智能体
-第二章 无信息搜索策略--2.1.1问题求解智能体
-2.1.2问题形式化
--Video
-2.1.3 树搜索算法
--Video
-第二章 无信息搜索策略--2.1.2问题形式化
-2.1.4树搜索算法的实现
--Video
-2.2.1搜索策略
--Video
-第二章 无信息搜索策略--2.1.3树搜索算法
-2.2.2宽度优先搜索
--Video
-2.2.3一致代价搜索
--Video
-第二章 无信息搜索策略--2.1.4树搜索算法的实现
-2.3.1深度优先搜索
--Video
-2.3.2有限深度搜索
--Video
-2.3.3迭代深入搜索
--Video
-第二章 无信息搜索策略--2.2.2宽度优先搜索
-2.3.4迭代深入深度搜索性能分析
--Video
-2.4无信息搜索策略小结
--Video
-第二章 无信息搜索策略--2.2.3一致代价搜索
-第二章 无信息搜索策略--2.3.1深度优先搜索
-第二章 无信息搜索策略--2.3.2有限深度搜索
-第二章 无信息搜索策略--2.3.3迭代深入搜索
-第二章 无信息搜索策略--2.3.4迭代深入深度搜索性能分析
-第二章 无信息搜索策略--2.4无信息搜索策略小结
-3.1贪婪搜索算法
--Video
-3.2.1A星搜索算法
--Video
-第三章 有信息搜索策略--3.2.1A星搜索算法
-3.2.2A星搜索算法的最优性
--Video
-3.2.3可采纳的启发式函数
--Video
-第三章 有信息搜索策略--3.2.2A星搜索算法的最优性
-3.3爬山搜索算法
--Video
-3.4模拟退火搜索算法
--Video
-第三章 有信息搜索策略--3.2.3可采纳的启发式函数
-3.5遗传算法
--Video
-第三章 有信息搜索策略--3.3爬山搜索算法
-第三章 有信息搜索策略--3.5遗传算法
-4.1.1什么是约束满足问题
--Video
-第四章 约束满足问题--4.1.1什么是约束满足问
-4.1.2约束满足问题的标准搜索形式化
--Video
-4.2.1回溯搜索算法
--Video
-第四章 约束满足问题--4.1.2约束满足问题的标准搜索形式化
-4.2.2回溯搜索的变量赋值顺序策略
--Video
-4.2.3回溯搜索的前向检查及约束传播
--Video
-第四章 约束满足问题--4.2.1回溯搜索算法
-4.2.4 AC-3弧相容算法
--Video
-4.3约束满足问题的局部搜索方法
--Video
-第四章 约束满足问题--4.2.2回溯搜索的变量赋值顺序策略
-第四章 约束满足问题--4.2.3回溯搜索的前向检
-第四章 约束满足问题--4.3约束满足问题的局部搜索方法
-5.1博弈及极小极大值概念
--Video
-5.2极小极大值决策算法
--Video
-第五章 对抗搜索--5.2极小极大值决策算法
-5.3.1剪枝的概念
--Video
-5.3.2 alpha-beta算法
--Video
-5.3.3 alpha-beta剪枝示例
--Video
-5.4 不完美的实时决策
--Video
-第五章 对抗搜索--5.3.3 alpha-beta剪枝示例
-第五章 对抗搜索--5.4 不完美的实时决策
-6.1不确定性量化
--Video
-第六章 不确定性推理--6.1不确定性量化
-6.2使用完全联合分布进行推理
--Video
-6.3贝叶斯规则及其应用
--Video
-6.4贝叶斯网络推理
--Video
-第六章 不确定性推理--6.2使用完全联合分布进行推理
-6.5隐马尔可夫模型
--Video
-6.6卡尔曼滤波器
--6.6
-第六章 不确定性推理--6.4贝叶斯网络推理
-第六章 不确定性推理--6.3贝叶斯规则及其应用
-第六章 不确定性推理--6.6卡尔曼滤波器
-结课测试