当前课程知识点:人工智能 > 第六章 不确定性推理 > 6.6卡尔曼滤波器 > 6.6
如果变量是离散的时候我们知道可以用隐马尔科
夫模型来描述
但是如果你碰到的问题这个状态变量
这个证据变量都是连续型的时候怎么办呢
比如说跟踪一只飞行的小鸟的时候
它的状态用这六个变量来描述
就是x y z的坐标 以及x y z方向的速度
那么它都是连续变量 那么这个时候我们可以用
卡尔曼滤波来处理这个连续变量
我们用高斯分布来模拟它的先验概率密度
用线性高斯分布来模拟它的转换模型和传感器模
型
卡尔曼滤波假设状态的先验分布是高斯分布
转换模型和传感模型都是高斯分布
那么就可以得出任何时候的状态分布都是一个高
斯分布
那么来看一下为什么会是这样的
首先看到预测步骤 所谓的预测步骤就是
根据1~t时刻的证据去预测t+1时刻的状态分布
那么如果t时刻的状态分布是高斯分布
那么我们的预测结果也一样是一个高斯分布
为什么呢 因为这个式子就等于这个式子
这个式子怎么来的 就是和前面一样的
只不过是把我们的∑变成了一个积分号
也就是说把t时刻的所有状态可能乘以这个转换模
型
那么这两个分布都是高斯分布 再进行积分结果还
是一个高斯分布
所以我们的这个式子运算结果是一个高斯分布
那么有这个结果之后我们就可以的得出
更新状态估计也是一个高斯分布
所谓的更新运算结果也就是新来的一个证据
t+1时刻的证据我们来估计t+1时刻的状态
就相当于对状态进行了更新 就这个意思
那么这个式子可以把这个证据进行拆分
拆分成t+1时刻的证据和1~t时刻的证据
再利用一个贝叶斯公式它就等于这个式子
那么这个式子的话 这个传感模型是一个高斯分布
这个我们又已经知道了是一个高斯分布
所以这个运算结果也是一个高斯分布
所以我们知道如果t时刻的状态分布是一个高斯分
布
那么t+1时刻的状态分布也是一个高斯分布
那么又假设了初始时刻的先验分布是一个高斯分
布
所以我们可以得出任何时候的状态分布都是高斯
分布
t时刻的状态分布我们用均值为μt
协方差为∑t的一个高斯分布来表示
那我们来看一个简单的一维实例
那我们来看一个简单的一维实例
也就是我们的状态变量是一个一维连续变量
所以它的先验分布是一个一维高斯分布
它的均值是μ0 方差是∑0平方
然后它的转移模型也是一个线性高斯分布
它的均值是Xt方差是∑x平方
然后它的观察模型也是一个高斯分布
它的均值是Xt 方差是∑z平方
那么这些都是学习得到的
那么根据零时刻的状态分布以及转移模型
我们可以对1时刻的状态分布进行预测
那么预测的公式就是这个公式 和前面一样
也就是零时刻的状态分布乘以这个转移模型
再对零时刻的状态进行积分
然后把这两个分布代进来就得到这个结果
所以他这个预测结果也是一个高斯分布
那么在得到1时刻的证据z1之后
对1时刻的状态分布进行更新
也就是我们的滤波 它是等于这个式子的
这是根据贝叶斯公式
那么把这个观察模型代进来 把这个估计分布代进
来就得到这个概率式子
所以呢这个滤波的结果也是一个高斯分布
也就是说这个对1时刻状态的更新也是一个高斯分
布
1时刻的均值μ1就等于这个式子
1时刻的方差∑1平方它就等于这个式子
我们把它写到这里来然后进行推广
就得到t+1时刻的μ和t时刻的μ之间的关系
以及t+1时刻的∑和t时刻的∑之间的关系
那么有了这两个式子之后我们就可以进行滤波了
也就是说根据t时刻的状态分布
也就是说知道t时刻的均值和方差
然后再根据新的时刻 t+1时刻的证据z
就可以算出t+1时刻的状态分布
也就是就可以得到t+1时刻的均值和它的方差
所以这就是一个简单的一维卡尔曼滤波的实例
-1.1 人工智能概念
-第一章 绪论--1.1 人工智能概念
-1.2 什么是理性智能体
--1.2理性智能体
-第一章 绪论--1.2 什么是理性智能体
-2.1.1问题求解智能体
-第二章 无信息搜索策略--2.1.1问题求解智能体
-2.1.2问题形式化
--Video
-2.1.3 树搜索算法
--Video
-第二章 无信息搜索策略--2.1.2问题形式化
-2.1.4树搜索算法的实现
--Video
-2.2.1搜索策略
--Video
-第二章 无信息搜索策略--2.1.3树搜索算法
-2.2.2宽度优先搜索
--Video
-2.2.3一致代价搜索
--Video
-第二章 无信息搜索策略--2.1.4树搜索算法的实现
-2.3.1深度优先搜索
--Video
-2.3.2有限深度搜索
--Video
-2.3.3迭代深入搜索
--Video
-第二章 无信息搜索策略--2.2.2宽度优先搜索
-2.3.4迭代深入深度搜索性能分析
--Video
-2.4无信息搜索策略小结
--Video
-第二章 无信息搜索策略--2.2.3一致代价搜索
-第二章 无信息搜索策略--2.3.1深度优先搜索
-第二章 无信息搜索策略--2.3.2有限深度搜索
-第二章 无信息搜索策略--2.3.3迭代深入搜索
-第二章 无信息搜索策略--2.3.4迭代深入深度搜索性能分析
-第二章 无信息搜索策略--2.4无信息搜索策略小结
-3.1贪婪搜索算法
--Video
-3.2.1A星搜索算法
--Video
-第三章 有信息搜索策略--3.2.1A星搜索算法
-3.2.2A星搜索算法的最优性
--Video
-3.2.3可采纳的启发式函数
--Video
-第三章 有信息搜索策略--3.2.2A星搜索算法的最优性
-3.3爬山搜索算法
--Video
-3.4模拟退火搜索算法
--Video
-第三章 有信息搜索策略--3.2.3可采纳的启发式函数
-3.5遗传算法
--Video
-第三章 有信息搜索策略--3.3爬山搜索算法
-第三章 有信息搜索策略--3.5遗传算法
-4.1.1什么是约束满足问题
--Video
-第四章 约束满足问题--4.1.1什么是约束满足问
-4.1.2约束满足问题的标准搜索形式化
--Video
-4.2.1回溯搜索算法
--Video
-第四章 约束满足问题--4.1.2约束满足问题的标准搜索形式化
-4.2.2回溯搜索的变量赋值顺序策略
--Video
-4.2.3回溯搜索的前向检查及约束传播
--Video
-第四章 约束满足问题--4.2.1回溯搜索算法
-4.2.4 AC-3弧相容算法
--Video
-4.3约束满足问题的局部搜索方法
--Video
-第四章 约束满足问题--4.2.2回溯搜索的变量赋值顺序策略
-第四章 约束满足问题--4.2.3回溯搜索的前向检
-第四章 约束满足问题--4.3约束满足问题的局部搜索方法
-5.1博弈及极小极大值概念
--Video
-5.2极小极大值决策算法
--Video
-第五章 对抗搜索--5.2极小极大值决策算法
-5.3.1剪枝的概念
--Video
-5.3.2 alpha-beta算法
--Video
-5.3.3 alpha-beta剪枝示例
--Video
-5.4 不完美的实时决策
--Video
-第五章 对抗搜索--5.3.3 alpha-beta剪枝示例
-第五章 对抗搜索--5.4 不完美的实时决策
-6.1不确定性量化
--Video
-第六章 不确定性推理--6.1不确定性量化
-6.2使用完全联合分布进行推理
--Video
-6.3贝叶斯规则及其应用
--Video
-6.4贝叶斯网络推理
--Video
-第六章 不确定性推理--6.2使用完全联合分布进行推理
-6.5隐马尔可夫模型
--Video
-6.6卡尔曼滤波器
--6.6
-第六章 不确定性推理--6.4贝叶斯网络推理
-第六章 不确定性推理--6.3贝叶斯规则及其应用
-第六章 不确定性推理--6.6卡尔曼滤波器
-结课测试