当前课程知识点:线性代数(2) > 第九讲:Markov矩阵和正矩阵 > 9.3 正Markov矩阵 > 9.3 正Markov矩阵
好
下面我们来看正Markov矩阵
这样一类特殊的Markov矩阵
它将保持它的n次方的极限
是存在的
一个正Markov矩阵呢
就是说它的元素均大于0
比如说这样一个例子
就是正Markov矩阵
第二个例子中它包含了0
所以它不是正Markov矩阵
为了看
正Markov矩阵的一般性质
我们先来看
二阶的正Markov矩阵
一个二阶的正Markov矩阵
它的形式是这样子的
1-a a b 1-b
那么a b都是在0到1
这个区间的一个正数
但是它不能达到边界0或者1
否则p就不是正的
那么p的n次方
我们用归纳法可以算出来
等于这样一个结果
那么我们来看一下
当n趋于无穷的时候
这个1-a -b的n次方
它呢 因为这个是小于1的
所以它将趋于0
趋于0以后
那么我们可以直接算出
p的n次方的极限
是这样一个矩阵
那么这个矩阵呢
我们可以看到它的特点是
它的每一列之和
分量之和等于1
每一列的元素呢
分量都是大于0的
所以这个极限的每一列
都是随机向量
这个极限矩阵
实际上是个Markov的正矩阵
正Markov矩阵
另外我们可以看到
这个极限矩阵的列向量
实际上是原始的这个p
这个矩阵的特征向量
而且是随机向量
我们可以验证一下
1-a a b 1-b
乘上1/a+b b a
我们看到它最后结果
还是1/a+b b a
换句话说
我们从这个例子可以看出
二阶的正Markov矩阵
它的极限矩阵是什么呢
它的极限矩阵恰好
是一个秩为1的矩阵
而且每一列是一样的
每一列的列向量是谁呢
恰好是p这个矩阵
关于特征值1的特征向量
而且是随机向量
也就是分量之和等于1的
好 我们可以看到
一个特征值是λ等于1
另外一个特征值呢
根据这个p的对角线元素和
1-a+1-b
这个是这个矩阵
p这个矩阵的trace
因为我们知道特征值之和呢
等于A的对角线元素之和
所以一个特征值是1
另一个特征值呢
就是用这个A的对角线元素之和
减去1 所以是1-a-b
我们刚才可以看到
1-a-b呢 它不等于1
那么另外外面我们看到λ等于1
它的代数重数
也就是说这个特征值是一重的
它的几何重数
也就是这个特征值
所对应的特征向量的空间
是1维的
就是它只有一个无关的特征向量
也就是说
所有关于特征值1的特征向量
都是这样一个随机向量的倍数
那么如果在这个二阶
正Markov矩阵中
我们让a或者b允许它等于0或者1
那么我们看到p就不再
是正Markov矩阵了
那么我们刚才得到的这些结论呢
特别是p的n次方的极限
可能就不存在了
比如下面这个例子
a取1 b也取1
p呢就是这样一个矩阵
那么这个矩阵是二阶的置换阵
实际上把单位阵的上下两行
换了一下位置
那么大家可以看到p等于这个
p的平方变成单位阵
p的立方又变回来了
所以这个p的n次方
如果n取偶数的时候
p的n次方实际上就是单位阵
如果n取奇数的时候
p的n次方面就是p
所以这个极限他也不存在
好
我们来看一般的正Markov矩阵
它有下面这个定理
设A是一个正Markov阵
则λ=1呢
是唯一的长度为1的特征值
大家注意
这个正Markov矩阵
和Markov矩阵
在这一点上的区别
Markov矩阵
它也说λ=1是它的特征值
但是λ=1并不是它
可能不是它唯一的长度
唯一的特征值
比如说大家前面看到置换阵p
它的特征值是三阶的单位根
因为它不是正Markov矩阵
那么如果是正Markov矩阵
长度为1的特征值只有一个
就是λ=1
而且λ=1呢是重数是一重的
就是它的代数重数是1
那么它的几何重数也是1
并且它存在着
唯一的一个随机向量α0
使得Aα0等于α0
那么我们可以看到
实际上α0的分量均是大于0的
我们可以证明α0的分量
实际上都是大于0的
分量之和呢是等于1
我们把α0呢叫稳定状态特征向量
为什么叫稳定状态的向量呢
大家可以看到
从二阶的情况就可以看出
当取二阶的正Markov矩阵
它的极限 n次方的极限
就是A的n次方的极限
就是α0 α0
当A是二阶的正Markov阵的时候
那么这个定理的证明我们不证了
因为它是下面我们要
考虑的正矩阵的
这样一个定理的特殊情况
我们过会去证明正矩阵的
这样一个定理的证明过程
我们来看这个例子
比如说A等于0.80 0.2
0.05 0.95
这是一个正Markov矩阵
那我们可以看到α0 0.2 0.8呢
这样一个向量
是它的A的关于λ=1的特征向量
而且是个随机向量
它的元素和等于1
元素分量是大于0的
有了这个定理以后呢
我们可以证明下面这个定理
A是一个n阶正Markov阵α0
是稳定状态的向量
那么大家从二阶的时候
已经可以看到
A的m次方趋于无穷的时候
这样一个矩阵序列的极限
是以α0作列得到的一个
n阶的正Markov阵
这个仍然是个正Markov阵
它的秩为1
我们来证明这个定理
首先A呢
我们一般的一个n阶矩阵
我们可以通过取它的特征向量
或者广义特征向量
把它化成一个Jardan标准型
那么这个Jardan标准型呢
我们假设它是由这些j1到js块
ji是Jardan块
每个ji的形式
大家是这样一个形式
那么我们特别地关注
特征值λ=1
因为
根据刚才我们前面那个定理说
特征值λ=1呢
是唯一的一个长度为1的特征值
并且它的代数重数
和几何重数都等于1
所以我们可以看到
在这个S个Jordan块中
只有一个Jordan块
而且是一个一阶的Jordan块
如果它阶数高于1了
那么时间特征值1的代数重数
就大于1了
所以我们就取j1
就是关于特征值1的Jordan块
如果不是j1的话
我们通过p的列的交换
可以把这个调到第一个位置
我们知道j1 j2跟j2 j1
这两个矩阵是相似的
好 那P^{-1}AP
就有这样一个形式
其中j2到js呢
它们所使用的特征值呢
都是长度小于1的特征值
我们现在来看A的m次方
那么对这个矩阵
两边取m次方呢
等于对A先取m次方
然后左右乘上p和它的逆
那么因为这是个分块对角阵
所以它的m次方
等于每个Jordan块的m次方
下面我们就来看一下
每个Jordan块的m次方
每个Jordan块它取m次方
一般来说它可以确切地写出来
当然我们现在也不具体算
但是我们主要抓住一点
就是这些Jordan块呢
除了第一个Jordan块
其他的Jordan块
它的对角元的特征值
都是长度小于1的特征值
比如说我们考虑ji这个Jordan块
因为ji它的对角线λi长度小于1
所以大家可以看到
这个λi的m次方
当m趋于正无穷的时候
是趋于0的
所以当这个ji比如说它是一阶的
也就是ni取1
那么ji当然它的m次方极限是0了
因为这是1乘1的 就是数
如果它的阶数高于1
那么我们也可以证明
ji的m次方的极限是0
那么这个证明呢我们来考虑这个
就是可以把ji呢
我们可以给它写成一个λi+j0
就是对角的λi单独提出来
然后j0是个幂零阵
那么我们主要注意一点
j0的ni次方是等于0的
那么ji的m次方
就等于λi+j0的m次方
那么我们使用j0的ni次方等于0
那么这个m次方
我们可以用二项式定理展开
注意 一般的两个矩阵
a+b的m次方
你不能随便使用二项式定理展开
因为a和b是不交换的
但是这种情况呢λ
i和j0是可以交换的
所以我们可以二项式定理呢
形式地给它写出来
那么写出来
你会发现j0的ni次方是等于0的
剩下的部分λi的长度小于1
当m足够大也趋于0
所以使用这几项
我们最后可以证明
无论这个ni是等于1还是大于1
这些ji的m次方
它的极限都是趋于0的
这样我们就推出来了
P^{-1}AP它的m次方最后呢
只留下第一个Jordan块
因为它是1
其他地方最后都极限是0
那么这样一个矩阵呢很明显
它的秩是等于1
也就是说我们至少得到了
P^{-1}AP的m次方的极限
是一个秩为1的一个矩阵
好 下面我们还要确切地写出
这个A的m次方的极限
好 A的m次方的极限呢
就可以把p移到右边
写出它等于PbP^{-1}
我们把这个矩阵呢用个符号叫C
而C就是我们的
A的m次方的极限矩阵
那么刚才我们看到
B是秩为1的
PBP^{-1}当然也是
秩为1的一个矩阵
又因为A是一个正Markov矩阵
那么A的m次方
也是正Markov矩阵
因为A它是Markov阵
A的m次方也是Markov阵
另外A分量均是大于0的
A的m次方分量也都是大于0的
我们可以使用这样一个性质
来说明
所以A的m次方取极限以后
它也是一个Markov矩阵
那么这个Markov阵呢
我们刚才看到它的秩是1
所以我们可以设
这个就是我们的C
C它的秩为1
那肯定它的列
都是同一个向量的倍数
我们叫t1α tnα
那么A乘上Am是等于Am+1
两边取极限我们就可以看到
A乘上C就等于C
也就是说A乘上它的极限矩阵呢
就等于这个极限矩阵
换句话说
A乘上极限矩阵的每一列
就等于相应同一列
所以C的每一列实际上都是
A关于特征值1的特征向量
特征向量
就是C等于t1α tnα AC等于C
也就等价于说
A乘上tiα等于tiα i从1到n
由此我们就可以推出来
因为C的每一列都是随机向量
所以t1到tn都取1α
就只能取随机向量α0
A的特征向量
关于特征值1的随机特征向量α0
这样我们就证明了这个定理
这个定理告诉我们
一个正Markov矩阵呢
它的m次方的极限
将是以稳定随机特征向量作列
得到的矩阵
我们来看下面这个例子
这个矩阵是一个正Markov阵
A关于特征值1的特征向量
我们看到都是这样一个形式的
我们为什么写成这样呢
大家可以看到
我们开始可能算出一个特征向量
是8 6 9
但是为了取随机向量
所以我们把8 6 9
这个分量之和23除一下
我们得到的随机特征向量
就是8/23 6/23和9/23
这样我们可以保证
这个特征向量它是一个和
分量和等于1的特征向量
那么这就是我们要找的
稳定状态向量
那么A的m次方极限就是
以这个向量作列的这样一个矩阵
我们看下面这个例子
这个例子说的是城市和郊区
人口流动
我们用ui来表示第i年的城市人口
用vi表示第i年的农村人口
那么假设人口流动的规律
是这样子的
每年有80%的城市人口没有动
20%的城市人口流动到郊区
每年有95%的郊区人口不动
5%的郊区人口流动到城市
因为现在城市人口比较拥挤
所以大家喜欢去郊区
我们得到了这样一个关系
那么假设这个规律以后呢
我们可以看到下一年度
第i+1年 第i+1年城市人口呢
实际上是上一年度
第i年的城市人口的80%没有动
所以就还在城市里面
然后另外一部分来自于
郊区人口的5%流动到了城市
所以下一年度的城市人口
这两个量的和
下一年度的郊区人口呢
是城市人口20%流动到郊区
郊区的95%没有动
所以是这两个量的和
这样我们就得到了
两个下一年度和上一年度之间
它们的一个
向量之间的一个过渡关系
是通过这样一个矩阵
这个矩阵大家可以看到
它是一个正Markov矩阵
那么我们来算一下
刚才我们说过它的特征向量
看它稳定状态的特征向量
是0.2和0.8
另外呢A还有一个特征向量
是关于0.75
这个特征值的特征向量
0.75小于1 是-1 1
那么我们现在来考虑一下
按照假设人口流动
这个规律不变的话
经过若干年以后
城市和郊区的人口
大概它的未来的发展趋势
应该什么样子的
好 我们设城市和郊区的总人口
为S
且u1是0.9S v1是0.1S
比如说城市郊区总人口为一千万
我们假设没有从外地再来人口
就是城市和郊区人口的双向流动
那么总人口假设一千万呢
那么城市人口假设是900万
郊区100万
那么在第一年的时候
我们得到一个向量u1 v1
那么这个向量呢
它应该是特征值1的特征向量
和特征值0.75的特征向量
两个特征向量的线性组合
因为我们知道
不同特征值的特征向量
是线性无关的
另一方面 这是个二维向量
所以这两个向量
已经可以把r平方给它充满
也就是说
任何一个二维向量
都是这两个向量线性组合
实际上我们也可以直接看出来
0.9 0.1
这个u1 v1就是0.9 0.1乘上S
它是等于0.2 0.8乘上个1
减去0.7乘上-1 1
这个再乘上S
就是a取1 b取-0.7
那么第二年的呢
这个向量我们叫f2
那么f2就等于A乘上u1v1
我们看当A乘这个向量的时候
这个向量没有动
所以还是0.2 0.8
A乘上这个向量的时候呢
就变成0.75乘上-1 1
好 一般的呢
我们可以写出
fk等于Ak+1乘u1v1
那么这个向量我们看始终没有动
这个向量就变成0.75的k次方
那么我们可以看到
这个一般的
当k趋于正无穷的时候
因为0.75是小于1的
它的k次方将趋于0
所以我们看到
fk它的极限就是0.2 0.8
也就是说虽然开始的时候
城市人口比较多 有900万
那么通过这种流动到最后呢
达到一种稳定状态的时候
城市人口只有200万
郊区人口是800万
我们可以总结一下
一般我们设
A是一个正Markov阵
设λ1对应的特征向量
也就是说各分量之和等于1的
那么这时候就是我们的随机向量
x1 它是一种稳定状态向量
那么
我们要考虑的一个向量的序列
它的第一个向量满足
是x1到xn的线性组合
x1到xn就是A的相应的
不同特征值的特征向量
我们也假设fk+1等于Akf1
那么现在问题就是我们来求
fk的极限
那么只有两种办法来求
一种我们先把
因为A是正Markov矩阵
我们可以先把A的k次方的极限
算出来
然后用这个极限呢
这个矩阵乘上f1
得到fk的极限 这是一种办法
还有一种办法呢
是用刚才说的办法
就是使用f1等于
这些特征值的向量组合来算
因为这样算就更简单一些
当A不断的乘上f1的时候
就等于A不断地乘上这些xi上
而xi都是特征向量
所以就得到了这些xi的一个倍数
除了第一项以外
剩下项都是特征值
长度小于1的特征向量
所以它们的特征值的倍数趋于0
这样我们就看到
这个极限呢等于a1x1
如果f1我们加个条件
假设它的各分量之和还等于1
那么我们看到fk
就是A乘上f1也满足这个性质
所以fk也满足这个性质
这样它的极限就满足这个性质
所以A1x1分量之和也等于1
因为x1本身的分量之和就等于1
所以我们推出A1就是1
也就是说当f1满足分量之和
等于1的时候
那么fk的极限 就等于x1
但如果A是非的正Markov矩阵
也就是A包含0的元素
那么这样一个Markov矩阵
它可能呢 刚才我们说过
它的特征值呢
长度为1的特征值可能不止一个
这时候
它就达不到一个稳定的状态
比如说下面这个例子
A等于0 1 1 0
那么它有两个特征值1 -1
那么我可以看到
这个矩阵的它的k次方的极限
是不存在的
从而fk的极限一般也不存在
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语