当前课程知识点:线性代数(2) >  第九讲:Markov矩阵和正矩阵 >  9.3 正Markov矩阵 >  9.3 正Markov矩阵

返回《线性代数(2)》慕课在线视频课程列表

9.3 正Markov矩阵在线视频

9.3 正Markov矩阵

下一节:9.4 正矩阵(第一部分)

返回《线性代数(2)》慕课在线视频列表

9.3 正Markov矩阵课程教案、知识点、字幕

下面我们来看正Markov矩阵

这样一类特殊的Markov矩阵

它将保持它的n次方的极限

是存在的

一个正Markov矩阵呢

就是说它的元素均大于0

比如说这样一个例子

就是正Markov矩阵

第二个例子中它包含了0

所以它不是正Markov矩阵

为了看

正Markov矩阵的一般性质

我们先来看

二阶的正Markov矩阵

一个二阶的正Markov矩阵

它的形式是这样子的

1-a a b 1-b

那么a b都是在0到1

这个区间的一个正数

但是它不能达到边界0或者1

否则p就不是正的

那么p的n次方

我们用归纳法可以算出来

等于这样一个结果

那么我们来看一下

当n趋于无穷的时候

这个1-a -b的n次方

它呢 因为这个是小于1的

所以它将趋于0

趋于0以后

那么我们可以直接算出

p的n次方的极限

是这样一个矩阵

那么这个矩阵呢

我们可以看到它的特点是

它的每一列之和

分量之和等于1

每一列的元素呢

分量都是大于0的

所以这个极限的每一列

都是随机向量

这个极限矩阵

实际上是个Markov的正矩阵

正Markov矩阵

另外我们可以看到

这个极限矩阵的列向量

实际上是原始的这个p

这个矩阵的特征向量

而且是随机向量

我们可以验证一下

1-a a b 1-b

乘上1/a+b b a

我们看到它最后结果

还是1/a+b b a

换句话说

我们从这个例子可以看出

二阶的正Markov矩阵

它的极限矩阵是什么呢

它的极限矩阵恰好

是一个秩为1的矩阵

而且每一列是一样的

每一列的列向量是谁呢

恰好是p这个矩阵

关于特征值1的特征向量

而且是随机向量

也就是分量之和等于1的

好 我们可以看到

一个特征值是λ等于1

另外一个特征值呢

根据这个p的对角线元素和

1-a+1-b

这个是这个矩阵

p这个矩阵的trace

因为我们知道特征值之和呢

等于A的对角线元素之和

所以一个特征值是1

另一个特征值呢

就是用这个A的对角线元素之和

减去1 所以是1-a-b

我们刚才可以看到

1-a-b呢 它不等于1

那么另外外面我们看到λ等于1

它的代数重数

也就是说这个特征值是一重的

它的几何重数

也就是这个特征值

所对应的特征向量的空间

是1维的

就是它只有一个无关的特征向量

也就是说

所有关于特征值1的特征向量

都是这样一个随机向量的倍数

那么如果在这个二阶

正Markov矩阵中

我们让a或者b允许它等于0或者1

那么我们看到p就不再

是正Markov矩阵了

那么我们刚才得到的这些结论呢

特别是p的n次方的极限

可能就不存在了

比如下面这个例子

a取1 b也取1

p呢就是这样一个矩阵

那么这个矩阵是二阶的置换阵

实际上把单位阵的上下两行

换了一下位置

那么大家可以看到p等于这个

p的平方变成单位阵

p的立方又变回来了

所以这个p的n次方

如果n取偶数的时候

p的n次方实际上就是单位阵

如果n取奇数的时候

p的n次方面就是p

所以这个极限他也不存在

我们来看一般的正Markov矩阵

它有下面这个定理

设A是一个正Markov阵

则λ=1呢

是唯一的长度为1的特征值

大家注意

这个正Markov矩阵

和Markov矩阵

在这一点上的区别

Markov矩阵

它也说λ=1是它的特征值

但是λ=1并不是它

可能不是它唯一的长度

唯一的特征值

比如说大家前面看到置换阵p

它的特征值是三阶的单位根

因为它不是正Markov矩阵

那么如果是正Markov矩阵

长度为1的特征值只有一个

就是λ=1

而且λ=1呢是重数是一重的

就是它的代数重数是1

那么它的几何重数也是1

并且它存在着

唯一的一个随机向量α0

使得Aα0等于α0

那么我们可以看到

实际上α0的分量均是大于0的

我们可以证明α0的分量

实际上都是大于0的

分量之和呢是等于1

我们把α0呢叫稳定状态特征向量

为什么叫稳定状态的向量呢

大家可以看到

从二阶的情况就可以看出

当取二阶的正Markov矩阵

它的极限 n次方的极限

就是A的n次方的极限

就是α0 α0

当A是二阶的正Markov阵的时候

那么这个定理的证明我们不证了

因为它是下面我们要

考虑的正矩阵的

这样一个定理的特殊情况

我们过会去证明正矩阵的

这样一个定理的证明过程

我们来看这个例子

比如说A等于0.80 0.2

0.05 0.95

这是一个正Markov矩阵

那我们可以看到α0 0.2 0.8呢

这样一个向量

是它的A的关于λ=1的特征向量

而且是个随机向量

它的元素和等于1

元素分量是大于0的

有了这个定理以后呢

我们可以证明下面这个定理

A是一个n阶正Markov阵α0

是稳定状态的向量

那么大家从二阶的时候

已经可以看到

A的m次方趋于无穷的时候

这样一个矩阵序列的极限

是以α0作列得到的一个

n阶的正Markov阵

这个仍然是个正Markov阵

它的秩为1

我们来证明这个定理

首先A呢

我们一般的一个n阶矩阵

我们可以通过取它的特征向量

或者广义特征向量

把它化成一个Jardan标准型

那么这个Jardan标准型呢

我们假设它是由这些j1到js块

ji是Jardan块

每个ji的形式

大家是这样一个形式

那么我们特别地关注

特征值λ=1

因为

根据刚才我们前面那个定理说

特征值λ=1呢

是唯一的一个长度为1的特征值

并且它的代数重数

和几何重数都等于1

所以我们可以看到

在这个S个Jordan块中

只有一个Jordan块

而且是一个一阶的Jordan块

如果它阶数高于1了

那么时间特征值1的代数重数

就大于1了

所以我们就取j1

就是关于特征值1的Jordan块

如果不是j1的话

我们通过p的列的交换

可以把这个调到第一个位置

我们知道j1 j2跟j2 j1

这两个矩阵是相似的

好 那P^{-1}AP

就有这样一个形式

其中j2到js呢

它们所使用的特征值呢

都是长度小于1的特征值

我们现在来看A的m次方

那么对这个矩阵

两边取m次方呢

等于对A先取m次方

然后左右乘上p和它的逆

那么因为这是个分块对角阵

所以它的m次方

等于每个Jordan块的m次方

下面我们就来看一下

每个Jordan块的m次方

每个Jordan块它取m次方

一般来说它可以确切地写出来

当然我们现在也不具体算

但是我们主要抓住一点

就是这些Jordan块呢

除了第一个Jordan块

其他的Jordan块

它的对角元的特征值

都是长度小于1的特征值

比如说我们考虑ji这个Jordan块

因为ji它的对角线λi长度小于1

所以大家可以看到

这个λi的m次方

当m趋于正无穷的时候

是趋于0的

所以当这个ji比如说它是一阶的

也就是ni取1

那么ji当然它的m次方极限是0了

因为这是1乘1的 就是数

如果它的阶数高于1

那么我们也可以证明

ji的m次方的极限是0

那么这个证明呢我们来考虑这个

就是可以把ji呢

我们可以给它写成一个λi+j0

就是对角的λi单独提出来

然后j0是个幂零阵

那么我们主要注意一点

j0的ni次方是等于0的

那么ji的m次方

就等于λi+j0的m次方

那么我们使用j0的ni次方等于0

那么这个m次方

我们可以用二项式定理展开

注意 一般的两个矩阵

a+b的m次方

你不能随便使用二项式定理展开

因为a和b是不交换的

但是这种情况呢λ

i和j0是可以交换的

所以我们可以二项式定理呢

形式地给它写出来

那么写出来

你会发现j0的ni次方是等于0的

剩下的部分λi的长度小于1

当m足够大也趋于0

所以使用这几项

我们最后可以证明

无论这个ni是等于1还是大于1

这些ji的m次方

它的极限都是趋于0的

这样我们就推出来了

P^{-1}AP它的m次方最后呢

只留下第一个Jordan块

因为它是1

其他地方最后都极限是0

那么这样一个矩阵呢很明显

它的秩是等于1

也就是说我们至少得到了

P^{-1}AP的m次方的极限

是一个秩为1的一个矩阵

好 下面我们还要确切地写出

这个A的m次方的极限

好 A的m次方的极限呢

就可以把p移到右边

写出它等于PbP^{-1}

我们把这个矩阵呢用个符号叫C

而C就是我们的

A的m次方的极限矩阵

那么刚才我们看到

B是秩为1的

PBP^{-1}当然也是

秩为1的一个矩阵

又因为A是一个正Markov矩阵

那么A的m次方

也是正Markov矩阵

因为A它是Markov阵

A的m次方也是Markov阵

另外A分量均是大于0的

A的m次方分量也都是大于0的

我们可以使用这样一个性质

来说明

所以A的m次方取极限以后

它也是一个Markov矩阵

那么这个Markov阵呢

我们刚才看到它的秩是1

所以我们可以设

这个就是我们的C

C它的秩为1

那肯定它的列

都是同一个向量的倍数

我们叫t1α tnα

那么A乘上Am是等于Am+1

两边取极限我们就可以看到

A乘上C就等于C

也就是说A乘上它的极限矩阵呢

就等于这个极限矩阵

换句话说

A乘上极限矩阵的每一列

就等于相应同一列

所以C的每一列实际上都是

A关于特征值1的特征向量

特征向量

就是C等于t1α tnα AC等于C

也就等价于说

A乘上tiα等于tiα i从1到n

由此我们就可以推出来

因为C的每一列都是随机向量

所以t1到tn都取1α

就只能取随机向量α0

A的特征向量

关于特征值1的随机特征向量α0

这样我们就证明了这个定理

这个定理告诉我们

一个正Markov矩阵呢

它的m次方的极限

将是以稳定随机特征向量作列

得到的矩阵

我们来看下面这个例子

这个矩阵是一个正Markov阵

A关于特征值1的特征向量

我们看到都是这样一个形式的

我们为什么写成这样呢

大家可以看到

我们开始可能算出一个特征向量

是8 6 9

但是为了取随机向量

所以我们把8 6 9

这个分量之和23除一下

我们得到的随机特征向量

就是8/23 6/23和9/23

这样我们可以保证

这个特征向量它是一个和

分量和等于1的特征向量

那么这就是我们要找的

稳定状态向量

那么A的m次方极限就是

以这个向量作列的这样一个矩阵

我们看下面这个例子

这个例子说的是城市和郊区

人口流动

我们用ui来表示第i年的城市人口

用vi表示第i年的农村人口

那么假设人口流动的规律

是这样子的

每年有80%的城市人口没有动

20%的城市人口流动到郊区

每年有95%的郊区人口不动

5%的郊区人口流动到城市

因为现在城市人口比较拥挤

所以大家喜欢去郊区

我们得到了这样一个关系

那么假设这个规律以后呢

我们可以看到下一年度

第i+1年 第i+1年城市人口呢

实际上是上一年度

第i年的城市人口的80%没有动

所以就还在城市里面

然后另外一部分来自于

郊区人口的5%流动到了城市

所以下一年度的城市人口

这两个量的和

下一年度的郊区人口呢

是城市人口20%流动到郊区

郊区的95%没有动

所以是这两个量的和

这样我们就得到了

两个下一年度和上一年度之间

它们的一个

向量之间的一个过渡关系

是通过这样一个矩阵

这个矩阵大家可以看到

它是一个正Markov矩阵

那么我们来算一下

刚才我们说过它的特征向量

看它稳定状态的特征向量

是0.2和0.8

另外呢A还有一个特征向量

是关于0.75

这个特征值的特征向量

0.75小于1 是-1 1

那么我们现在来考虑一下

按照假设人口流动

这个规律不变的话

经过若干年以后

城市和郊区的人口

大概它的未来的发展趋势

应该什么样子的

好 我们设城市和郊区的总人口

为S

且u1是0.9S v1是0.1S

比如说城市郊区总人口为一千万

我们假设没有从外地再来人口

就是城市和郊区人口的双向流动

那么总人口假设一千万呢

那么城市人口假设是900万

郊区100万

那么在第一年的时候

我们得到一个向量u1 v1

那么这个向量呢

它应该是特征值1的特征向量

和特征值0.75的特征向量

两个特征向量的线性组合

因为我们知道

不同特征值的特征向量

是线性无关的

另一方面 这是个二维向量

所以这两个向量

已经可以把r平方给它充满

也就是说

任何一个二维向量

都是这两个向量线性组合

实际上我们也可以直接看出来

0.9 0.1

这个u1 v1就是0.9 0.1乘上S

它是等于0.2 0.8乘上个1

减去0.7乘上-1 1

这个再乘上S

就是a取1 b取-0.7

那么第二年的呢

这个向量我们叫f2

那么f2就等于A乘上u1v1

我们看当A乘这个向量的时候

这个向量没有动

所以还是0.2 0.8

A乘上这个向量的时候呢

就变成0.75乘上-1 1

好 一般的呢

我们可以写出

fk等于Ak+1乘u1v1

那么这个向量我们看始终没有动

这个向量就变成0.75的k次方

那么我们可以看到

这个一般的

当k趋于正无穷的时候

因为0.75是小于1的

它的k次方将趋于0

所以我们看到

fk它的极限就是0.2 0.8

也就是说虽然开始的时候

城市人口比较多 有900万

那么通过这种流动到最后呢

达到一种稳定状态的时候

城市人口只有200万

郊区人口是800万

我们可以总结一下

一般我们设

A是一个正Markov阵

设λ1对应的特征向量

也就是说各分量之和等于1的

那么这时候就是我们的随机向量

x1 它是一种稳定状态向量

那么

我们要考虑的一个向量的序列

它的第一个向量满足

是x1到xn的线性组合

x1到xn就是A的相应的

不同特征值的特征向量

我们也假设fk+1等于Akf1

那么现在问题就是我们来求

fk的极限

那么只有两种办法来求

一种我们先把

因为A是正Markov矩阵

我们可以先把A的k次方的极限

算出来

然后用这个极限呢

这个矩阵乘上f1

得到fk的极限 这是一种办法

还有一种办法呢

是用刚才说的办法

就是使用f1等于

这些特征值的向量组合来算

因为这样算就更简单一些

当A不断的乘上f1的时候

就等于A不断地乘上这些xi上

而xi都是特征向量

所以就得到了这些xi的一个倍数

除了第一项以外

剩下项都是特征值

长度小于1的特征向量

所以它们的特征值的倍数趋于0

这样我们就看到

这个极限呢等于a1x1

如果f1我们加个条件

假设它的各分量之和还等于1

那么我们看到fk

就是A乘上f1也满足这个性质

所以fk也满足这个性质

这样它的极限就满足这个性质

所以A1x1分量之和也等于1

因为x1本身的分量之和就等于1

所以我们推出A1就是1

也就是说当f1满足分量之和

等于1的时候

那么fk的极限 就等于x1

但如果A是非的正Markov矩阵

也就是A包含0的元素

那么这样一个Markov矩阵

它可能呢 刚才我们说过

它的特征值呢

长度为1的特征值可能不止一个

这时候

它就达不到一个稳定的状态

比如说下面这个例子

A等于0 1 1 0

那么它有两个特征值1 -1

那么我可以看到

这个矩阵的它的k次方的极限

是不存在的

从而fk的极限一般也不存在

线性代数(2)课程列表:

第一讲:正定矩阵

-1.1 实对称矩阵A正定的充要条件

--1.1 实对称矩阵A正定的充要条件

-1.2 典型例题

--1.2 典型例题

-1.3 半正定矩阵及其判别条件

--1.3 半正定矩阵及其判别条件

-1.4 二次型

--1.4 二次型

-1.5* 有心二次曲线(central conic)

--1.5* 有心二次曲线(central conic)

-1.6* 三维空间中的二次曲面-6类基本的二次曲面

--1.6* 三维空间中的二次曲面-6类基本的二次曲面

-1.7 二次型的分类

--1.7 二次型的分类

-1.8 矩阵的合同

--1.8 矩阵的合同

-1.9* 惯性定理的证明

--1.9* 惯性定理的证明

-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

-1.11* 正(负)定矩阵在函数极值问题中的应用

--1.11* 正(负)定矩阵在函数极值问题中的应用

-第一讲讲义

-第一讲:正定矩阵--课后习题

第二讲:相似矩阵

-2.1 引言

--2.1 引言

-2.2 相似矩阵的性质

--2.2 相似矩阵的性质

-2.3 Jordan标准形

--2.3 Jordan标准形

-2.4 定理的证明

--2.4 定理的证明

-2.5 Jordan标准形的应用

--2.5 Jordan标准形的应用

-第二讲讲义

-第二讲:相似矩阵--课后习题

第三讲:奇异值分解

-3.1 引言

--3.1 引言

-3.2 奇异值分解(Singular Value Decomposition)

--3.2 奇异值分解(Singular Value Decomposition)

-3.3 例题

--3.3 例题

-3.4 奇异值分解的应用

--3.4 奇异值分解的应用

-第三讲讲义

-第三讲:奇异值分解--课后习题

第四讲:线性变换 I

-4.1 线性变换的定义和性质

--4.1 线性变换的定义和性质

-4.2 线性变换的运算

--4.2 线性变换的运算

-4.3 线性变换的矩阵表示

--4.3 线性变换的矩阵表示

-4.4 线性变换与矩阵之间的关系

--4.4 线性变换与矩阵之间的关系

-第四讲讲义

-第四讲:线性变换 I--课后习题

第五讲:线性变换 II

-5.1 恒同变换与基变换

--5.1 恒同变换与基变换

-5.2 图像压缩——基变换的应用

--5.2 图像压缩——基变换的应用

-5.3 线性变换在不同基下的矩阵

--5.3 线性变换在不同基下的矩阵

-5.4 矩阵分解与基变换

--5.4 矩阵分解与基变换

-5.5 线性变换的核与像

--5.5 线性变换的核与像

-5.6 不变子空间

--5.6 不变子空间

-5.7* 幂零变换

--5.7* 幂零变换

-5.8* Jordan标准形

--5.8* Jordan标准形

-第五讲讲义

-第五讲:线性变换 II--课后习题

第六讲:伪逆

-6.1 伪逆

--6.1 伪逆

-6.2 Moore – Penrose 伪逆

--6.2 Moore – Penrose 伪逆

-6.3 最小二乘法

--6.3 最小二乘法

-第六讲讲义

-第六讲:伪逆--课后习题

第七讲:工程中的矩阵

-7.1 简介

--7.1 简介

-7.2 弹簧模型

--7.2 弹簧模型

-7.3 变量的线性关系

--7.3 变量的线性关系

-7.4 刚度矩阵

--7.4 刚度矩阵

-7.5 从离散到连续

--7.5 从离散到连续

-第七讲讲义

-第七讲:工程中的矩阵--课后习题

第八讲:图与网络

-8.1 简介

--8.1 简介

-8.2 图和矩阵

--8.2 图和矩阵

-8.3 网络和加权Laplacian矩阵

--8.3 网络和加权Laplacian矩阵

-8.4 关联矩阵的四个基本子空间

--8.4 关联矩阵的四个基本子空间

-8.5 注记

--8.5 注记

-第八讲讲义

-第八讲:图与网络--课后习题

第九讲:Markov矩阵和正矩阵

-9.1 问题引入

--9.1 问题引入

-9.2 Markov矩阵

--9.2 Markov矩阵

-9.3 正Markov矩阵

--9.3 正Markov矩阵

-9.4 正矩阵

--9.4 正矩阵(第一部分)

--9.4 正矩阵(第二部分)

-第九讲讲义

-第九讲:Markov矩阵和正矩阵--课后习题

第十讲:Fourier级数

-10.1 引言

--10.1 引言

-10.2 内积空间

--10.2 内积空间

-10.3 傅里叶级数

--10.3 傅里叶级数

-10.4 投影

--10.4 投影

-10.5 关于Fourier变换的注记

--10.5 关于Fourier变换的注记

-第十讲讲义

-第十讲:Fourier级数--课后习题

第十一讲:计算机图像

-11.1 引言

--11.1 引言

-11.2 平移

--11.2 平移

-11.3 伸缩

--11.3 伸缩

-11.4 旋转

--11.4 旋转

-11.5 投影和反射

--11.5 投影和反射

-第十一讲讲义

-第十一讲:计算机图像--课后习题

第十二讲:复数与复矩阵

-12.1 引言

--12.1 引言

-12.2 复矩阵

--12.2 复矩阵

-12.3 复正规阵

--12.3 复正规阵

-12.4 离散Fourier变换

--12.4 离散Fourier变换

-12.5 快速Fourier变换

--12.5 快速Fourier变换

-第十二讲讲义

-第十二讲:复数与复矩阵--课后习题

结课寄语

-结课寄语

--结课寄语

9.3 正Markov矩阵笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。