当前课程知识点:线性代数(2) > 第九讲:Markov矩阵和正矩阵 > 9.2 Markov矩阵 > 9.2 Markov矩阵
好 我们现在呢
来确切地引入Markov矩阵的定义
一个n乘n矩阵的
我们说它是实矩阵
就是元素都是实数
它被称为Markov矩阵
如果它的元素均为非负的
且每个列向量分量之和等于1
这样一个矩阵
我们就叫Markov矩阵
比如说这些例子
特别是有些地方呢我们可以取0
只要保证这一列之和等于1
元素又是非负的
Markov矩阵呢
因为它是用在概率里面的
是随机过程所使用的矩阵
我们也把它称为随机矩阵
有些书上可能分得更细
因为我们是
列向量的分量之和等于1
有些也叫列随机矩阵
有些是行向量的分量之和等于1
那叫行随机矩阵
那么这两种矩阵
实际上就差个转置
我们在这一讲中
只考虑列随机矩阵
也就是说列分量之和等于1的
那么Markov矩阵的列向量
它所满足这个性质呢我们抽出来
把这种向量称为随机向量
也就是说
一个向量如果它的每一个分量
是非负的
分量之和又等于1
我们就把它称为随机矩阵
我们在下面的讨论中呢
要使用这个技巧
就是关于非负矩阵的某些技巧
我们设A是一个n阶的实矩阵
Aij呢如果都大于0的话
那么这样一个矩阵呢
我们有时候就写成A大于0
当然这块我们要注意
这跟A是正定的不要混淆了
如果容易产生混淆的时候
我们就不这样写
直接写A是正矩阵
就是每个元素都大于0的矩阵
如果α和β是两个实向量α
如果它的每个分量
均大于等于β的相应分量
那我们就写α大于等于β
那么两个向量可能不可以比较
比如说一个向量的某一个分量
大于另一个向量的相应分量
但是这个向量
可能另一个分量又小于
那个向量的相应分量
所以有可能两个向量不可以比较
所以我们说两个向量
如果可以比较的话
就是每个分量均大于等于
这有个均大于等于
我们才叫α大于等于β
比如这个例子
我们可以有些分量都相等
比如说这两个分量是相等的
这两个分量也相等
只有一个分量是大于等于
那么还是α仍然是大于等于β
我们如果把等于号去掉
只写α大于β
表示的是α的每一个分量
都严格大于β的相应分量
比如说上面这个例子中呢α
就只是大于等于
而不是大于β
那么我们要使用的一个
主要的一个技巧是下面这个
如果A是一个正矩阵
也就是A的每一个元素都大于0α
和β这两个向量呢α
是大于等于β
并且α不等于β
那么我们给α和β的两边都左乘A
那么我们就可以看到
Aα是大于Aβ的
也就是说我们使用这三条
A大于0 α大于等于βα
不等于β
那么我们可以推出Aα是大于Aβ
那我们要注意
这一块一定要要求A是大于0的
如果A不是大于0的
就是A存在着零元
那么有可能Aα就不是大于β
比如说上面这个例子
这个例子中
我们取A等于1 0 0 1
那么A是一个非负的矩阵
有零元
那么Aα仍然是大于等于Aβ
但是呢Aα大于Aβ不成立
因为它们有
这两个向量有相同的分量
Aα要大于等于Aβ
必须每个分量都是严格的大于
那么Aα大于Aβ呢
我们就可以找到一个
足够小的大于0的ε
使得Aα大于(1+ε)Aβ
就满足这个性质
这两个是等价的
好 现在我们来看
Markov矩阵的一些基本性质
那么根据Markov矩阵的定义呢
它的每一列元素之和等于1
每一列的列向量的分量
都是非负的
那么这个知识说明它的列向量
是随机向量
Markov矩阵的列向量
是随机向量
我们先来看
Markov矩阵的第一个基本性质
如果A是n阶Markov矩阵
P是n维随机向量
则Ap是一个n维的随机向量
我们来证明一下
那么这些刻画呢
我们都把它转化成数学的语言
设A是v1到vn 有n列
vi是A的第i列 p是一个随机向量
那么p1+...+pn等于1
那么我们看到A乘上p
等于p1v1+ 一直加到pnvn
就是A的n个列向量的线性组合
它们的系数呢是p1到pn
系数和等于1
那么因为A的每一列
都是随机向量
所以我们可以看到1 1 1
乘上vi等于什么呢
因为这个向量乘上vi
就等于vi的分量之和
那么我们可以看到它是等于1的
所以这个向量
行向量乘上A
就等于乘到A的每一个vi上
所以结果就是还是这个向量
那么这个p是随机向量
所以这个向量乘上p
就等于p1加到pn
从而也等于1
所以由这个我们想看
Ap是不是一个随机向量
我们只要看
用1构成的这个行向量
乘这个向量是不是等于1的
就可以了
那么由这个呢
由这条性质我们看到
这个乘A就等于1 1 1
那么再乘以p呢
就使用这个性质 就等于1
所以我们就推出了
Ap是个随机向量
那么大家在这里面可以看到
这个等式呢
如果我们把它转置一下
就是A^T乘1 1 1
等于1 1 1乘以
这个说明1是A^T的特征值
这个向量是A^T
关于特征值1的特征向量
我们看
Markov矩阵的第二个性质是
一个Markov矩阵A
总有特征值1
它的其余特征值都是长度小于等于1
我们刚才已经看到
A转置呢
一个Markov矩阵的转置
它有特征值1
它的特征向量包含了1 1 1
全是1构成的列向量
那么因为A跟A转置
有相同的特征值
注意A和A转置
它们的特征多项式是一样的
因为这样一个矩阵
和这个矩阵是互为转置
两个互为转置的矩阵
有相同的行列式
所以我们推出A和A转置有
相同的特征多项式
那么A和A转置相同的特征值
也就因此可以得到
但是我们大家要注意
A和A转置的特征向量
一般来说并不一样
比如说1 1是A转置的
关于特征值1的特征向量
但是这一个向量并不是
A的关于特征值1的特征向量
好 这样我们
从这儿已经开始推出了
A有特征值1
那么现在我们想说明
其他特征值长度
都是小于等于1的
那么我们有反证法
假设A它存在着特征值
这个特征值是个复数
我们知道Markov矩阵的特征值
它有可能是复数
比如说置换矩阵
任何一个置换的阵
就是把单位阵交换行
得到的矩阵就是置换阵
那么这样一个置换阵
它的特征值有可能就是复数
而置换阵都是Markov阵
我们现在假设A存在特征值λ
0属于C
那么λ0它的长度是大于1的
一个复数a加bi
它的长度呢
就等于根号a^2+b^2
那么我们还假设
存在着一个向量α Aα=λ0α
也就是α是属于特征值λ
0的特征向量
那么这块讨论呢
我们可以看到λ0是个复数α
有可能是一个复数构成的向量
那么我们来看一下
这时候我们需要使用的一个技巧
就是α是由复数构成的向量
那么我们为了使用A
作为Markov矩阵的
它的元素都是非负的
使用这个性质
那么我们考虑一下
这个α阵这个向量
这个向量是什么呢
就是把α的每一个分量
取它的长度
比如说α等于1-i 1+i
那么α阵呢就等于它的长度
根号2
那么Aα阵呢得到的一个向量β
A是一个
它的元素都是非负的α
阵呢元素也是非负的
所以Aα阵得到的ββ
肯定它的分量都是实数了
而且也是非负的
那么我们下面来考虑一下
Aα=λ0α和Aα阵跟
左边把α取它的每一个分量长度
右边我们也考虑一下λ0
和α的长度
也就是说α阵
我们来比较一下
这两个之间的关系
那么我们看到用A的每一行
去乘上α阵
那么得到的ωi
是等于这样一个结果
那么这个结果当然明显
是大于等于
长度的和 注意这个Ai1
到Ain都是非负的
长度的和大于等于和的长度
这是复数的性质
就是复数z1+z2的
两个复数的和的长度
小于等于长度的和
由此我们推出了ωi
是大于等于λ0的长度
乘上zi的长度
那么也就推出了Aα阵
是大于等于λ0的长度乘上α阵
也就是说刚才我们讨论的时候
使用了Aα等于λ0α
但是这种讨论中呢λμ
0是个复数α
也是一个复数构成的向量
所以为了方便呢
我们把它转化到
用它的长度说话
那么最后关系得到是大于等于
就得到了两个实向量
是一个大于等于关系
那么因为A是非负的
所以我把这两个向量的两边
同时左乘一个A
那么这个大于等于号不变
大家回忆一下
我们刚才说的那个技巧
所以A的平方
这个左边是A^2α阵
就大于等于A乘上λ0的长度α阵
那么这一块呢
我们再使用一下这个式子到这儿
就推出了A^2α阵
大于等于λ0长度的平方乘上α阵
那么递归的呢
我们可以推出A的k次方α阵
大于等于λ0长度的k次方α阵
那么由此大家可以看到
如果这个λ0的这个长度
如果是大于1的话
那么当k趋于无穷的时候
这个东西就趋于正无穷了
那么我们两边要注意
A是一个Markov阵
所以它的每一列元素和
不会变大
就是A的k次方
A是个Markov阵
A的k次方它还是Markov矩阵
所以它的元素和
元素并不会变大
多少次方它还是保证
列向量分量之和等于1
所以我们看到
大概猜一下左边呢
它的元素分量
向量的分量应该不会变得太大
是有界的
而这个不等式的右边呢
当k趋于正无穷的时候
就趋于无穷
所以这就产生了一个矛盾
那确切地说呢
就是我们两边同时给它乘上
对这个不等式两边同时乘上
1 1 1这个向量
那么左边乘完以后呢
我们就得到了它正好是α
的长度 分量的长度的和
右边长度乘完以后呢
得到λ0的k次方的长度
乘上这个分量长度的和
那么由此我们可以看到λ0
的长度不可能是超过1的
这里面我们使用了
我们在这一节开头所使用的技巧
我们刚才已经看到
Markov它的第一个性质是
有特征1
并且其他特征值的长度
是小于等于1的
那么由此呢我们可以看到
关于特征值1的有一个特征向量α0
当然这样α0是不唯一的
我们可以取比如说它的长度和
等于1的这样一个向量
比如说假如α0比如说1 2
那么我们可以把它取成1/3 α0
那么1/3 2/3
那么这个还是
A关于特征值1的特征向量
但是它的分量和就可以变成1了
所以我们可以通过除上一个倍数
使得这个α0它的分量之和等于1
那么后面我们可以看到
如果A
它这个Markov矩阵
如果它的分量都是正的
就是A中没有出现0
那么我们可以看到
这个α0的分量也都是非负的
而且都是大于0的
所以α0呢 这时候就是随机向量
因为随机向量我们要有两条
分量是非负的
而且长度和等于1
就是现在我们只能说明
长度和等于1
好 性质二中呢
其余特征值的长度满足λ0λ
的长度小于等于1
这个等号不能去掉
就是有可能存在着Markov矩阵
它的特征值不等于1
但是这个特征值的长度却等于1
比如说我们看下面一个例子
最直观的一个置换阵
就是置换阵中有大量这种例子
比如说p等于这样一个置换阵
这个置换阵是把单位阵的第三行
放到了第一行
单位阵的第一行放到第二行
单位阵的第二行放到第三行
所以等于
把单位阵的每一行的次序打乱
那么这个矩阵呢
它的特征值可以算一下
是三阶的单位根
那么这三个根大家可以看到
它正好是在单位圆上走的
所以这三个根呢
它的长度是一样的
这个P它的三次方等于i3
那大家可以看到
如果一个矩阵它的多少次方
等于单位阵
那么你可以马上推出
这个矩阵的特征值也要满足λ
的立方等于1
那么因为这个3是最小的了
就是p的平方不可能等于单位阵
所以λ的三次方等于1
解出的所有的解都是它的根
那么大家可以看到
因为p的三次方等于单位阵
所以当k趋于正无穷的时候
p的k次方是没有极限的
因为p的k次方
当k取3的倍数的时候
它的极限是单位阵
当k取3 3的倍数余1的
那么它的极限就是p
所以它的极限是不存在的
但是我们下面考虑
特殊的Markov矩阵
使得它的p的k次方的极限存在
A的k次方的极限存在
我们知道这种k次方的极限
通过我们在第一部分的内容
可以看到
它刻画了这样一个
向量序列未来的发展趋势
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语