当前课程知识点:线性代数(2) > 第九讲:Markov矩阵和正矩阵 > 9.4 正矩阵 > 9.4 正矩阵(第一部分)
好 我们可以看到
这个马尔科夫矩阵满足λ=1
是长度为1的
一个这样唯一的特征值
那么而且它的相应代数重数是1
几何重数也是1
这样就保持了它的
A的k次方的极限存在性
那么现在我们把它推广到
一般的正矩阵
设A等于(aij)n×n
那么A是个n阶的实矩阵
如果它的元素都是大于0的
我们叫正矩阵
那么明显地
这个马尔科夫矩阵
是它的一个特殊情况
那么我们需要一个概念
在正马尔科夫矩阵的时候
我们特征值1是长度最大的
这样一个特征值
那对于一般的正矩阵呢
我们也需要一个
这样一个长度最大的
特征值中长度最大这个概念
那么这个概念我们叫谱半径
谱半径就是
A的特征值长度的最大值
比如说A等于旋转矩阵
那我们知道旋转矩阵的特征值
cosθ加减2倍的sinθ
所以它的特征值长度是等于1
那么它的谱半径就等于1
我们在正矩阵中要考虑的是
主要是下面这个定理
这个定理说
如果A是一个正矩阵
则ρ(A)是n的一个特征值
大家把这个跟正马尔科夫阵
对比一下
正马尔科夫阵说λ=1
是长度等于1的唯一的特征值
那么现在这个长度等于1
换成了ρ(A)
特征值也换成了ρ(A)
就是ρ(A)
不但是A的特征值的最大长度
而且它本身就是特征值
注意这个区别
A的特征值呢比如说a+b
它的长度是等于根号a^2+b^2
这并不能保证
根号a^2+b^2是A的特征值
并且它有正特征向量
就是刚才我们大家回忆一下
正马尔科夫矩阵
我们找个稳定状态的向量
它的每一个分量都大于0的
是个正的特征向量
现在这个推广的结论ρ(A)是长度等于
ρ(A)的唯一的特征值ρ(A)的几何重数等于1
也就是说
关于这个特征值特征向量
只有一个无关的
其他都是这个正特征向量的倍数
它的代数重数等于1
就是说它不但是唯一的特征值
而且它的重数也是1
我们下面来证明这个定理
我们先来看A
设ρ(A)是A的一个特征值
它有正特征向量
那么这个证明手法
跟证马尔科夫矩阵
或者马尔科夫矩阵讨论的时候
很相似
我们来看λ是A的一个特征值
这个特征值一般是复数
那么我们假设λ
的长度等于ρ(A)
也就是说λ是最大长度的特征值
那另一方面呢
我们来假设α是关于λ的特征向量
那么α的每一个分量都是复数
那么大家回忆一下
刚才我们的技巧是
我们把这样一个等式
这个等式它的分量
有很多是复数
所以我们考虑α正α
正是α的每一个分量
做成的一个向量
刚才我们讨论了A乘α正
和ρ(A)α正
在证马尔科夫矩阵的性质的时候
我们来比较了一下这两个
那么现在这情况是完全相似的
那么我们可以检查出Aα正
是大于等于ρ(A)α正
这个证明刚才是
在马尔科夫矩阵的时候讨论
是完全相似的
那么现在有两种情况
就是说Aα正等于ρ(A)α正
这就说明α阵
是关于ρ(A)的特征向量
另一方面也说明了ρ(A)这个特征向量
它的分量都是非负的
好 我们来看一下
如果Aα正不等于ρ(A)α正
那么因为A是正矩阵
我们回忆我们第二节
在开始的时候用了个技巧
就是对于这样一个大于等于
向量的大于等于
我们两边
同时乘上一个正矩阵以后
那么这个大于等于
就变成了大于号
所以A^2α正就是ρ(A)Aα正
那么Aα正又大于等于ρ(A)α正
所以这个就大于等于ρ(A)^2α正
那么这个大于号保证了
我们前面可以补一个小的ε
所以A^2α正是大于1+ε
乘上ρ(A)^2α正
那么我们现在令B
等于ρ(A)^2分之一A^2
那么因为A的谱半径是ρ(A)
A^2的谱半径就是ρ(A)^2
那B呢它的谱半径就是1
因为它前面乘上这么一个数
好 我们把这个不等式中的A
换成B
那么我们得到了Bα正
大于1+εα正
那么这个式子我们两边
不断地乘上B以后
我们就得到B的k次方α正
大于1+ε的k次方α正
那我们来看一下
这个数是大于1的
当它取k次方
那么当k趋于无穷的时候
这个数是趋于正无穷的
而这个等式的左边
不等式的左边是B的k次方α正
那么我们看到B它的谱半径
是等于1的
也就是说B的k次方
它谱半径始终保证在1
所以它的矛盾在于
这个左边它的特征值
它的谱半径始终不超过1
而右边整个趋于正无穷
那么确切地说
我们用两边除以B 除以1+ε
那么这个的k次方
大家可以看到这个矩阵
它的谱半径就是1+ε分之一
所以这个矩阵它的谱半径
是小于1的 小于1
因为它的谱半径小于1
我们可以推出这个矩阵
它的k次方是趋于0的
这个技巧大家回忆一下
刚才我们在求
正马尔科夫矩阵的极限的时候
我们考虑了Jordan块
一个Jorda块如果λi是小于
它的长度小于1的话
那么Ji的m次方将趋于0
那么这块讨论跟那个完全一样
因为现在我们这个
它的谱半径是小于1的
所以我们要考虑
这个矩阵的Jordan标准形的时候
它的Jordan块对角线元素
长度都是小于1的
所以这个趋于0
这个趋于0呢我们就可以看出
Aα正就只能等于ρ(A)α正
我们再来看B
在A中我们已经得到了
Aα等于λα
λ长度等于ρ(A)
则α正等于ρ(A)α正
那么这个
我们把这个式子确切地写开
就是这样的等式 n个等式
这个等式说明什么呢
我们简单地看一下
就是复数的长度的和
等于和的长度
那么大家可以一般地想一下
两个复数它们的和的长度
一般是小于等于长度的和
那么在什么时候能够相等呢
那么必须z1和z2要满足倍数关系
也就是说存在着一个数
使得z1等于c倍的z2
那么我们现在这个情况是一样的
我们确切地说存在着C
使得Cα是一个非负向量
我们可以以n等于2来解释一下
这个证明过程
当n等于2的时候
A呢是这样一个二阶矩阵
那么这个二阶矩阵
我们按照这个表达式
确切地展开以后
我们就得到了这样一个式子
就是和的长度等于长度和
那么两边同时我们取平方
平方相当于
一个复数的长度的平方
相当于这个复数跟它的共轭相乘
所以我们就可以得到
这样一个表达式
通过比较两边的表达式
我们就可以推出z1 z2的关系
那么现在我们就得到了
Aα等于λα存在着一个C
Cα是大于等于0的
那么这样我们就把α换成Cα
这个A乘上Cα等于λ的Cα
那么因为A是个正矩阵
Cα是一个大于等于0的非负向量
那么这个乘完以后呢
得到的向量应该是一个正向量
就是这一块呢
实际上是大于0的
那么由此我们推出λ是大于0的
也就是说λ是
它的长度等于ρ(A)
它又大于0
所以它只能取ρ(A)
这我们就证明了B
好 下面我们来看一下C
在C呢 我们可以看到
在A中我们已经存在着α大于0
使得Aα大于0 等于ρ(A)α
那么我们可以存在一个β不等于0
Aβ就等于ρ(A)β
我们假设存在着这样一个
非0的β
也就是说 我们说这是唯一的
那么我们要假设说有另外一个β
它也满足
它是ρ(A)的特征向量
那么我们可以看到α和β
都是关于ρ(A)的特征向量
那么我们可以通过α减去
一个若干倍的β
使得它的某一个分量为0
比如说α是1 2β
是3 4 比如说
那么我们不能保证α-β
的若干倍是等于0
但是我们能保证α-β
的若干倍某一个分量是0
比如说这个例子中α-1/2β
它的第二个分量就是0
所以我们可以找到一个C大于0
使得α-Cβ是某一个分量为0
并且这个差向量是一个非负向量
那么这样这个α-Cβ
它不是一个正向量
它只是一个非负向量
那么怎么找这个C呢
我们下面通过这个图来说明
比如说n等于2的时候α
是等于a1 a2 ai大于0β
是这样一个正向量
我们假设有两个
关于ρ(A)的一个正的特征向量
那么我们现在来看一下
函数d等于a1-b1c
和d等于a2-b2c
那么这样我们就得到了两条直线
第一条直线就是l1 这个是l2
那么这两条直线
如果β跟α不是一个平行关系
也就是说β不是α的倍数
那么这条直线肯定有交点
那么我们可以看到这张图你
C取c0的时候呢
a1-b1c0等于0的
但是第二个直线是大于0的
所以这就方便于我们可以找出
所要的c
所以通过这张图
我们可以找出这个C大于0
使得α-cβ有0分量
而且是一个非负向量
那么因为α和β
都是关于ρ(A)的特征向量
那么它的线性组合也是特征向量
这样我们就推出来了
A存在着一个ρ(A)的一个特征向量
但是有一个零分量
这就矛盾了
因为我们知道
关于ρ(A)的非负的特征向量
都是
特征向量的分量都是大于0的
但是现在得到一个0分量
这是矛盾的
因此α-cβ只能取0
也就是说α跟β是一个成比例关系
好 我们再来看最后一个
(d)的证明
这个证明就很有技巧性
我们来看如果A和A^T
有相同的特征值
那么A^T
存在着一个正的特征向量
因为A^T也是正向量
而且A和A^T有相同的特征值
所以A^T存在着一个特征向量β
是正的 ρ(A)β
有些书上把这个β
叫做A的左特征向量
而A的通常特征向量
就是右特征向量
那么我们考虑β的正交补β
的正交补实际上是
n维空间中的一个n-1维超平面
我们从正交补这个超平面中
取一组基 α2到αn
因为我们刚才已经有
Aα等于ρ(A)α
也就是A关于ρ(A)
有一个正特征向量
我们把这个正特征向量
跟β比较一下
因为β转置乘上α是大于0的
所以α绝对不会在β的正交补里面
这样保证了什么
保证了α和α2到αn是线性无关的
因为它不在这个超平面上
所以我们可以得到一个
可逆矩阵P
那么我们来看A乘上αi
当i取大于0的时候
Aαi是属于β的正交补
这样子呢我们α1到αn作基的话
实际上我们看到A
实际上是相似于这样一个矩阵
这就是P 这是P
也就是说P^{-1}AP等于ρ(A)
0 0 a1
但是我们可以看到
a1它不包含ρ(A)特征向量
所以这个a1没有特征值ρ(A)
这样我们看到A的特征值ρ(A)它的代数重数
只能是一重的
也就是只有这一个
在A1中不再会有ρ(A)
作为特征值了
这样我们就证明了
这个ρ(A)的代数重数是1
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语