当前课程知识点:线性代数(2) > 第二讲:相似矩阵 > 2.4 定理的证明 > 2.4 定理的证明
这一节我们来看一下定理的证明
首先我们看一个简单的例子
假设矩阵A相似于
这样的一个7阶的Jordan标准形
那么这个Jordan标准形
包括三个Jordan块
第一个Jordan块是以2
为特征值的一个3阶的Jordan块
第二个是以4为特征值的
一个2阶的Jordan块
第三个是以0为特征值的
2阶的Jordan块
那么我们把过渡矩阵P
这个可逆矩阵它的列向量
分别记成x1到x7
那AP等于PJ
也就是Ax1等于2x1
Ax2等于2x2加x1
Ax3等于2x3加x2
Ax4等于4x4 Ax5等于4x5加x4
Ax等于0 Ax7等于x6
这样我们就有三个向量链
x1 x2 x3
Ax1等于2x1
这个x1是一个特征值2
所对应的特征向量
Ax2等于2x2再加上x1
它不是一个特征向量
但是它与x2 x1有这样的关系
Ax3等于2x3再加上x2
那第二个向量链是x4 x5
x4是特征值4所对应的特征向量
x5它满足x5等于4x5加上x4
x6 x7
x6是特征值0所对应的特征向量
x7它满足Ax7等于0乘以x7
再加上x6
这样我们有三个向量链
它们满足Axi要么是等于lambda i xi
要么是等于lambda i xi再加上xi-1
那么起始的向量x1 x4和x6
都是特征向量
所有的向量
尽管不全都是A的特征向量
但它们都能够满足
存在一个正整数k
使得A-lambda i的k次幂乘以xi等于0
这样的向量我们统称为是
属于特征值lambda i的广义特征向量
这样我们去求可逆矩阵P
使得P^{-1}AP等于
A的Jordan标准形J的过程
就等价于去求A的n个线性无关的广义特征向量的过程
之前A如果是可以对角化的
我们是要去求A的n个
线性无关的特征向量
而在一般情况下
当A不见得有n个线性无关的
特征向量的时候
我们去求A的n个所谓
线性无关的广义特征向量
使得在由这样的广义特征向量
所构成的矩阵P里头
P^{-1}AP等于它的Jordan标准形J
那以此作基础
我们来看一下定理的证明
我们对矩阵A的阶数
用数学归纳法
当n等于1的时候
对于1阶矩阵,这个结论
是自然成立的
我们假设阶数小于n的矩阵
总可以相似于其Jordan标准形
下面对阶数等于n的矩阵A来讨论
分成几步来进行
第一步假设A有零特征值
那么如果A没有零特征值的时候我们可以任取特征值lambda
来讨论矩阵A-lambda I
这时候A-lambda I就有零特征值了
所以不失一般性
我们一开头
就假设A是有零特征值的
那于是它的行列式是等于0
它是一个奇异矩阵
因此它的秩如果是记成r的话
是比n要来得小的
我们去取A的列空间C(A)的一组基
我们记成是u1到ur 这个r是小于n
那么Aui仍然是
A的列向量的一个线性组合
所以它包含在A的列空间C(A)里头
因此每一个Aui都可以由
列空间的基底u1到ur去线性表示
那这件事情
用矩阵的语言来表达
就是A去乘以以u1到ur
作为列向量所构成的这个矩阵
就等于用u1ur作为列向量
构成的这个矩阵
去乘以一个r阶的矩阵
我们记成是A一弯
A一弯里头记录了Aui
用u1到ur线性表示的组合系数
那因为A一弯这个矩阵
它是一个r阶的矩阵
我们说r是小于n的
因此我们可以用归纳假设
对于A一弯这个矩阵
我们存在着r阶的可逆矩阵Q
使得Q^{-1}A一弯Q
是等于A一弯的Jordan标准形
那么两步综合起来
也就是A去乘以以u1到ur
作为列向量的这个矩阵
再去乘以Q
等于u1ur来作为
列向量的这个矩阵去乘以Q
再去乘以A一弯的Jordan标准形
那么如果我们把
这两个矩阵的乘积的列向量
记成是w1 wr的话
那上面这个式子就可以表达成
A去乘以w1 wr
来作为列向量的矩阵
等于以w1 wr作为列向量的矩阵
去乘以A一弯的Jordan标准形
这里呢w1到wr这r个向量
是由u1到ur这r个线性无关的向量
去乘以可逆矩阵Q
所得到的结果
因此它仍然是线性无关的
它仍然构成C(A)的一组基
那么这样我们就在C(A)
这个r阶的子空间里头
找到了一组好的基底
使它满足这个性质
那么也就是说这时候
A去乘以wi
它要么等于lambda i wi
要么等于lambda i wi再加上wi-1
我们在C(A)里头找到了
r个广义特征向量
找到了部分的好基底
我们用一个例子来看一看
刚才第一步的过程
我们设A是这样的一个3阶矩阵
我们说这个矩阵
它的第一列和第二列是相同的
线性相关
因此这是一个奇异矩阵
取它的第一列和第三列
来作为列空间的一组基底
我们叫u1和u2
我们用A去乘以u1发现等于2u1
也就是说u1是A的
关于特征值2的特征向量
Au2等于3u1
那这件事情可以写成
A去乘以u1 u2为列向量这个矩阵
等于u1 u2为列向量的矩阵
乘以这个2乘2的矩阵
这个就是刚才定理证明里头
第一步的A一弯这个矩阵
2阶矩阵
好 对于这个矩阵呢
我们可以找到一个可逆矩阵Q
使得Q^{-1}A一弯Q等于
这样的一个对角阵
恰好是一个对角阵
这是A一弯
这个矩阵的Jordan标准形
那么我们用u1u2作为列向量
构成的矩阵去乘以Q
乘出来它的列向量我们叫w1w2
那么乘出来
恰好是这样的两个向量
这是我们w1 这是我们的w2
那A去乘以w1 w2作为列向量
构成这个矩阵
等于w1 w2去乘以这是J
就是A一弯的Jordan标准形
这是我们第一步做的事情
对于这个简单的矩阵A
来又过了一遍
好 第二步
我们假设说A的列空间
C(A)和A的零空间的交集的维数
是等于p
那么设w
是在这个交集中的一个元素
因为w它是属于C(A)里头
它可以写成
A的列空间的线性组合
也就是我们一定会存在着一个y
使得w等于Ay
因此w
一定属于一个长度大于1的链
那么这个交集的维数
是等于p维的话
那我们就会存在着p条链
长在C(A)里
它的首项是属于lambda 0的特征向量
我们来特别地看一下
假设w1到wk
是其中的一条这样的链
那它的第一项
是属于lambda等于0的特征向量
Aw1等于0 Aw2等于w1
Awk等于wk-1
由于wk是长在C(A)里头
因此一定会存在一个元素wk+1
使得Awk+1是等于wk的
于是我们原来的这条
有k个元素的链w1 wk
就被扩充成w1 wk wk+1
因此这一步就把第一步中的
有p条链提供了p个新的向量
我们把这p个新的向量
叫做y1到yp
某一个w k+1是某一个y
我们一共有p个这样的向量
好 在下面的例子里头
我们可以看得出来说
C(A)和N(A)的交
它是一个1维的子空间
我们可以取出的基底
说它是由w2给张出来的
那么对于这样的w2
我们总存在y
使得Ay等于w2
这样w2这条链就扩充成w2 y
这条新的链
那么A w1 w2 y就等于w1 w2 y
这个以它们为列向量构成的矩阵
去乘以这个新的一个3阶矩阵
那么这时候相当于是说
这是我们的Jordan标准形
2这块呢是特征值2
所对应的一个1阶的Jordan块
这部分呢是特征值0
所对应的2阶的Jordan块
它对应的链是w2 y
这是w1所对应的
我们有两条链
对应出来两个Jordan块
这两个链里头
打头的都是特征向量
好 那我们就把
以w1 w2 y作为列向量
所构成的这个矩阵记成是P矩阵
那么我们就有P逆AP
等于A的Jordan标准形
那假设说A的零空间的维数
要大于P
也就是n-r要大于p
那我们还需要找出来
n-r-p个N(A)中的线性无关的向量
长在N(A)里头
又不在N(A)和C(A)的交集里头
这样整个地凑出来n个向量
它们作为这个空间的好基底
使得A在这组基底下
能够变成Jordan标准形
我们把这n-r-p个N(A)中
线性无关的向量
叫做是Z1到Zn-r-p
它们将产生n-r-p个1阶的Jordan块
因为它长在N(A)里头
它是0所对应的Jordan块
我们断言说这样得到的n个向量
wi yj 和zk
它们一定是线性无关的
因此以它们作为列向量
可以构成一个可逆矩阵P
那P逆AP就等于J
是A的Jordan标准形
而如果矩阵A
没有零特征值的时候
刚才已经提到过
我们可以任意取出来
A的一个特征值lambda
用新的矩阵A’等于A-lambda I
这样一个有零特征值的矩阵
来取代刚才A这个矩阵
那可以得到一个可逆矩阵P
使得P^{-1}A’P等于J’
是A’的Jordan标准形
于是呢对于原来的矩阵A
它等于A’加上lambdaI
我们就有同样的可逆矩阵P
P^{-1}AP
把A和A’的关系代lambda
那么P^{-1}AP它的Jordan标准形
是J’加lambdaI
这是A的Jordan标准形
所以我们只需要来看一下
这个断言的证明
我们断言说刚才得到的
第一步得到的wi
第二步得到的yj
和第三步得到的zk这些
n个向量是线性无关的
那要证明这一点
我们任取它的一个线性组合
我们组合系数分别记成
Ci dj和ek 它等于0
我们需要说明
这些个组合系数是等于0
我们对这个式子的两端
去左乘以矩阵A
那我们说wi它长在C(A)里头
有好的性质
说A去乘以wi
要么是lambda i wi
要么是lambda i wi加上w i-1
yj呢 A去作用在yj上
是等于某一个wj
这个wj是长在以零特征值
所对应的特征向量的链的最上端
那么它一定不是下行之后
得到的在这部分里头的w
相应的w
Azk是等于0的
它长在N(A)里头
因此Azk是等于0
于是我们上面这个式子
左乘以矩阵A以后
就得到了
互不相同的一些wi的线性组合
由于wi它是在C(A)里头的基底
它们线性无关
所以在这个表达式里头
这个dj都是等于0的
相应的这些
把相同的wi合在一起
那么它前面的系数也等于0
我们不管它
我们只看这个系数
我们说这个系数一定是等于0
因为我们说Ayj是特殊的wj
在lambda等于0所对应的链的末尾
它不会出现在第一项中
所以上式的左边
是互不相同的wi的某个线性组合
又因为wi是C(A)的一组基
线性无关
所以我们特别的得到dj
这些系数是等于0的
于是第一个式子
就可以化成ciwi的和
等于ekzk的和再取负号
把它移到右手边来
那么一边这个是长在C(A)里头
一边是长在N(A)
又不长在N(A)和C(A)的交集里头
因此我们一定有这个ek是等于0的
那再把ek等于0这件事情
代回到这个表达式里头
我们就得到右手边这儿是0
那左手边是wi
它的一个线性组合
又因为wi是线性无关的
所以它的系数ci也等于0
这样我们刚才的这个表达式里
这些系数都等于0
因此这n个向量是线性无关的
合在一起我们就证明了定理
我们再来看一个例子
矩阵A
是给定的这样的一个4阶的矩阵
我们要求可逆矩阵P
使得P^{-1}AP是A的Jordan标准形
我们容易求得A有特征值 是1
这是一个4重的特征值
我们用第一步
因为特征值都等于1
所以我们想拿这个A-I
来变出一个新的矩阵A’
它有零特征值
重复第一步的过程
我们对这个A’
来取它的列空间的一组基底
u1和u2
那么我们注意到A’去乘以u1
等于3 1 3 1这个向量
它是等于3u1-u2
A’u2等于9u1-3u2
那么用矩阵语言描述出来
是A’u1u2
等于u1u2去乘以3 9 -1 -3
这个矩阵
这是我们第一步做的事情
我们把这个2乘2的矩阵记成是B
我们可以找到一个可逆矩阵Q
使得Q^{-1}BQ
等于B这个矩阵的Jordan标准形
那么也就是说
A’去乘以u1u2作为列向量
构成的矩阵再乘以Q等于u1u2
作为列向量的这个矩阵乘以Q
再乘以B的Jordan标准形
那么我们把u1u2
作为列向量构成这个矩阵
和Q相乘
得到这个矩阵记成是新的矩阵
它的列向量是w1w2
那A’去乘以w1 w2
作为列向量构成的这个矩阵
就等于在这组基底下的矩阵
是Jordan标准形
好 那w1 w2是A’的属于lambda
等于0的一条链
好 我们第二步来看一下
我们说N(A’)和C(A’)的交集
这个子空间的维数是等于1
我们可以找出来
它的一个基底w1
我们刚才找到了w1 w2
我们说是一条链
那么w2是长在C(A’)里头
在这个链的最上端的这个w2
说总存在着y这个向量
使得A’y等于w2
我们把y叫做是w3
那么A’去乘以w1 w2 w3
分别用w1 w2 w3去线性表示
表示出来就是这个Jordan标准形
表示出来
就是这样的一个3乘3的矩阵
这样我们在第二步里头
把原来的链给又增加了一个长度
好 在第三步里头
我们说看在A’的零空间里头
我们发现它存在不在这个零空间
和列空间交集中的元素
它的这时候维数
这个空间的维数是等于1的
那我们在这里头
找出来一个非零向量我们叫做z
于是把刚才找到的这个链
w1 w2 w2和你在第三步里
找出来z这个向量放在一起
那么构成整个空间的一组基底
在这组基底下A’的矩阵表示
是这样的两个Jordan块
对于z对应着一个1阶的Jordan块0
然后w1 w2 w3这条链
对应出来的是一个3阶的以特征值
0为对角元的一个Jordan块
我们就把w1 w2 w3 z
作为列向量所构成的这个矩阵
叫做P
再回到原来的A矩阵
A矩阵等于A’加上单位阵
因此我们有
P^{-1}AP等于A的Jordan标准形
好 这样我们对刚才的4阶矩阵A
重复了我们在定理证明中的
三个步骤
而得到了过渡矩阵P
得到了A的Jordan标准形J
更进一步我们有下面的结论
我们说
一个n阶的复矩阵的Jordan标准形中
主对角元为特征值
lambda i的Jordan块的个数ti
它是等于n减掉A-lambda i I的
这个矩阵的秩
其中每个Jordan块的阶数
不超过lambda i的代数重数
m阶Jordan块的个数di
是等于A-lambda i I的m-1次幂的秩
再加上A-lambda i I的m+1节次幂的秩
再减2倍的A-lambda i I m次幂的秩
那我们说回顾Jordan标准形
生成的过程
实际上呢它是找这个向量链
xi使得它满足Axi等于lambda i xi
A xi等于lambda i xi再加上x i-1
这种性质的过程
也就是说广义特征向量的过程
每一条向量链
对应着一个Jordan块
起始向量是一个特征向量
因此Jordan块的个数它等于属于
lambda的线性无关的特征向量的数目
而属于lambda特征向量的这个
线性无关的这个数目是A-lambda i I
这个矩阵的零空间的维数
也就是n减掉它的秩
在第二个公式里头
我们需要用到幂零变换的语言
会更好解释
我们暂且在这里不去证明
我们到后面去看
我们看下面这个简单的例子
A是一个以3为对角元的上三角阵
我们来看看
它的Jordan标准形的形状
那显然A的特征值是3
是一个4重的特征值
容易看到A减掉3I
这个矩阵的秩是等于2
因此这个矩阵的零空间的维数
是等于n减掉2
是等于4-2等于2的
所以A
有两个线性无关的特征向量
那么A的Jordan标准形里头
就有两个Jordan块
那这两个Jordan块
它长在这个4阶矩阵里头
它的阶数可能是1 3
也可能是2 2
那由于A减掉3I的平方是等于0
因此我们知道
这个1阶的Jordan块的个数
根据刚才的这个公式
我们说是等于
A减掉3I的零次幂的秩
我们说这个矩阵是4阶的单位阵
因此它的秩是4
再加上A-3I括号平方
这个矩阵的秩
这个矩阵我们说是零矩阵
因此秩是等于0
A减掉3I这个矩阵的秩是等于2
2去乘以2是4
因此得到d1是等于0的
那1阶的Jordan块的个数是等于0
那么它的Jordan标准形
与Jordan块的个数只能是
它的阶数是2 2的情况
所以A的Jordan标准形
一定是两个Jordan块
那阶数分别是2 2
因此它的Jordan标准形
是这种样子
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语