当前课程知识点:简明线性代数 > 第7章 矩阵的特征值理论 > 7-4 矩阵的对角化问题 > 7-4 矩阵的对角化问题
同学们 大家好
欢迎来到MOOC课程
线性代数先修课
第7章 矩阵的特征值理论
7.4节 矩阵的对角化问题
接着上一讲提出的
矩阵相似对角化的问题
在本讲中
我们将首先
对给定矩阵讨论其
可对角化的充要条件
进一步利用特征值理论
我们将给出
矩阵对角化的
具体步骤和方法
最后我们给出
几个矩阵对角化的
简单应用
首先
我们还是来回顾一下
上讲提出的问题
也就是对于任意给定的
方阵A是否存在
可逆阵P与对角阵Λ
使得P逆AP=Λ
如果存在如何确定
可逆阵P与对角阵Λ
我们先来简单分析一下
当A有n个互不相同的
实特征值的时候
满足上述关系的
可逆阵P与对角阵Λ是存在的
并且Λ包含了A的特征值的信息
P包含了A的特征向量的信息
但是这只是从一种特殊情况
推出的充分条件
在本节中
我们将讨论一般方阵
可对角化的充分必要条件
它与矩阵的特征值
与特征向量有密切的关系
具体有如下的结论
第一 矩阵可对角化的条件
定理1 n阶方阵A的
可对角化的充要条件
是A有n个线性无关的特征向量
首先我们来证明必要性
设n阶方阵A可对角化
则由可逆矩阵P
使得P逆AP=对角阵
其中我们设对角阵中
主对角线上的元素
分别为λ1 λ2到λn
于是我们令P
等于X1 X2到Xn构成的矩阵
而大Λ就是上述对角阵
则上式可以写为AP=PΛ的形式
进一步对于等式左边
我们把A乘到P的
每一个列向量上
就得到了这样的形式
对于等式的右边
我们把它写为这样的形式
那么由于右乘以一个对角阵
相当于对原矩阵
进行列的倍乘变化
因此它可以写为λ1倍的X1
λ2倍的X2
一直到λn倍的Xn
并起来得到的一个矩阵
那么对比上式左边和右边
我们就得到了这样的n个等式
也即A乘以Xi等于λi乘以Xi
由于P是可逆阵
所以它的每一个列向量
Xi均不能为0向量
因此这n个式子就说明了
Xi均为A的特征向量
并且线性无关
下面我们来证明充分性
假设A有n个
线性无关的特征向量
记为X1 X2到Xn
设它们对应的特征值
分别为λ1 λ2到λn
则根据定义
我们有如下的n个等式
进一步我们令P是由
X1 X2到Xn作为
列向量构成的矩阵
则由于X1到Xn
是线性无关的
于是P就是一个可逆阵
并且我们把上述
n个等式按列的方式排起来
就得到了这样的一个矩阵等式
其中这个等式的
左边就等于A乘以P
而右边就可以表为这样的形式
进而我们把黄色方框里的
这个对角阵设为Λ
从而右边就等于P乘Λ
那么由P是可逆的
我们就可以得到
P逆乘以A再乘以P
等于对角阵Λ
也就是A可以在
相似意义下对角化
从而我们就证明了定理1
由于属于不同特征值的
特征向量是线性无关的
故当A有个n个
互异的特征值的时候
每一个特征值
至少有一个特征向量
于是这n个特征向量
必然线性无关
从而我们就有如下的推论1
即若n阶方阵A
有n个互异的特征值
则A可对角化
此外
从定理1的证明过程
我们还知道
A可否对角化
与它的特征值
与特征向量有密切的关系
具体来说
我们有如下的推论2
若n阶方阵A可对角化
即存在可逆阵P与对角阵Λ
满足P逆AP=Λ的话
则Λ对角线上的n个元素
即为A的n个特征值λi
而可逆阵P的n个列向量Xi
即为属于λi的特征向量
实际上
推论2已经为我们给出了
判断和求解
矩阵对角化问题的具体方法
二 矩阵对角化的方法
先从具体的例子着手
例1 试判断下列矩阵
能否对角化
如能对角化
求出可逆阵P与对角阵Λ
其中我们令A为这样的
两个具体的三阶矩阵
对于第一个矩阵
我们先来求A的特征值
首先列出它的特征多项式
并且计算这个三阶行列式的值
通过初等行变换
我们可以得到这样的形式
进而对这个行列式
按第一列展开
于是它的值是跟
黄色方框里的行列式有关系
从而推出了A的特征多项式
等于这样的形式
也即λ减1的平方再乘以λ减4
所以我们就得到了
A的特征为λ1=1
并且其代数重数为2
而λ2=4 其代数重数为1
进一步我们再来求
A的特征向量
对于特征值λ=1
我们去求解对应的
齐次线性方程组
并且把系数矩阵列出
经过初等行变换化为
简化的阶梯形
我们发现只有1个主元素
因此很容易得到
属于特征值λ=1的
两个线性无关的特征向量
就是这样的两个向量
我们分别把他们
记为X11和X12
对于特征值λ2=4
把它代入到对应的
齐次线性方程组
并且把系数矩阵
按初等行变换化为
简化的阶梯矩阵的形式
也就是最右边的这个矩阵
于是我们发现它有两个主元素
从而它的自由变量有1个
因此得到属于λ2=4的
一个线性无关的特征向量
就为这样的一个向量
我们把它记为X21
因此A存在3个
线性无关的特征向量
也即X11 X12和X21
所以根据定理1
我们知道A可以对角化
并且可逆矩阵P
就是把这三个特征向量
按列的方式并起来得到的矩阵
而对角矩阵Λ就是
主对角线上为三个特征值的
对角矩阵
这里我们可以直接地去验证
三个特征向量
是线性无关的
也可以利用
上一讲当中的定理3的结论
来说明这3个
特征向量是线性无关
对于第二个3阶矩阵
我们计算其特征多项式
得到这样的形式
从而可以知道对于这个矩阵A
它有两个不同的特征值
其中λ1=1
其代数重数等于2
而λ2=2
其代数重数等于1
对于第一个特征值λ1=1
去求解对应的齐次线性方程组
并且把系数矩阵
经过初等行变换
化为简化的阶梯形
就是这个样子
我们会发现
它有如下黄色方框中的
两个主元素
于是它的自由变量就只有1个
从而就推出它
只有1个线性无关的特征向量
就是记为X1
而对于特征值λ2=2
去求解对应的齐次线性方程组
具体来说就是把系数矩阵经过
初等行变换化为
这样的简化阶梯型
从而我们会发现
它有两个这样的主元素
因此很容易得到
属于特征值λ2=2的
一个线性无关的特征向量
就是这样的一个向量
我们把它记为X2
那么对于A的任意一个特征向量
要么它属于λ1
从而就是X1的倍数
要么它属于λ2
从而就是X2的倍数
故A的线性无关的
特征向量最多就是两个
那么由定理1知道
这个A就不可对角化
总结一下
得到对给定的
n阶方阵A的对角化的
具体步骤如下
第一步 分解特征多项式
求A的特征值
具体地
我们可以设A的特征多项式
有这样的标准分解
其中λ1 λ2到λs
为A的互异的特征值
其代数重数分别为
上述分解式当中的指数
n1 n2一直到ns
第二部 对每一个特征值λi
分别计算特征向量
也即求解对应的
齐次线性方程组
λi乘I减A再乘X等于0
利用高斯消元法
得到一组基础解系
记为Xi1 Xi2到Ximi
其中mi为λi的几何重数
第三步 判断是否可对角化
如果m1加m2一直加到ms
小于矩阵的阶数n的话
则A不可对角化
计算停止
否则也就是若m1
加到ms等于n的话
则进行下一步
第四步
得到可逆矩阵P与对角阵Λ
其中可逆矩阵P
就是把刚才所得到的
特征向量并起来得到的n阶矩阵
而对角阵Λ就是
把刚才每一个特征向量
所对应的特征值列出来即可
具体来说由于P中
有m1个属于λ1的特征向量
于是对角阵当中对应列上
就给出m1个λ1
同样的道理
由于可逆阵P中
有ms个属于λs的特征向量
所以对应列中
就列出ms个特征值λs
我们把刚才的步骤
用流程图表示如下
第一步给定n阶方阵A
第二步分解特征多项式
求得s个互异的特征值
其中特征值λ1是n1重的
特征值λ2是n2重的
一直到特征值λs是ns重的
对于每一个特征值
我们去求解属于它的特征向量
也即去求解对应的
齐次线性方程组的基础解系
我们不妨把λ1所属的
基础解系记为X11 X12
一直到X1m1
而对于特征值λ2所属的
齐次线性方程组的基础解系
为X21一直到X2m2
以此类推
可以得到λs所对应的
齐次线性方程的基础解系
为Xs1到Xsms
进一步我们去计算
上述所得到的特征向量的总数
也就是去计算m1加m2
一直加到ms是否等于n
如果小于n
则得出结论A不可对角化
计算停止
如果等于n
则得到结论A可对角化
并且把上述所得到的
所有特征向量并起来
就得到可逆阵P
并且把上述所有的
特征值按几何重数并起来
就得到了对应的对角阵大Λ
这就是矩阵对角化的流程图
对于上述过程
我们做如下的几点说明
第一点
我们首先要说明
m1加m2一直加到ms是
线性无关的特征向量的最大个数
为了说明这一点
我们先从一个方面来看
由于Xi1到Ximi是
方程组λi乘单位阵再减A
再乘以X等于0的基础解系
故它们是线性无关的
又由于不同特征值下的
特征向量是线性无关的
利用7.2节当中的定理3
我们就知道
把上述所有基础解系
并起来得到的向量组
我们把它记为*式
则*式所对应的向量组
是线性无关的
另一方面
对于A的任意特征向量X
设X属于特征值λj
于是X一定可以由
Xj1 Xj2一直到Xjmj线性表出
因此向量组*式
就是A的全体特征向量集合的
一个极大线性无关组
从而m1加m2一直加到ms
就是线性无关的特征向量的
最大个数
简言之 我们上述的计算过程
就是在局部上
对于每一个特征值λi
找出个数最多的
线性无关的特征向量
合并起来就得到了
整体上A的个数最多的
线性无关的特征向量组
第二点 我们要提出一个问题
即对每一个特征值λi
其几何重数mi可取到多大呢
实际上我们可以证明
mi的上界就是ni
也就是说对每个特征值λi而言
其几何重数小于等于其代数重数
出于篇幅和结构的考虑
我们在这略去证明
对于证明的细节
请感兴趣的同学
查阅相关的教材和资料
那么又因为n1加n2
一直加到ns等于n
于是我们就可以得到
阵可对角化的
另一个充要条件
也就是我们的定理2
即n阶方阵A可对角化
当且仅当对于它的
每一个特征值而言
它的几何重数均等于其代数重数
例如在本节之前的
例1当中的第2个矩阵
对于特征值λ1=1
它是A的特征多项式的2重根
所以它的代数重数等于2
而用高斯消元法
化简其对应齐次线性方程组的
系数矩阵的时候
发现λ1乘以I再减去A呢
它的秩等于2
因此说明它的几何重数
就等于3减2等1
从而它的几何重数
小于其代数重数
于是A不可对角化
这个和我们实际的
计算结果是一致的
那么我们也可以用定理2
来替换刚才流程图当中
那个判断的过程
也即我们把判断是否
可对角化的判则取为
是否对于所有的i满足mi=ni
与此同时把刚才
所有结论里的mi替换成ni
第三点 我们再来讨论一下
对角化后所得可逆阵P
与对角阵Λ的关系和唯一性
如果A可对角化
则由充要条件2我们可以知道
所有的mi均等于ni
并且也就是把所有的特征值
排列起来得到的对角阵
其中λ1有n1个 λ2有n2个
而λs有ns个
而可逆阵P就是把
对应的齐次线性方程组的
基础解系并起来得到的一个矩阵
其中我们要说明的是
P与Λ的列之间有对应原则
也就是黄色方框当中的
两个矩阵的列
上面取为n1个λ1
而下面就要取为
所有n1个属于λ1的特征向量
而第二个红色方框当中
上面取为λ2
则下面就要取为
所有属于λ2的
线性无关的特征向量
以此类推 蓝色方框当中
上面取λs
而下面就要取属于λs的
线性无关的特征向量
第二点
Λ主对角线上元素的全体
即为全体特征值
它们之间可以任意的交换次序
故Λ在不计主对角线上
元素次序的意义下是唯一的
而当Λ取定以后
P的列就按1当中的对应原则来取
但即使是在同一个特征值下
基础解系的次序也可以交换
比如说这里红色方框当中
我可以任意交换这些向量的次序
而在蓝色方框当中
我也可以交换这些向量的次序
不仅如此
每组基础解系还有不同的取法
也即特征子空间可有不同的基
因此可逆阵P的结果有约束
但是并不唯一
最后我们来看
矩阵对角化的简单应用
矩阵对角化的一个重要应用
就是用它来化简矩阵方幂的计算
具体如下
如A可对角化
则存在可逆阵P与对角阵Λ
使得P逆AP等于对角阵Λ
两边作k次方
我们就可以得到这样的结论
从而就得到了计算矩阵的
方幂的公式是这个样子的
例如在我们刚才
例1当中的第1个矩阵
我们已经讨论了它可以对角化
下面求它的k次方
利用刚才的计算结果
我们已经求出了可逆阵P
和对角阵Λ分别是这样的形式
那么为了计算A的k次方
我们还需要去计算P逆
P逆就按我们之前的方法
用初等行变换就可以计算出
黄色方框里的这一块
就是我们想求得P逆
从而我们代入公式
A的k次方就等于
P乘以Λ的k次方再乘以P逆
最后计算结果是这样的形式
经过观察 我们会发现
A的k次方与A均同为对称阵
下面再来看一个例子
若A为n阶方阵
且A可对角化
则请大家证明A的方幂
A的多项式均可对角化
进一步如果A可逆的话
则A逆和A的伴随也可对角化
具体证明如下
由A可对角化
则我们可得到这样的一个等式
从而根据我们刚才
A的方幂的计算公式
我们就可以得到
A的k次方也可对角化
再由矩阵乘法的分配率
我们就可以证明
A的多项式g(A)也可对角化
其化为的对角阵
对角线上每个元素就是
每个特征值对应的
多项式g(λ1) g(λ2)到g(λn)
进一步如果A可逆的话
那我们可以知道
A的特征值λi不为0
于是对于上述等式两边求逆
我们就可以得到
A逆也可以对角化
那么在这个等式的基础上
再利用A的伴随
和A逆之间的关系
我们可以得到这样的一个等式
而这个等式就说明A的伴随
也是可对角化的
本节的最后
我们再来看这样的一个例题
例3 设A为n阶方阵
且满足A的平方等于I
请证明A是可对角化的
那么我们简单分析下这个题目
题目给我们的信息量很少
只有1个A平方等于I的等式
那么我们要证明它可对角化
也就是要去证明
它符合对角化的充要条件
于是我们首先要
先分析其特征值及其特征向量
首先设λ是A的任一特征值
而X是λ所属的特征向量
则根据A所满足的代数关系
我们很容易推出λ
也满足这个代数关系
也就是λ平方也要等于1
从而就推出λ等于正负1
也就是说λ1=1
λ2等-1也就是
A两个可能的特征值
并且我们进一步设m1 m2
为它们所对应的几何重数
下面我们就是去计算
m1加m2是不是会等于n
由于它表示了对应的
齐次线性方程组的解空间的维数
因此它就等于括号里的
这两项相加
那么在展开以后就等于这个等式
其中为了将来方便计算
我们把A减I写为了I减A
由于多了一个负号
并不影响它们的秩
所以这个等式是成立的
那么由矩阵秩的相关结论
我们就可以得到
这样的一个不等式
其中第一个小于等于号是利用
两个矩阵相加的秩
要小于等于它们各自秩相加
而第二个小于等于号是因为
括号当中的这两个矩阵相乘
是等于零矩阵
那么利用我们之前的结论
两个矩阵相乘等于0
则它们的秩之和小于等于n
因此上面这个不等式的
左右两边均等于n
这说明A减I的秩
加上A加I的秩要等于n
那么再把这个等式
再代入到上面那个等式
我们就可以推出m1加m2等n
从而A可以对角化
我们就完成了例3的证明
本讲小结
在本讲中我们主要给出了
n阶方阵可对角化的
两个充分必要条件
第一个充要条件是
A具有n个线性无关的特征向量
也即所有几何重数之和等于n
第二个充要条件是
对所有特征值均有
几何重数mi等于代数重数ni
进一步我们利用特征值
与特征向量的理论
给出了将A对角化的
具体步骤和方法
需要强调的是所得到的
可逆阵P和对角阵
大Λ并非唯一的
它们的列之间有对应关系
交换它们其中一个的列
则另一个也随之
进行对应列的交换
最后我们给出了矩阵
可对角化的几个简单应用和例子
其中一个重要的应用就是
用来化简矩阵方幂的计算
本讲的内容就到这
我们下讲再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换