当前课程知识点:简明线性代数 >  第7章 矩阵的特征值理论 >  7-4 矩阵的对角化问题 >  7-4 矩阵的对角化问题

返回《简明线性代数》慕课在线视频课程列表

7-4 矩阵的对角化问题在线视频

7-4 矩阵的对角化问题

下一节:7-5 实对称阵的对角化

返回《简明线性代数》慕课在线视频列表

7-4 矩阵的对角化问题课程教案、知识点、字幕

同学们 大家好

欢迎来到MOOC课程

线性代数先修课

第7章 矩阵的特征值理论

7.4节 矩阵的对角化问题

接着上一讲提出的

矩阵相似对角化的问题

在本讲中

我们将首先

对给定矩阵讨论其

可对角化的充要条件

进一步利用特征值理论

我们将给出

矩阵对角化的

具体步骤和方法

最后我们给出

几个矩阵对角化的

简单应用

首先

我们还是来回顾一下

上讲提出的问题

也就是对于任意给定的

方阵A是否存在

可逆阵P与对角阵Λ

使得P逆AP=Λ

如果存在如何确定

可逆阵P与对角阵Λ

我们先来简单分析一下

当A有n个互不相同的

实特征值的时候

满足上述关系的

可逆阵P与对角阵Λ是存在的

并且Λ包含了A的特征值的信息

P包含了A的特征向量的信息

但是这只是从一种特殊情况

推出的充分条件

在本节中

我们将讨论一般方阵

可对角化的充分必要条件

它与矩阵的特征值

与特征向量有密切的关系

具体有如下的结论

第一 矩阵可对角化的条件

定理1 n阶方阵A的

可对角化的充要条件

是A有n个线性无关的特征向量

首先我们来证明必要性

设n阶方阵A可对角化

则由可逆矩阵P

使得P逆AP=对角阵

其中我们设对角阵中

主对角线上的元素

分别为λ1 λ2到λn

于是我们令P

等于X1 X2到Xn构成的矩阵

而大Λ就是上述对角阵

则上式可以写为AP=PΛ的形式

进一步对于等式左边

我们把A乘到P的

每一个列向量上

就得到了这样的形式

对于等式的右边

我们把它写为这样的形式

那么由于右乘以一个对角阵

相当于对原矩阵

进行列的倍乘变化

因此它可以写为λ1倍的X1

λ2倍的X2

一直到λn倍的Xn

并起来得到的一个矩阵

那么对比上式左边和右边

我们就得到了这样的n个等式

也即A乘以Xi等于λi乘以Xi

由于P是可逆阵

所以它的每一个列向量

Xi均不能为0向量

因此这n个式子就说明了

Xi均为A的特征向量

并且线性无关

下面我们来证明充分性

假设A有n个

线性无关的特征向量

记为X1 X2到Xn

设它们对应的特征值

分别为λ1 λ2到λn

则根据定义

我们有如下的n个等式

进一步我们令P是由

X1 X2到Xn作为

列向量构成的矩阵

则由于X1到Xn

是线性无关的

于是P就是一个可逆阵

并且我们把上述

n个等式按列的方式排起来

就得到了这样的一个矩阵等式

其中这个等式的

左边就等于A乘以P

而右边就可以表为这样的形式

进而我们把黄色方框里的

这个对角阵设为Λ

从而右边就等于P乘Λ

那么由P是可逆的

我们就可以得到

P逆乘以A再乘以P

等于对角阵Λ

也就是A可以在

相似意义下对角化

从而我们就证明了定理1

由于属于不同特征值的

特征向量是线性无关的

故当A有个n个

互异的特征值的时候

每一个特征值

至少有一个特征向量

于是这n个特征向量

必然线性无关

从而我们就有如下的推论1

即若n阶方阵A

有n个互异的特征值

则A可对角化

此外

从定理1的证明过程

我们还知道

A可否对角化

与它的特征值

与特征向量有密切的关系

具体来说

我们有如下的推论2

若n阶方阵A可对角化

即存在可逆阵P与对角阵Λ

满足P逆AP=Λ的话

则Λ对角线上的n个元素

即为A的n个特征值λi

而可逆阵P的n个列向量Xi

即为属于λi的特征向量

实际上

推论2已经为我们给出了

判断和求解

矩阵对角化问题的具体方法

二 矩阵对角化的方法

先从具体的例子着手

例1 试判断下列矩阵

能否对角化

如能对角化

求出可逆阵P与对角阵Λ

其中我们令A为这样的

两个具体的三阶矩阵

对于第一个矩阵

我们先来求A的特征值

首先列出它的特征多项式

并且计算这个三阶行列式的值

通过初等行变换

我们可以得到这样的形式

进而对这个行列式

按第一列展开

于是它的值是跟

黄色方框里的行列式有关系

从而推出了A的特征多项式

等于这样的形式

也即λ减1的平方再乘以λ减4

所以我们就得到了

A的特征为λ1=1

并且其代数重数为2

而λ2=4 其代数重数为1

进一步我们再来求

A的特征向量

对于特征值λ=1

我们去求解对应的

齐次线性方程组

并且把系数矩阵列出

经过初等行变换化为

简化的阶梯形

我们发现只有1个主元素

因此很容易得到

属于特征值λ=1的

两个线性无关的特征向量

就是这样的两个向量

我们分别把他们

记为X11和X12

对于特征值λ2=4

把它代入到对应的

齐次线性方程组

并且把系数矩阵

按初等行变换化为

简化的阶梯矩阵的形式

也就是最右边的这个矩阵

于是我们发现它有两个主元素

从而它的自由变量有1个

因此得到属于λ2=4的

一个线性无关的特征向量

就为这样的一个向量

我们把它记为X21

因此A存在3个

线性无关的特征向量

也即X11 X12和X21

所以根据定理1

我们知道A可以对角化

并且可逆矩阵P

就是把这三个特征向量

按列的方式并起来得到的矩阵

而对角矩阵Λ就是

主对角线上为三个特征值的

对角矩阵

这里我们可以直接地去验证

三个特征向量

是线性无关的

也可以利用

上一讲当中的定理3的结论

来说明这3个

特征向量是线性无关

对于第二个3阶矩阵

我们计算其特征多项式

得到这样的形式

从而可以知道对于这个矩阵A

它有两个不同的特征值

其中λ1=1

其代数重数等于2

而λ2=2

其代数重数等于1

对于第一个特征值λ1=1

去求解对应的齐次线性方程组

并且把系数矩阵

经过初等行变换

化为简化的阶梯形

就是这个样子

我们会发现

它有如下黄色方框中的

两个主元素

于是它的自由变量就只有1个

从而就推出它

只有1个线性无关的特征向量

就是记为X1

而对于特征值λ2=2

去求解对应的齐次线性方程组

具体来说就是把系数矩阵经过

初等行变换化为

这样的简化阶梯型

从而我们会发现

它有两个这样的主元素

因此很容易得到

属于特征值λ2=2的

一个线性无关的特征向量

就是这样的一个向量

我们把它记为X2

那么对于A的任意一个特征向量

要么它属于λ1

从而就是X1的倍数

要么它属于λ2

从而就是X2的倍数

故A的线性无关的

特征向量最多就是两个

那么由定理1知道

这个A就不可对角化

总结一下

得到对给定的

n阶方阵A的对角化的

具体步骤如下

第一步 分解特征多项式

求A的特征值

具体地

我们可以设A的特征多项式

有这样的标准分解

其中λ1 λ2到λs

为A的互异的特征值

其代数重数分别为

上述分解式当中的指数

n1 n2一直到ns

第二部 对每一个特征值λi

分别计算特征向量

也即求解对应的

齐次线性方程组

λi乘I减A再乘X等于0

利用高斯消元法

得到一组基础解系

记为Xi1 Xi2到Ximi

其中mi为λi的几何重数

第三步 判断是否可对角化

如果m1加m2一直加到ms

小于矩阵的阶数n的话

则A不可对角化

计算停止

否则也就是若m1

加到ms等于n的话

则进行下一步

第四步

得到可逆矩阵P与对角阵Λ

其中可逆矩阵P

就是把刚才所得到的

特征向量并起来得到的n阶矩阵

而对角阵Λ就是

把刚才每一个特征向量

所对应的特征值列出来即可

具体来说由于P中

有m1个属于λ1的特征向量

于是对角阵当中对应列上

就给出m1个λ1

同样的道理

由于可逆阵P中

有ms个属于λs的特征向量

所以对应列中

就列出ms个特征值λs

我们把刚才的步骤

用流程图表示如下

第一步给定n阶方阵A

第二步分解特征多项式

求得s个互异的特征值

其中特征值λ1是n1重的

特征值λ2是n2重的

一直到特征值λs是ns重的

对于每一个特征值

我们去求解属于它的特征向量

也即去求解对应的

齐次线性方程组的基础解系

我们不妨把λ1所属的

基础解系记为X11 X12

一直到X1m1

而对于特征值λ2所属的

齐次线性方程组的基础解系

为X21一直到X2m2

以此类推

可以得到λs所对应的

齐次线性方程的基础解系

为Xs1到Xsms

进一步我们去计算

上述所得到的特征向量的总数

也就是去计算m1加m2

一直加到ms是否等于n

如果小于n

则得出结论A不可对角化

计算停止

如果等于n

则得到结论A可对角化

并且把上述所得到的

所有特征向量并起来

就得到可逆阵P

并且把上述所有的

特征值按几何重数并起来

就得到了对应的对角阵大Λ

这就是矩阵对角化的流程图

对于上述过程

我们做如下的几点说明

第一点

我们首先要说明

m1加m2一直加到ms是

线性无关的特征向量的最大个数

为了说明这一点

我们先从一个方面来看

由于Xi1到Ximi是

方程组λi乘单位阵再减A

再乘以X等于0的基础解系

故它们是线性无关的

又由于不同特征值下的

特征向量是线性无关的

利用7.2节当中的定理3

我们就知道

把上述所有基础解系

并起来得到的向量组

我们把它记为*式

则*式所对应的向量组

是线性无关的

另一方面

对于A的任意特征向量X

设X属于特征值λj

于是X一定可以由

Xj1 Xj2一直到Xjmj线性表出

因此向量组*式

就是A的全体特征向量集合的

一个极大线性无关组

从而m1加m2一直加到ms

就是线性无关的特征向量的

最大个数

简言之 我们上述的计算过程

就是在局部上

对于每一个特征值λi

找出个数最多的

线性无关的特征向量

合并起来就得到了

整体上A的个数最多的

线性无关的特征向量组

第二点 我们要提出一个问题

即对每一个特征值λi

其几何重数mi可取到多大呢

实际上我们可以证明

mi的上界就是ni

也就是说对每个特征值λi而言

其几何重数小于等于其代数重数

出于篇幅和结构的考虑

我们在这略去证明

对于证明的细节

请感兴趣的同学

查阅相关的教材和资料

那么又因为n1加n2

一直加到ns等于n

于是我们就可以得到

阵可对角化的

另一个充要条件

也就是我们的定理2

即n阶方阵A可对角化

当且仅当对于它的

每一个特征值而言

它的几何重数均等于其代数重数

例如在本节之前的

例1当中的第2个矩阵

对于特征值λ1=1

它是A的特征多项式的2重根

所以它的代数重数等于2

而用高斯消元法

化简其对应齐次线性方程组的

系数矩阵的时候

发现λ1乘以I再减去A呢

它的秩等于2

因此说明它的几何重数

就等于3减2等1

从而它的几何重数

小于其代数重数

于是A不可对角化

这个和我们实际的

计算结果是一致的

那么我们也可以用定理2

来替换刚才流程图当中

那个判断的过程

也即我们把判断是否

可对角化的判则取为

是否对于所有的i满足mi=ni

与此同时把刚才

所有结论里的mi替换成ni

第三点 我们再来讨论一下

对角化后所得可逆阵P

与对角阵Λ的关系和唯一性

如果A可对角化

则由充要条件2我们可以知道

所有的mi均等于ni

并且也就是把所有的特征值

排列起来得到的对角阵

其中λ1有n1个 λ2有n2个

而λs有ns个

而可逆阵P就是把

对应的齐次线性方程组的

基础解系并起来得到的一个矩阵

其中我们要说明的是

P与Λ的列之间有对应原则

也就是黄色方框当中的

两个矩阵的列

上面取为n1个λ1

而下面就要取为

所有n1个属于λ1的特征向量

而第二个红色方框当中

上面取为λ2

则下面就要取为

所有属于λ2的

线性无关的特征向量

以此类推 蓝色方框当中

上面取λs

而下面就要取属于λs的

线性无关的特征向量

第二点

Λ主对角线上元素的全体

即为全体特征值

它们之间可以任意的交换次序

故Λ在不计主对角线上

元素次序的意义下是唯一的

而当Λ取定以后

P的列就按1当中的对应原则来取

但即使是在同一个特征值下

基础解系的次序也可以交换

比如说这里红色方框当中

我可以任意交换这些向量的次序

而在蓝色方框当中

我也可以交换这些向量的次序

不仅如此

每组基础解系还有不同的取法

也即特征子空间可有不同的基

因此可逆阵P的结果有约束

但是并不唯一

最后我们来看

矩阵对角化的简单应用

矩阵对角化的一个重要应用

就是用它来化简矩阵方幂的计算

具体如下

如A可对角化

则存在可逆阵P与对角阵Λ

使得P逆AP等于对角阵Λ

两边作k次方

我们就可以得到这样的结论

从而就得到了计算矩阵的

方幂的公式是这个样子的

例如在我们刚才

例1当中的第1个矩阵

我们已经讨论了它可以对角化

下面求它的k次方

利用刚才的计算结果

我们已经求出了可逆阵P

和对角阵Λ分别是这样的形式

那么为了计算A的k次方

我们还需要去计算P逆

P逆就按我们之前的方法

用初等行变换就可以计算出

黄色方框里的这一块

就是我们想求得P逆

从而我们代入公式

A的k次方就等于

P乘以Λ的k次方再乘以P逆

最后计算结果是这样的形式

经过观察 我们会发现

A的k次方与A均同为对称阵

下面再来看一个例子

若A为n阶方阵

且A可对角化

则请大家证明A的方幂

A的多项式均可对角化

进一步如果A可逆的话

则A逆和A的伴随也可对角化

具体证明如下

由A可对角化

则我们可得到这样的一个等式

从而根据我们刚才

A的方幂的计算公式

我们就可以得到

A的k次方也可对角化

再由矩阵乘法的分配率

我们就可以证明

A的多项式g(A)也可对角化

其化为的对角阵

对角线上每个元素就是

每个特征值对应的

多项式g(λ1) g(λ2)到g(λn)

进一步如果A可逆的话

那我们可以知道

A的特征值λi不为0

于是对于上述等式两边求逆

我们就可以得到

A逆也可以对角化

那么在这个等式的基础上

再利用A的伴随

和A逆之间的关系

我们可以得到这样的一个等式

而这个等式就说明A的伴随

也是可对角化的

本节的最后

我们再来看这样的一个例题

例3 设A为n阶方阵

且满足A的平方等于I

请证明A是可对角化的

那么我们简单分析下这个题目

题目给我们的信息量很少

只有1个A平方等于I的等式

那么我们要证明它可对角化

也就是要去证明

它符合对角化的充要条件

于是我们首先要

先分析其特征值及其特征向量

首先设λ是A的任一特征值

而X是λ所属的特征向量

则根据A所满足的代数关系

我们很容易推出λ

也满足这个代数关系

也就是λ平方也要等于1

从而就推出λ等于正负1

也就是说λ1=1

λ2等-1也就是

A两个可能的特征值

并且我们进一步设m1 m2

为它们所对应的几何重数

下面我们就是去计算

m1加m2是不是会等于n

由于它表示了对应的

齐次线性方程组的解空间的维数

因此它就等于括号里的

这两项相加

那么在展开以后就等于这个等式

其中为了将来方便计算

我们把A减I写为了I减A

由于多了一个负号

并不影响它们的秩

所以这个等式是成立的

那么由矩阵秩的相关结论

我们就可以得到

这样的一个不等式

其中第一个小于等于号是利用

两个矩阵相加的秩

要小于等于它们各自秩相加

而第二个小于等于号是因为

括号当中的这两个矩阵相乘

是等于零矩阵

那么利用我们之前的结论

两个矩阵相乘等于0

则它们的秩之和小于等于n

因此上面这个不等式的

左右两边均等于n

这说明A减I的秩

加上A加I的秩要等于n

那么再把这个等式

再代入到上面那个等式

我们就可以推出m1加m2等n

从而A可以对角化

我们就完成了例3的证明

本讲小结

在本讲中我们主要给出了

n阶方阵可对角化的

两个充分必要条件

第一个充要条件是

A具有n个线性无关的特征向量

也即所有几何重数之和等于n

第二个充要条件是

对所有特征值均有

几何重数mi等于代数重数ni

进一步我们利用特征值

与特征向量的理论

给出了将A对角化的

具体步骤和方法

需要强调的是所得到的

可逆阵P和对角阵

大Λ并非唯一的

它们的列之间有对应关系

交换它们其中一个的列

则另一个也随之

进行对应列的交换

最后我们给出了矩阵

可对角化的几个简单应用和例子

其中一个重要的应用就是

用来化简矩阵方幂的计算

本讲的内容就到这

我们下讲再见

简明线性代数课程列表:

第0章 序论 · 开篇

-宣传片

--宣传片

-序论

--序论

第1章 线性方程组

-1-1 二元、三元一次方程组

--1-1 二元、三元一次方程组

-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法

-1-2 一般线性方程组的解法:Gauss消元法

--1-2 一般线性方程组的解法:Gauss消元法

-第1章 线性方程组--1-3 线性方程组解的判定

-1-3 线性方程组解的判定

--1-3 线性方程组解的判定

-第1章 线性方程组--1-4 齐次线性方程组

-1-4 齐次线性方程组

--1-4 齐次线性方程组

第2章 行列式

-第2章 行列式--2-1 二阶、三阶行列式的性质

-2-1 二阶、三阶行列式的性质

--2-1 二阶、三阶行列式的性质

-第2章 行列式--2-2 n元排列

-2-2 n元排列

--2-2 n元排列

-第2章 行列式--2-3 n阶行列式的定义

-2-3 n阶行列式的定义

--2-3 n阶行列式的定义

-第2章 行列式--2-4 行列式的性质

-2-4 行列式的性质

--2-4 行列式的性质

-第2章 行列式--2-5 行列式的计算1-利用性质

-2-5 行列式的计算1-利用性质

--Video

-第2章 行列式--2-6 行列式的展开公式

-2-6 行列式的展开公式

--2-6 行列式的展开公式

-第2章 行列式--2-7 行列式的计算2-综合

-2-7 行列式的计算2-综合

--2-7 行列式的计算2-综合

-第2章 行列式--2-8 Cramer法则

-2-8 Cramer法则

--2-8 Cramer法则

第3章 矩阵

-第3章 矩阵--3-1 矩阵及其线性运算

-3-1 矩阵及其线性运算

--3-1 矩阵及其线性运算

-第3章 矩阵--3-2 矩阵的乘法

-3-2 矩阵的乘法

--3-2 矩阵的乘法

-第3章 矩阵--3-3 矩阵的其他运算

-3-3 矩阵的其他运算

--3-3 矩阵的其他运算

-第3章 矩阵--3-4 分块矩阵

-3-4 分块矩阵

--3-4 分块矩阵

-第3章 矩阵--3-5 初等矩阵

-3-5 初等矩阵

--3-5 初等矩阵

-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件

-3-6 逆矩阵及矩阵可逆条件

--3-6 逆矩阵及矩阵可逆条件

-第3章 矩阵--3-7 逆矩阵的求法

-3-7 逆矩阵的求法

--3-7 逆矩阵的求法

第4章 向量空间

-第4章 向量空间--4-1 n维向量空间

-4-1 n维向量空间

--4-1 n维向量空间

-第4章 向量空间--4-2 向量组的线性相关性

-4-2 向量组的线性相关性

--4-2 向量组的线性相关性

-第4章 向量空间--4-3 线性相关性的更多理论

-4-3 线性相关性的更多理论

--4-3 线性相关性的更多理论

-第4章 向量空间--4-4 极大线性无关组

-4-4 极大线性无关组

--4-4 极大线性无关组

-第4章 向量空间--4-5 向量组的秩

-4-5 向量组的秩

--4-5 向量组的秩

-第4章 向量空间--4-6 矩阵的秩

-4-6 矩阵的秩

--Video

-第4章 向量空间--4-7 矩阵秩的运算律与相关结论

-4-7 矩阵秩的运算律与相关结论

--4-7 矩阵秩的求法

第5章 线性方程组的解理论

-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论

-5-1 齐次线性方程组的解理论

--5-1 齐次线性方程组的解理论

-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论

-5-2 非齐次线性方程组的解理论

--5-2 非齐次线性方程组的解理论

-第5章 线性方程组的解理论--5-3 线性方程组的几何意义

-5-3 线性方程组的几何意义

--5-3 线性方程组的几何意义

-第5章 线性方程组的解理论--5-4 矩阵方程

-5-4 矩阵方程

--5-4 矩阵方程的求解

第6章 内积空间

-第6章 内积空间--6-1 向量空间中的内积与度量

-6-1 向量空间中的内积与度量

--6-1 向量空间中的内积与度量

-第6章 内积空间--6-2 标准正交基与正交矩阵

-6-2 标准正交基与正交矩阵

--6-2 标准正交基与正交矩阵

-第6章 内积空间--6-3 Schmidt正交化与QR分解

-6-3 Schmidt正交化与QR分解

-- 6-3 Schmidt正交化与QR分解

-第6章 内积空间--6-4 正交投影与正交分解

-6-4 正交投影与正交分解

--6-4 正交补与正交分解

-第6章 内积空间--6-5 最小二乘问题

-6-5 最小二乘问题

--6-5 最小二乘问题

第7章 矩阵的特征值理论

-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量

-7-1 矩阵的特征值与特征向量

--7-1 特征值与特征向量

-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间

-7-2 特征多项式与特征子空间

--7-2 特征多项式与特征子空间

-第7章 矩阵的特征值理论--7-3 相似矩阵

-7-3 相似矩阵

--7-3 相似矩阵

-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题

-7-4 矩阵的对角化问题

--7-4 矩阵的对角化问题

-第7章 矩阵的特征值理论--7-5 实对称阵的对角化

-7-5 实对称阵的对角化

--7-5 实对称阵的对角化

-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用

-7-6 特征值理论的几个应用

--7-6 特征值理论的几个应用

第8章 矩阵与变换

-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换

-8-1 矩阵映射与矩阵变换

--8-1 矩阵映射与矩阵变换

-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换

-8-2 二维三维空间中几类特殊的矩阵变换

--8-2 二维三维空间中几类特殊的矩阵变换

-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法

-8-3 矩阵映射的复合与矩阵乘法

--8-3 矩阵映射的复合与矩阵乘法

-8-4 矩阵变换的不变量与特征值理论

--8-4 矩阵变换的不变量与特征值理论

-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似

-8-5 坐标系替换与矩阵相似

--8-5 坐标系替换与矩阵相似

-第8章 矩阵与变换--8-6 正交变换

-8-6 正交变换

--8-6 正交变换

7-4 矩阵的对角化问题笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。