当前课程知识点:线性代数(2) >  第二讲:相似矩阵 >  2.4 定理的证明 >  2.4 定理的证明

返回《线性代数(2)》慕课在线视频课程列表

2.4 定理的证明在线视频

2.4 定理的证明

下一节:2.5 Jordan标准形的应用

返回《线性代数(2)》慕课在线视频列表

2.4 定理的证明课程教案、知识点、字幕

这一节我们来看一下定理的证明

首先我们看一个简单的例子

假设矩阵A相似于

这样的一个7阶的Jordan标准形

那么这个Jordan标准形

包括三个Jordan块

第一个Jordan块是以2

为特征值的一个3阶的Jordan块

第二个是以4为特征值的

一个2阶的Jordan块

第三个是以0为特征值的

2阶的Jordan块

那么我们把过渡矩阵P

这个可逆矩阵它的列向量

分别记成x1到x7

那AP等于PJ

也就是Ax1等于2x1

Ax2等于2x2加x1

Ax3等于2x3加x2

Ax4等于4x4 Ax5等于4x5加x4

Ax等于0 Ax7等于x6

这样我们就有三个向量链

x1 x2 x3

Ax1等于2x1

这个x1是一个特征值2

所对应的特征向量

Ax2等于2x2再加上x1

它不是一个特征向量

但是它与x2 x1有这样的关系

Ax3等于2x3再加上x2

那第二个向量链是x4 x5

x4是特征值4所对应的特征向量

x5它满足x5等于4x5加上x4

x6 x7

x6是特征值0所对应的特征向量

x7它满足Ax7等于0乘以x7

再加上x6

这样我们有三个向量链

它们满足Axi要么是等于lambda i xi

要么是等于lambda i xi再加上xi-1

那么起始的向量x1 x4和x6

都是特征向量

所有的向量

尽管不全都是A的特征向量

但它们都能够满足

存在一个正整数k

使得A-lambda i的k次幂乘以xi等于0

这样的向量我们统称为是

属于特征值lambda i的广义特征向量

这样我们去求可逆矩阵P

使得P^{-1}AP等于

A的Jordan标准形J的过程

就等价于去求A的n个线性无关的广义特征向量的过程

之前A如果是可以对角化的

我们是要去求A的n个

线性无关的特征向量

而在一般情况下

当A不见得有n个线性无关的

特征向量的时候

我们去求A的n个所谓

线性无关的广义特征向量

使得在由这样的广义特征向量

所构成的矩阵P里头

P^{-1}AP等于它的Jordan标准形J

那以此作基础

我们来看一下定理的证明

我们对矩阵A的阶数

用数学归纳法

当n等于1的时候

对于1阶矩阵,这个结论

是自然成立的

我们假设阶数小于n的矩阵

总可以相似于其Jordan标准形

下面对阶数等于n的矩阵A来讨论

分成几步来进行

第一步假设A有零特征值

那么如果A没有零特征值的时候我们可以任取特征值lambda

来讨论矩阵A-lambda I

这时候A-lambda I就有零特征值了

所以不失一般性

我们一开头

就假设A是有零特征值的

那于是它的行列式是等于0

它是一个奇异矩阵

因此它的秩如果是记成r的话

是比n要来得小的

我们去取A的列空间C(A)的一组基

我们记成是u1到ur 这个r是小于n

那么Aui仍然是

A的列向量的一个线性组合

所以它包含在A的列空间C(A)里头

因此每一个Aui都可以由

列空间的基底u1到ur去线性表示

那这件事情

用矩阵的语言来表达

就是A去乘以以u1到ur

作为列向量所构成的这个矩阵

就等于用u1ur作为列向量

构成的这个矩阵

去乘以一个r阶的矩阵

我们记成是A一弯

A一弯里头记录了Aui

用u1到ur线性表示的组合系数

那因为A一弯这个矩阵

它是一个r阶的矩阵

我们说r是小于n的

因此我们可以用归纳假设

对于A一弯这个矩阵

我们存在着r阶的可逆矩阵Q

使得Q^{-1}A一弯Q

是等于A一弯的Jordan标准形

那么两步综合起来

也就是A去乘以以u1到ur

作为列向量的这个矩阵

再去乘以Q

等于u1ur来作为

列向量的这个矩阵去乘以Q

再去乘以A一弯的Jordan标准形

那么如果我们把

这两个矩阵的乘积的列向量

记成是w1 wr的话

那上面这个式子就可以表达成

A去乘以w1 wr

来作为列向量的矩阵

等于以w1 wr作为列向量的矩阵

去乘以A一弯的Jordan标准形

这里呢w1到wr这r个向量

是由u1到ur这r个线性无关的向量

去乘以可逆矩阵Q

所得到的结果

因此它仍然是线性无关的

它仍然构成C(A)的一组基

那么这样我们就在C(A)

这个r阶的子空间里头

找到了一组好的基底

使它满足这个性质

那么也就是说这时候

A去乘以wi

它要么等于lambda i wi

要么等于lambda i wi再加上wi-1

我们在C(A)里头找到了

r个广义特征向量

找到了部分的好基底

我们用一个例子来看一看

刚才第一步的过程

我们设A是这样的一个3阶矩阵

我们说这个矩阵

它的第一列和第二列是相同的

线性相关

因此这是一个奇异矩阵

取它的第一列和第三列

来作为列空间的一组基底

我们叫u1和u2

我们用A去乘以u1发现等于2u1

也就是说u1是A的

关于特征值2的特征向量

Au2等于3u1

那这件事情可以写成

A去乘以u1 u2为列向量这个矩阵

等于u1 u2为列向量的矩阵

乘以这个2乘2的矩阵

这个就是刚才定理证明里头

第一步的A一弯这个矩阵

2阶矩阵

好 对于这个矩阵呢

我们可以找到一个可逆矩阵Q

使得Q^{-1}A一弯Q等于

这样的一个对角阵

恰好是一个对角阵

这是A一弯

这个矩阵的Jordan标准形

那么我们用u1u2作为列向量

构成的矩阵去乘以Q

乘出来它的列向量我们叫w1w2

那么乘出来

恰好是这样的两个向量

这是我们w1 这是我们的w2

那A去乘以w1 w2作为列向量

构成这个矩阵

等于w1 w2去乘以这是J

就是A一弯的Jordan标准形

这是我们第一步做的事情

对于这个简单的矩阵A

来又过了一遍

好 第二步

我们假设说A的列空间

C(A)和A的零空间的交集的维数

是等于p

那么设w

是在这个交集中的一个元素

因为w它是属于C(A)里头

它可以写成

A的列空间的线性组合

也就是我们一定会存在着一个y

使得w等于Ay

因此w

一定属于一个长度大于1的链

那么这个交集的维数

是等于p维的话

那我们就会存在着p条链

长在C(A)里

它的首项是属于lambda 0的特征向量

我们来特别地看一下

假设w1到wk

是其中的一条这样的链

那它的第一项

是属于lambda等于0的特征向量

Aw1等于0 Aw2等于w1

Awk等于wk-1

由于wk是长在C(A)里头

因此一定会存在一个元素wk+1

使得Awk+1是等于wk的

于是我们原来的这条

有k个元素的链w1 wk

就被扩充成w1 wk wk+1

因此这一步就把第一步中的

有p条链提供了p个新的向量

我们把这p个新的向量

叫做y1到yp

某一个w k+1是某一个y

我们一共有p个这样的向量

好 在下面的例子里头

我们可以看得出来说

C(A)和N(A)的交

它是一个1维的子空间

我们可以取出的基底

说它是由w2给张出来的

那么对于这样的w2

我们总存在y

使得Ay等于w2

这样w2这条链就扩充成w2 y

这条新的链

那么A w1 w2 y就等于w1 w2 y

这个以它们为列向量构成的矩阵

去乘以这个新的一个3阶矩阵

那么这时候相当于是说

这是我们的Jordan标准形

2这块呢是特征值2

所对应的一个1阶的Jordan块

这部分呢是特征值0

所对应的2阶的Jordan块

它对应的链是w2 y

这是w1所对应的

我们有两条链

对应出来两个Jordan块

这两个链里头

打头的都是特征向量

好 那我们就把

以w1 w2 y作为列向量

所构成的这个矩阵记成是P矩阵

那么我们就有P逆AP

等于A的Jordan标准形

那假设说A的零空间的维数

要大于P

也就是n-r要大于p

那我们还需要找出来

n-r-p个N(A)中的线性无关的向量

长在N(A)里头

又不在N(A)和C(A)的交集里头

这样整个地凑出来n个向量

它们作为这个空间的好基底

使得A在这组基底下

能够变成Jordan标准形

我们把这n-r-p个N(A)中

线性无关的向量

叫做是Z1到Zn-r-p

它们将产生n-r-p个1阶的Jordan块

因为它长在N(A)里头

它是0所对应的Jordan块

我们断言说这样得到的n个向量

wi yj 和zk

它们一定是线性无关的

因此以它们作为列向量

可以构成一个可逆矩阵P

那P逆AP就等于J

是A的Jordan标准形

而如果矩阵A

没有零特征值的时候

刚才已经提到过

我们可以任意取出来

A的一个特征值lambda

用新的矩阵A’等于A-lambda I

这样一个有零特征值的矩阵

来取代刚才A这个矩阵

那可以得到一个可逆矩阵P

使得P^{-1}A’P等于J’

是A’的Jordan标准形

于是呢对于原来的矩阵A

它等于A’加上lambdaI

我们就有同样的可逆矩阵P

P^{-1}AP

把A和A’的关系代lambda

那么P^{-1}AP它的Jordan标准形

是J’加lambdaI

这是A的Jordan标准形

所以我们只需要来看一下

这个断言的证明

我们断言说刚才得到的

第一步得到的wi

第二步得到的yj

和第三步得到的zk这些

n个向量是线性无关的

那要证明这一点

我们任取它的一个线性组合

我们组合系数分别记成

Ci dj和ek 它等于0

我们需要说明

这些个组合系数是等于0

我们对这个式子的两端

去左乘以矩阵A

那我们说wi它长在C(A)里头

有好的性质

说A去乘以wi

要么是lambda i wi

要么是lambda i wi加上w i-1

yj呢 A去作用在yj上

是等于某一个wj

这个wj是长在以零特征值

所对应的特征向量的链的最上端

那么它一定不是下行之后

得到的在这部分里头的w

相应的w

Azk是等于0的

它长在N(A)里头

因此Azk是等于0

于是我们上面这个式子

左乘以矩阵A以后

就得到了

互不相同的一些wi的线性组合

由于wi它是在C(A)里头的基底

它们线性无关

所以在这个表达式里头

这个dj都是等于0的

相应的这些

把相同的wi合在一起

那么它前面的系数也等于0

我们不管它

我们只看这个系数

我们说这个系数一定是等于0

因为我们说Ayj是特殊的wj

在lambda等于0所对应的链的末尾

它不会出现在第一项中

所以上式的左边

是互不相同的wi的某个线性组合

又因为wi是C(A)的一组基

线性无关

所以我们特别的得到dj

这些系数是等于0的

于是第一个式子

就可以化成ciwi的和

等于ekzk的和再取负号

把它移到右手边来

那么一边这个是长在C(A)里头

一边是长在N(A)

又不长在N(A)和C(A)的交集里头

因此我们一定有这个ek是等于0的

那再把ek等于0这件事情

代回到这个表达式里头

我们就得到右手边这儿是0

那左手边是wi

它的一个线性组合

又因为wi是线性无关的

所以它的系数ci也等于0

这样我们刚才的这个表达式里

这些系数都等于0

因此这n个向量是线性无关的

合在一起我们就证明了定理

我们再来看一个例子

矩阵A

是给定的这样的一个4阶的矩阵

我们要求可逆矩阵P

使得P^{-1}AP是A的Jordan标准形

我们容易求得A有特征值 是1

这是一个4重的特征值

我们用第一步

因为特征值都等于1

所以我们想拿这个A-I

来变出一个新的矩阵A’

它有零特征值

重复第一步的过程

我们对这个A’

来取它的列空间的一组基底

u1和u2

那么我们注意到A’去乘以u1

等于3 1 3 1这个向量

它是等于3u1-u2

A’u2等于9u1-3u2

那么用矩阵语言描述出来

是A’u1u2

等于u1u2去乘以3 9 -1 -3

这个矩阵

这是我们第一步做的事情

我们把这个2乘2的矩阵记成是B

我们可以找到一个可逆矩阵Q

使得Q^{-1}BQ

等于B这个矩阵的Jordan标准形

那么也就是说

A’去乘以u1u2作为列向量

构成的矩阵再乘以Q等于u1u2

作为列向量的这个矩阵乘以Q

再乘以B的Jordan标准形

那么我们把u1u2

作为列向量构成这个矩阵

和Q相乘

得到这个矩阵记成是新的矩阵

它的列向量是w1w2

那A’去乘以w1 w2

作为列向量构成的这个矩阵

就等于在这组基底下的矩阵

是Jordan标准形

好 那w1 w2是A’的属于lambda

等于0的一条链

好 我们第二步来看一下

我们说N(A’)和C(A’)的交集

这个子空间的维数是等于1

我们可以找出来

它的一个基底w1

我们刚才找到了w1 w2

我们说是一条链

那么w2是长在C(A’)里头

在这个链的最上端的这个w2

说总存在着y这个向量

使得A’y等于w2

我们把y叫做是w3

那么A’去乘以w1 w2 w3

分别用w1 w2 w3去线性表示

表示出来就是这个Jordan标准形

表示出来

就是这样的一个3乘3的矩阵

这样我们在第二步里头

把原来的链给又增加了一个长度

好 在第三步里头

我们说看在A’的零空间里头

我们发现它存在不在这个零空间

和列空间交集中的元素

它的这时候维数

这个空间的维数是等于1的

那我们在这里头

找出来一个非零向量我们叫做z

于是把刚才找到的这个链

w1 w2 w2和你在第三步里

找出来z这个向量放在一起

那么构成整个空间的一组基底

在这组基底下A’的矩阵表示

是这样的两个Jordan块

对于z对应着一个1阶的Jordan块0

然后w1 w2 w3这条链

对应出来的是一个3阶的以特征值

0为对角元的一个Jordan块

我们就把w1 w2 w3 z

作为列向量所构成的这个矩阵

叫做P

再回到原来的A矩阵

A矩阵等于A’加上单位阵

因此我们有

P^{-1}AP等于A的Jordan标准形

好 这样我们对刚才的4阶矩阵A

重复了我们在定理证明中的

三个步骤

而得到了过渡矩阵P

得到了A的Jordan标准形J

更进一步我们有下面的结论

我们说

一个n阶的复矩阵的Jordan标准形中

主对角元为特征值

lambda i的Jordan块的个数ti

它是等于n减掉A-lambda i I的

这个矩阵的秩

其中每个Jordan块的阶数

不超过lambda i的代数重数

m阶Jordan块的个数di

是等于A-lambda i I的m-1次幂的秩

再加上A-lambda i I的m+1节次幂的秩

再减2倍的A-lambda i I m次幂的秩

那我们说回顾Jordan标准形

生成的过程

实际上呢它是找这个向量链

xi使得它满足Axi等于lambda i xi

A xi等于lambda i xi再加上x i-1

这种性质的过程

也就是说广义特征向量的过程

每一条向量链

对应着一个Jordan块

起始向量是一个特征向量

因此Jordan块的个数它等于属于

lambda的线性无关的特征向量的数目

而属于lambda特征向量的这个

线性无关的这个数目是A-lambda i I

这个矩阵的零空间的维数

也就是n减掉它的秩

在第二个公式里头

我们需要用到幂零变换的语言

会更好解释

我们暂且在这里不去证明

我们到后面去看

我们看下面这个简单的例子

A是一个以3为对角元的上三角阵

我们来看看

它的Jordan标准形的形状

那显然A的特征值是3

是一个4重的特征值

容易看到A减掉3I

这个矩阵的秩是等于2

因此这个矩阵的零空间的维数

是等于n减掉2

是等于4-2等于2的

所以A

有两个线性无关的特征向量

那么A的Jordan标准形里头

就有两个Jordan块

那这两个Jordan块

它长在这个4阶矩阵里头

它的阶数可能是1 3

也可能是2 2

那由于A减掉3I的平方是等于0

因此我们知道

这个1阶的Jordan块的个数

根据刚才的这个公式

我们说是等于

A减掉3I的零次幂的秩

我们说这个矩阵是4阶的单位阵

因此它的秩是4

再加上A-3I括号平方

这个矩阵的秩

这个矩阵我们说是零矩阵

因此秩是等于0

A减掉3I这个矩阵的秩是等于2

2去乘以2是4

因此得到d1是等于0的

那1阶的Jordan块的个数是等于0

那么它的Jordan标准形

与Jordan块的个数只能是

它的阶数是2 2的情况

所以A的Jordan标准形

一定是两个Jordan块

那阶数分别是2 2

因此它的Jordan标准形

是这种样子

线性代数(2)课程列表:

第一讲:正定矩阵

-1.1 实对称矩阵A正定的充要条件

--1.1 实对称矩阵A正定的充要条件

-1.2 典型例题

--1.2 典型例题

-1.3 半正定矩阵及其判别条件

--1.3 半正定矩阵及其判别条件

-1.4 二次型

--1.4 二次型

-1.5* 有心二次曲线(central conic)

--1.5* 有心二次曲线(central conic)

-1.6* 三维空间中的二次曲面-6类基本的二次曲面

--1.6* 三维空间中的二次曲面-6类基本的二次曲面

-1.7 二次型的分类

--1.7 二次型的分类

-1.8 矩阵的合同

--1.8 矩阵的合同

-1.9* 惯性定理的证明

--1.9* 惯性定理的证明

-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

-1.11* 正(负)定矩阵在函数极值问题中的应用

--1.11* 正(负)定矩阵在函数极值问题中的应用

-第一讲讲义

-第一讲:正定矩阵--课后习题

第二讲:相似矩阵

-2.1 引言

--2.1 引言

-2.2 相似矩阵的性质

--2.2 相似矩阵的性质

-2.3 Jordan标准形

--2.3 Jordan标准形

-2.4 定理的证明

--2.4 定理的证明

-2.5 Jordan标准形的应用

--2.5 Jordan标准形的应用

-第二讲讲义

-第二讲:相似矩阵--课后习题

第三讲:奇异值分解

-3.1 引言

--3.1 引言

-3.2 奇异值分解(Singular Value Decomposition)

--3.2 奇异值分解(Singular Value Decomposition)

-3.3 例题

--3.3 例题

-3.4 奇异值分解的应用

--3.4 奇异值分解的应用

-第三讲讲义

-第三讲:奇异值分解--课后习题

第四讲:线性变换 I

-4.1 线性变换的定义和性质

--4.1 线性变换的定义和性质

-4.2 线性变换的运算

--4.2 线性变换的运算

-4.3 线性变换的矩阵表示

--4.3 线性变换的矩阵表示

-4.4 线性变换与矩阵之间的关系

--4.4 线性变换与矩阵之间的关系

-第四讲讲义

-第四讲:线性变换 I--课后习题

第五讲:线性变换 II

-5.1 恒同变换与基变换

--5.1 恒同变换与基变换

-5.2 图像压缩——基变换的应用

--5.2 图像压缩——基变换的应用

-5.3 线性变换在不同基下的矩阵

--5.3 线性变换在不同基下的矩阵

-5.4 矩阵分解与基变换

--5.4 矩阵分解与基变换

-5.5 线性变换的核与像

--5.5 线性变换的核与像

-5.6 不变子空间

--5.6 不变子空间

-5.7* 幂零变换

--5.7* 幂零变换

-5.8* Jordan标准形

--5.8* Jordan标准形

-第五讲讲义

-第五讲:线性变换 II--课后习题

第六讲:伪逆

-6.1 伪逆

--6.1 伪逆

-6.2 Moore – Penrose 伪逆

--6.2 Moore – Penrose 伪逆

-6.3 最小二乘法

--6.3 最小二乘法

-第六讲讲义

-第六讲:伪逆--课后习题

第七讲:工程中的矩阵

-7.1 简介

--7.1 简介

-7.2 弹簧模型

--7.2 弹簧模型

-7.3 变量的线性关系

--7.3 变量的线性关系

-7.4 刚度矩阵

--7.4 刚度矩阵

-7.5 从离散到连续

--7.5 从离散到连续

-第七讲讲义

-第七讲:工程中的矩阵--课后习题

第八讲:图与网络

-8.1 简介

--8.1 简介

-8.2 图和矩阵

--8.2 图和矩阵

-8.3 网络和加权Laplacian矩阵

--8.3 网络和加权Laplacian矩阵

-8.4 关联矩阵的四个基本子空间

--8.4 关联矩阵的四个基本子空间

-8.5 注记

--8.5 注记

-第八讲讲义

-第八讲:图与网络--课后习题

第九讲:Markov矩阵和正矩阵

-9.1 问题引入

--9.1 问题引入

-9.2 Markov矩阵

--9.2 Markov矩阵

-9.3 正Markov矩阵

--9.3 正Markov矩阵

-9.4 正矩阵

--9.4 正矩阵(第一部分)

--9.4 正矩阵(第二部分)

-第九讲讲义

-第九讲:Markov矩阵和正矩阵--课后习题

第十讲:Fourier级数

-10.1 引言

--10.1 引言

-10.2 内积空间

--10.2 内积空间

-10.3 傅里叶级数

--10.3 傅里叶级数

-10.4 投影

--10.4 投影

-10.5 关于Fourier变换的注记

--10.5 关于Fourier变换的注记

-第十讲讲义

-第十讲:Fourier级数--课后习题

第十一讲:计算机图像

-11.1 引言

--11.1 引言

-11.2 平移

--11.2 平移

-11.3 伸缩

--11.3 伸缩

-11.4 旋转

--11.4 旋转

-11.5 投影和反射

--11.5 投影和反射

-第十一讲讲义

-第十一讲:计算机图像--课后习题

第十二讲:复数与复矩阵

-12.1 引言

--12.1 引言

-12.2 复矩阵

--12.2 复矩阵

-12.3 复正规阵

--12.3 复正规阵

-12.4 离散Fourier变换

--12.4 离散Fourier变换

-12.5 快速Fourier变换

--12.5 快速Fourier变换

-第十二讲讲义

-第十二讲:复数与复矩阵--课后习题

结课寄语

-结课寄语

--结课寄语

2.4 定理的证明笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。