当前课程知识点:线性代数(2) >  第五讲:线性变换 II >  5.7* 幂零变换 >  5.7* 幂零变换

返回《线性代数(2)》慕课在线视频课程列表

5.7* 幂零变换在线视频

5.7* 幂零变换

下一节:5.8* Jordan标准形

返回《线性代数(2)》慕课在线视频列表

5.7* 幂零变换课程教案、知识点、字幕

那接下来的两节

我们的目标是证明之前讲过的

在Jordan标准形中给定阶数的Jordan块的个数的公式

那么是补充内容

我们先来讨论一下

幂零变换的结构

什么是幂零变换呢

若存在着自然数m

使得线性变换σ

的m次幂等于零变换

我们就把这个线性变换σ

叫做是幂零的

那具有这个性质的最小的那个m

我们称为是这个幂零变换的

幂零次数

那可以同样地来定义幂零矩阵

和幂零矩阵的幂零次数

那对于线性变换的特征值

我们可以类似地去定义

σ是V到V的线性变换

如果存在着非零的向量x

长在V里头

使得σ(x)等于λ x

λ是落在数域F中的一个数

那我们就称数λ

为线性变换σ的特征值

这个x称为是相应的特征向量

那σ减掉λ去乘以恒同变换

这个变换的核所构成的子空间

我们就叫做是特征值

λ的特征子空间

这和我们之前矩阵的特征值

特征向量

和特征子空间的这个概念

是有一脉相承的关系

那我们之前也提到过说

线性变换

它在不同基下的矩阵表示

是相似的

那么我们可以把线性变换

在给定基下的矩阵

它的特征值拿过来

就叫做这个线性变换的特征值

这些概念是一致的

我们在这里头不展开去讲

那么给了幂零线性变换的定义

之后我们说它的特征值都是零

这个很容易看到

假设λ是幂零变换的

任何一个特征值

那么我们就存在着非零的向量x

使得σ(x)等于λ x

那么σ的k次幂作用在x上

就等于λ的k次幂乘以x

特别地

因为σ是一个幂零变换

所以我们知道σ的m次幂

是等于零变换的

那么我们把k取成m

σ的m次幂作用在x上

就等于λ的m次幂去乘以x

那左手边是零变换

去作用在x上

是等于零向量

右手边因为x是一个非零向量

所以我们一定有这个数

λ的m次幂要等于零

从而λ等于0

这样对于幂零变换σ

的任何特征值λ

我们证明了它一定都是零

也就是幂零变换的特征值都是0

那有一个自然的推论

非零的幂零变换不可能对角化

那么因为零变换它是幂零变换

我们来关心非零的幂零变换

对于非零的幂零变换

它的秩我们记成是r

它一定是大于0的

那么它的核的维数等于n-r

要小于n

那么也就是λ等于0的

这个特征值的特征子空间的维数

是小于n的

等于n-r是小于n的

而这个幂零变换它所有特征值

都是零

这个对于非零的幂零变换

我们找不到

n个线性无关的特征向量

所以它不能够对角化

我们接下来给一个

特殊的幂零变换的例子

假设σ是V到V的一个线性变换

V中有一个非零向量e

使得e σe σ^{n-1}作用在e上

这n个向量构成V一组基

当然V是一个n维的向量空间

那么并且呢σ

n次幂作用在e上

是等于零向量的

我们把这n个向量重新排一下

把σ^{n-1}(e)叫做e_1

把σ(e)叫e_{n-1} 把e叫做e_n

那么我们来看

σ(e_1)就等于σ的n次幂作用在e上

是等于0

σ(e_2)等于σ作用在σ^{n-2}(e)上面

也就是σ的n-1e

那也就是e_1 σ(e_2)等于e_1

σ(e_{n-1})等于σ(σ(e))

也就是σ^2(e) 也就是e_{n-2}

而σ(e_n)是等于σ(e) 是等于e_{n-1}

好 这样

在这基e_1 … e_{n-1} e_n下

这个变换它的矩阵表示就是

对角线上都是零

对角线上方 斜上方有溜1的

这样的一个幂零矩阵

我们把这样的线性变换

就称为是循环线性变换

我们把这个矩阵

特别地叫(*)矩阵

特别地我们来看一下

我们说对于V中的任何向量x

它可以写成刚才这组基底

e_1到e_n的一个线性组合

那么σ作用在x上

就等于x_1 σ(e_1)+x_2 σ(e_2)

+x_n σ(e_n)

我们知道σ(e_1)是等于0

σ(e_2)等于e_1

所以就得到x_2e_2

σ(e_n)呢是等于e_{n-1}

一直加到x_ne_{n-1}

那么特别地到σ^m x

就等于x_{m+1}e_1 一直加到x_n e_{n-m}

这个m是要比n不大的情况

m小于等于n的情况

特别地当m等于n的时候

这个地方就变成了是x_n e_0

也就是之前它是等于0的

σ的m次幂就等于x_{m+1}e_1

一直加到x_n e_{n-m}

特别地σ的n次幂作用在x上

是等于零

所以这个循环线性变换

它是幂零的

它的幂零次数就是n

那我们接下来就证明

想要证明任何一个幂零变换

都可以归结成循环线性变换

具体而言这个定理是讲

任何幂零变换σ从V到V

那空间V可以分解成σ

的不变子空间的直和

W_1到W_m的一个直和

使得这个幂零变换σ

在每个不变子空间W_i上的限制

是循环线性变换

这样说任何一个幂零变换

都可以归结成循环线性变换

那这个定理的证明有点复杂

但是很有意思

我们来看一下

我们假设σ

是V到V的任一个幂零变换

假设幂零次数是m

我们来构造一些小的子空间

我们把σ它的i次幂

那我们线性变换是可以作幂的

那么σ的i次幂

也就是i个σ在作复合

这个线性变换它的像

我们叫做是V_i

这个i呢从0 1 一直到m

那σ的零次幂我们规定

就是指的恒同变换

σ的m次幂呢

因为它的幂零次数是m

所以σ的m次幂就变成了零

那由于σ的i+1次幂

是等于σ^i乘以σ

所以我们有σ^{i+1}次幂的像

一定包含在σ的i次幂的像里头

也就是V_{i+1}要包含在V_i里

那特别地V_m包含在V_{m-1}

这个V_1包含在V_0里

那么V_0呢我们说是σ^0的像

而σ^0我们规定它就是恒同变换

因此它的像就是整个的大空间V

那σ的m次幂是等于零

因此它的像就是零向量

所谓V_m是特别的是零向量

所构成的这个空间

我们就有这样的一个

向量空间的一个包含的关系

那并且呢由这个定义我们知道σ

作用在每一个V_i上

它就等于V_{i+1}

特别地这个V_{m-1}

由于σ(V_{m-1})等于V_m

而V_m就是零向量所构成的这个

平凡的子空间

那么因此V_{m-1}

它是包含在σ的核里的

好 我们从这个V_{m-1}开始出发

来开始找大空间V的基向量

我们假设V_{m-1}的维数

记成是p_{m-1}

那么V_{m-1}是σ的m-1的

这个线性变换的像

它是一个子空间

我们可以找它的基底

我们把它的基底记成是

e_1^{m-1},…,e_{p_{m-1}}^{m-1}

那么上面的这个上标

表示的它是V_{m-1}这个子空间的

基底

下面的下标呢表示

由于这个子空间的维数是p_{m-1}

所以我们在下标有一个排序

好 因为V_{m-1}是落在σ的核里

所以σ作用在这些基向量上

是等于零的

那又因为σ作用在V_{m-2}上面

等于V_{m-1}

所以V_{m-1}中的这p_{m-1}个向量

一定可以在V_{m-2}里头找到原像

我们可以在V_{m-2}中找到

这么些个向量

使得它们被σ打过去之后

恰好打到V_{m-1}的这些个向量

那么也就是σ(e_1^{m-2})

等于e_1^{m-1},…, σ(e_{p_{m-1}}^{m-2})

等于e_{p_{m-1}}^{m-1}

那么由V_{m-1}中的p_{m-1}个向量

找到了V_{m-2}中的相应的向量

我们说找出来的这些个向量

跟之前V_{m-1}中的向量

合在一起 它们是线性无关的

我们很容易来验证

我们假设它们有一个线性组合

等于零

然后把σ作用在两边

因为σ作用在V_{m-1}中的向量

是跑到零

一作用 这边的都等于零

而V_{m-2}中的这些个向量

被σ一个作用就跑到V_{m-1}里头

所以它变成是l_1 e_1^{m-1}

加上l_{p_{m-1}}e_{p_{m-1}}^{m-1}

那么这些个向量是V_{m-1}中的基

所以它的这些组合系数

l_i都是等于零的

那么代回到这个式子里头

这些l等于零

我们就得到e_1^{m-1}

e_{p_{m-1}}^{m-1}的一个组合等于零

所以这些k_i也都等于零

那么在这个表达式里头

所有的系数都等于零

因此我们可以得到

这个断言是正确的

好 我们这样找到了

V_{m-2}中的这些个向量

我们把它去做扩充

扩充成整个V_{m-2}的一组基

那么扩充向量的个数

它能满足什么

它满足说p_{m-2}这部分等于

V_{m-2}的维数

整个的这个数目减掉

前面是V_{m-1}的维数

好 我们说补充出来的向量

这部分向量我们可以从σ

的核里头去取

我们来看一下

这是因为V_{m-1}是等于V_{m-2}

在σ下的像的

那我们就可以设

补充出来的这些个向量

在σ下的像一定可以写成

V_{m-1}的基底

e_1^{m-1},…, e_{p_{m-1}}^{m-1}的

一个线性组合

组合的系数是这些个x

我们来令

一个新的ẽ 这种向量

ẽ_{p_{m-1}+i}^{m-2}

它等于补充的这个向量

e_{p_{m-1}+i}^{m-2}减掉

右手边相应的这些系数

给你出来的一个新的向量

减掉x_{i1}e_1^{m-2}

注意到我们把这个m-1

换成了m-2一直减到

这个x_{i p_{m-1}}e_{p_{m-1}}^{m-2}

那么我们可以很容易验证σ

作用在这样的向量上面

它是等于零的

那么

我们仍然把这个ẽ的向量

就记成e这个向量

那因为同样地

V_{m-2}是等于V_{m-3}在σ的像

所以在V_{m-2}中找出来的这些个基

它在V_{m-3}中一定都有原像

我们把它的原像记成是

e_1^{m-3},…, e_{p_{m-2}}^{m-3}

运用同样的方法

可以证明这样找出来的向量

是线性无关的

就是这些部分是线性无关的

那么我们可以继续扩充得到

V_{m-3}的一组基

同样地可以证明

补充出来的这些向量

都可以在σ的核里头去取

一步步地构造我们就得到

整个大空间V

也就是V_0的一组基

那我们从V_{m-1}出发

得到V_{m-2}中的这些向量

然后补充出来的向量

在核里头去取

又在V_{m-3}里头找出来向量

然后补充的向量在核里头取等等

这种办法最后得到

V中的这个向量表

那么在σ的作用下

每一列向量构成σ

的一个不变子空间

那我们注意到σ作用在它上面

就等于这个e_1^{m-2}

那e_1^{m-2}被σ一作用

就跑到e_1^{m-1}

而e_1^{m-1}再一作用就等于零

那么这一串向量

构成σ的一个不变子空间

σ限制在这些子空间上

是循环线性变换

每一列最低的那个向量可以作为

这个循环线性变换的向量e

在例子里中的e

而这个V就是这些

不变子空间的直和

一共有多少不变子空间呢?

每个不变子空间对应一串向量,而每串向量最顶端的向量

被σ作用跑到0,是属于特征值0的特征向量。

所以幂零变换σ有多少线性无关的特征向量

就有多少不变子空间。

这样我们就证明了这个定理

说任何一个幂零变换

它一定可以把大空间分解成

幂零变换的不变子空间的直和

那幂零变换限制在每个

不变子空间上是循环线性变换

那么办法就是在找基底

我们注意到说

这些个不变子空间

它一共有p_{m-1}列

每一列对应出来一个不变子空间

这个幂零变换

限制在这个不变子空间上

是一个循环线性变换

循环线性变换

在你找出来的这一列基上

它的矩阵表示是一个

这样的一个Jordan块

那么这是一个

m阶的一个Jordan块

这样的m阶的Jorda块

一共有p_{m-1}个

那么这些个呢

是m-1阶的Jordan块

它一共有p_{m-2}减掉p_{m-1}个

那么这是m-2阶的Jordan块

它所对应的Jordan块的个数

是由p_{m-3}减掉p_{m-2}个

因此我们有下面的这个说法

说m阶的Jordan块

一共是有p_{m-1}个

我们把m阶Jordan块的个数

叫做d_m d_m等于p_{m-1}

m-1阶的Jordan块

d_{m-1}是等于p_{m-2}-p_{m-1}

m-2阶的Jordan块的个数

记成是d_{m-2}

它等于p_{m-3}-p_{m-2}

2阶的Jordan块d_2是等于p_1-p_2

一阶的Jordan块同理

d_1=p_0-p_1

那样如果用

这些个V_i的维数来表示

我们来看d_m=p_{m-1}

p_{m-1}是向量子空间

子空间V_{m-1}的维数

那么V_{m-1}的维数也就是

这个σ的m-1次幂的秩

d_{m-1}=p_{m-2}-p_{m-1}

p_{m-2}等于V_{m-2}的维数

减掉V_{m-1}的维数

p_{m-1}等于V_{m-1}的维数

因此d_{m-1}是等于V_{m-2}的维数

减掉2倍的V_{m-1}的维数

那么也可以写成是σ

的m-2次幂的秩

减掉2倍的σ^{m-1}的秩

那d_{m-2}是m-2阶Jordan块的个数

那么它是等于p_{m-3}-p_{m-2}

那么等于

p_{m-3是等于V_{m-3}的维数

减掉V_{m-2}的维数

那p_{m-2}是等于V_{m-2}的维数

减掉V_{m-1}的维数

因此这个d_{m-2}是等于

V_{m-3}的维数减掉

2倍的V_{m-2}的维数

再加上V_{m-1}的维数

那么也可以记成是说σ^

{m-3}的秩减掉2倍的σ^{m-2}的秩

再加上σ^{m-1}的秩

那么依此类推我们可以得到

在第二节里头我们讲过的

一个i阶Jordan块的个数的公式

是等于σ^{i-1}的秩

减掉2倍的σ^i的秩

再加上σ^{i+1}的秩

这个i是大于等于1小于等于m

线性代数(2)课程列表:

第一讲:正定矩阵

-1.1 实对称矩阵A正定的充要条件

--1.1 实对称矩阵A正定的充要条件

-1.2 典型例题

--1.2 典型例题

-1.3 半正定矩阵及其判别条件

--1.3 半正定矩阵及其判别条件

-1.4 二次型

--1.4 二次型

-1.5* 有心二次曲线(central conic)

--1.5* 有心二次曲线(central conic)

-1.6* 三维空间中的二次曲面-6类基本的二次曲面

--1.6* 三维空间中的二次曲面-6类基本的二次曲面

-1.7 二次型的分类

--1.7 二次型的分类

-1.8 矩阵的合同

--1.8 矩阵的合同

-1.9* 惯性定理的证明

--1.9* 惯性定理的证明

-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

-1.11* 正(负)定矩阵在函数极值问题中的应用

--1.11* 正(负)定矩阵在函数极值问题中的应用

-第一讲讲义

-第一讲:正定矩阵--课后习题

第二讲:相似矩阵

-2.1 引言

--2.1 引言

-2.2 相似矩阵的性质

--2.2 相似矩阵的性质

-2.3 Jordan标准形

--2.3 Jordan标准形

-2.4 定理的证明

--2.4 定理的证明

-2.5 Jordan标准形的应用

--2.5 Jordan标准形的应用

-第二讲讲义

-第二讲:相似矩阵--课后习题

第三讲:奇异值分解

-3.1 引言

--3.1 引言

-3.2 奇异值分解(Singular Value Decomposition)

--3.2 奇异值分解(Singular Value Decomposition)

-3.3 例题

--3.3 例题

-3.4 奇异值分解的应用

--3.4 奇异值分解的应用

-第三讲讲义

-第三讲:奇异值分解--课后习题

第四讲:线性变换 I

-4.1 线性变换的定义和性质

--4.1 线性变换的定义和性质

-4.2 线性变换的运算

--4.2 线性变换的运算

-4.3 线性变换的矩阵表示

--4.3 线性变换的矩阵表示

-4.4 线性变换与矩阵之间的关系

--4.4 线性变换与矩阵之间的关系

-第四讲讲义

-第四讲:线性变换 I--课后习题

第五讲:线性变换 II

-5.1 恒同变换与基变换

--5.1 恒同变换与基变换

-5.2 图像压缩——基变换的应用

--5.2 图像压缩——基变换的应用

-5.3 线性变换在不同基下的矩阵

--5.3 线性变换在不同基下的矩阵

-5.4 矩阵分解与基变换

--5.4 矩阵分解与基变换

-5.5 线性变换的核与像

--5.5 线性变换的核与像

-5.6 不变子空间

--5.6 不变子空间

-5.7* 幂零变换

--5.7* 幂零变换

-5.8* Jordan标准形

--5.8* Jordan标准形

-第五讲讲义

-第五讲:线性变换 II--课后习题

第六讲:伪逆

-6.1 伪逆

--6.1 伪逆

-6.2 Moore – Penrose 伪逆

--6.2 Moore – Penrose 伪逆

-6.3 最小二乘法

--6.3 最小二乘法

-第六讲讲义

-第六讲:伪逆--课后习题

第七讲:工程中的矩阵

-7.1 简介

--7.1 简介

-7.2 弹簧模型

--7.2 弹簧模型

-7.3 变量的线性关系

--7.3 变量的线性关系

-7.4 刚度矩阵

--7.4 刚度矩阵

-7.5 从离散到连续

--7.5 从离散到连续

-第七讲讲义

-第七讲:工程中的矩阵--课后习题

第八讲:图与网络

-8.1 简介

--8.1 简介

-8.2 图和矩阵

--8.2 图和矩阵

-8.3 网络和加权Laplacian矩阵

--8.3 网络和加权Laplacian矩阵

-8.4 关联矩阵的四个基本子空间

--8.4 关联矩阵的四个基本子空间

-8.5 注记

--8.5 注记

-第八讲讲义

-第八讲:图与网络--课后习题

第九讲:Markov矩阵和正矩阵

-9.1 问题引入

--9.1 问题引入

-9.2 Markov矩阵

--9.2 Markov矩阵

-9.3 正Markov矩阵

--9.3 正Markov矩阵

-9.4 正矩阵

--9.4 正矩阵(第一部分)

--9.4 正矩阵(第二部分)

-第九讲讲义

-第九讲:Markov矩阵和正矩阵--课后习题

第十讲:Fourier级数

-10.1 引言

--10.1 引言

-10.2 内积空间

--10.2 内积空间

-10.3 傅里叶级数

--10.3 傅里叶级数

-10.4 投影

--10.4 投影

-10.5 关于Fourier变换的注记

--10.5 关于Fourier变换的注记

-第十讲讲义

-第十讲:Fourier级数--课后习题

第十一讲:计算机图像

-11.1 引言

--11.1 引言

-11.2 平移

--11.2 平移

-11.3 伸缩

--11.3 伸缩

-11.4 旋转

--11.4 旋转

-11.5 投影和反射

--11.5 投影和反射

-第十一讲讲义

-第十一讲:计算机图像--课后习题

第十二讲:复数与复矩阵

-12.1 引言

--12.1 引言

-12.2 复矩阵

--12.2 复矩阵

-12.3 复正规阵

--12.3 复正规阵

-12.4 离散Fourier变换

--12.4 离散Fourier变换

-12.5 快速Fourier变换

--12.5 快速Fourier变换

-第十二讲讲义

-第十二讲:复数与复矩阵--课后习题

结课寄语

-结课寄语

--结课寄语

5.7* 幂零变换笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。