当前课程知识点:线性代数(2) > 第五讲:线性变换 II > 5.7* 幂零变换 > 5.7* 幂零变换
那接下来的两节
我们的目标是证明之前讲过的
在Jordan标准形中给定阶数的Jordan块的个数的公式
那么是补充内容
我们先来讨论一下
幂零变换的结构
什么是幂零变换呢
若存在着自然数m
使得线性变换σ
的m次幂等于零变换
我们就把这个线性变换σ
叫做是幂零的
那具有这个性质的最小的那个m
我们称为是这个幂零变换的
幂零次数
那可以同样地来定义幂零矩阵
和幂零矩阵的幂零次数
那对于线性变换的特征值
我们可以类似地去定义
σ是V到V的线性变换
如果存在着非零的向量x
长在V里头
使得σ(x)等于λ x
λ是落在数域F中的一个数
那我们就称数λ
为线性变换σ的特征值
这个x称为是相应的特征向量
那σ减掉λ去乘以恒同变换
这个变换的核所构成的子空间
我们就叫做是特征值
λ的特征子空间
这和我们之前矩阵的特征值
特征向量
和特征子空间的这个概念
是有一脉相承的关系
那我们之前也提到过说
线性变换
它在不同基下的矩阵表示
是相似的
那么我们可以把线性变换
在给定基下的矩阵
它的特征值拿过来
就叫做这个线性变换的特征值
这些概念是一致的
我们在这里头不展开去讲
那么给了幂零线性变换的定义
之后我们说它的特征值都是零
这个很容易看到
假设λ是幂零变换的
任何一个特征值
那么我们就存在着非零的向量x
使得σ(x)等于λ x
那么σ的k次幂作用在x上
就等于λ的k次幂乘以x
特别地
因为σ是一个幂零变换
所以我们知道σ的m次幂
是等于零变换的
那么我们把k取成m
σ的m次幂作用在x上
就等于λ的m次幂去乘以x
那左手边是零变换
去作用在x上
是等于零向量
右手边因为x是一个非零向量
所以我们一定有这个数
λ的m次幂要等于零
从而λ等于0
这样对于幂零变换σ
的任何特征值λ
我们证明了它一定都是零
也就是幂零变换的特征值都是0
那有一个自然的推论
非零的幂零变换不可能对角化
那么因为零变换它是幂零变换
我们来关心非零的幂零变换
对于非零的幂零变换
它的秩我们记成是r
它一定是大于0的
那么它的核的维数等于n-r
要小于n
那么也就是λ等于0的
这个特征值的特征子空间的维数
是小于n的
等于n-r是小于n的
而这个幂零变换它所有特征值
都是零
这个对于非零的幂零变换
我们找不到
n个线性无关的特征向量
所以它不能够对角化
我们接下来给一个
特殊的幂零变换的例子
假设σ是V到V的一个线性变换
V中有一个非零向量e
使得e σe σ^{n-1}作用在e上
这n个向量构成V一组基
当然V是一个n维的向量空间
那么并且呢σ
n次幂作用在e上
是等于零向量的
我们把这n个向量重新排一下
把σ^{n-1}(e)叫做e_1
把σ(e)叫e_{n-1} 把e叫做e_n
那么我们来看
σ(e_1)就等于σ的n次幂作用在e上
是等于0
σ(e_2)等于σ作用在σ^{n-2}(e)上面
也就是σ的n-1e
那也就是e_1 σ(e_2)等于e_1
σ(e_{n-1})等于σ(σ(e))
也就是σ^2(e) 也就是e_{n-2}
而σ(e_n)是等于σ(e) 是等于e_{n-1}
好 这样
在这基e_1 … e_{n-1} e_n下
这个变换它的矩阵表示就是
对角线上都是零
对角线上方 斜上方有溜1的
这样的一个幂零矩阵
我们把这样的线性变换
就称为是循环线性变换
我们把这个矩阵
特别地叫(*)矩阵
特别地我们来看一下
我们说对于V中的任何向量x
它可以写成刚才这组基底
e_1到e_n的一个线性组合
那么σ作用在x上
就等于x_1 σ(e_1)+x_2 σ(e_2)
+x_n σ(e_n)
我们知道σ(e_1)是等于0
σ(e_2)等于e_1
所以就得到x_2e_2
σ(e_n)呢是等于e_{n-1}
一直加到x_ne_{n-1}
那么特别地到σ^m x
就等于x_{m+1}e_1 一直加到x_n e_{n-m}
这个m是要比n不大的情况
m小于等于n的情况
特别地当m等于n的时候
这个地方就变成了是x_n e_0
也就是之前它是等于0的
σ的m次幂就等于x_{m+1}e_1
一直加到x_n e_{n-m}
特别地σ的n次幂作用在x上
是等于零
所以这个循环线性变换
它是幂零的
它的幂零次数就是n
那我们接下来就证明
想要证明任何一个幂零变换
都可以归结成循环线性变换
具体而言这个定理是讲
任何幂零变换σ从V到V
那空间V可以分解成σ
的不变子空间的直和
W_1到W_m的一个直和
使得这个幂零变换σ
在每个不变子空间W_i上的限制
是循环线性变换
这样说任何一个幂零变换
都可以归结成循环线性变换
那这个定理的证明有点复杂
但是很有意思
我们来看一下
我们假设σ
是V到V的任一个幂零变换
假设幂零次数是m
我们来构造一些小的子空间
我们把σ它的i次幂
那我们线性变换是可以作幂的
那么σ的i次幂
也就是i个σ在作复合
这个线性变换它的像
我们叫做是V_i
这个i呢从0 1 一直到m
那σ的零次幂我们规定
就是指的恒同变换
σ的m次幂呢
因为它的幂零次数是m
所以σ的m次幂就变成了零
那由于σ的i+1次幂
是等于σ^i乘以σ
所以我们有σ^{i+1}次幂的像
一定包含在σ的i次幂的像里头
也就是V_{i+1}要包含在V_i里
那特别地V_m包含在V_{m-1}
这个V_1包含在V_0里
那么V_0呢我们说是σ^0的像
而σ^0我们规定它就是恒同变换
因此它的像就是整个的大空间V
那σ的m次幂是等于零
因此它的像就是零向量
所谓V_m是特别的是零向量
所构成的这个空间
我们就有这样的一个
向量空间的一个包含的关系
那并且呢由这个定义我们知道σ
作用在每一个V_i上
它就等于V_{i+1}
特别地这个V_{m-1}
由于σ(V_{m-1})等于V_m
而V_m就是零向量所构成的这个
平凡的子空间
那么因此V_{m-1}
它是包含在σ的核里的
好 我们从这个V_{m-1}开始出发
来开始找大空间V的基向量
我们假设V_{m-1}的维数
记成是p_{m-1}
那么V_{m-1}是σ的m-1的
这个线性变换的像
它是一个子空间
我们可以找它的基底
我们把它的基底记成是
e_1^{m-1},…,e_{p_{m-1}}^{m-1}
那么上面的这个上标
表示的它是V_{m-1}这个子空间的
基底
下面的下标呢表示
由于这个子空间的维数是p_{m-1}
所以我们在下标有一个排序
好 因为V_{m-1}是落在σ的核里
所以σ作用在这些基向量上
是等于零的
那又因为σ作用在V_{m-2}上面
等于V_{m-1}
所以V_{m-1}中的这p_{m-1}个向量
一定可以在V_{m-2}里头找到原像
我们可以在V_{m-2}中找到
这么些个向量
使得它们被σ打过去之后
恰好打到V_{m-1}的这些个向量
那么也就是σ(e_1^{m-2})
等于e_1^{m-1},…, σ(e_{p_{m-1}}^{m-2})
等于e_{p_{m-1}}^{m-1}
那么由V_{m-1}中的p_{m-1}个向量
找到了V_{m-2}中的相应的向量
我们说找出来的这些个向量
跟之前V_{m-1}中的向量
合在一起 它们是线性无关的
我们很容易来验证
我们假设它们有一个线性组合
等于零
然后把σ作用在两边
因为σ作用在V_{m-1}中的向量
是跑到零
一作用 这边的都等于零
而V_{m-2}中的这些个向量
被σ一个作用就跑到V_{m-1}里头
所以它变成是l_1 e_1^{m-1}
加上l_{p_{m-1}}e_{p_{m-1}}^{m-1}
那么这些个向量是V_{m-1}中的基
所以它的这些组合系数
l_i都是等于零的
那么代回到这个式子里头
这些l等于零
我们就得到e_1^{m-1}
e_{p_{m-1}}^{m-1}的一个组合等于零
所以这些k_i也都等于零
那么在这个表达式里头
所有的系数都等于零
因此我们可以得到
这个断言是正确的
好 我们这样找到了
V_{m-2}中的这些个向量
我们把它去做扩充
扩充成整个V_{m-2}的一组基
那么扩充向量的个数
它能满足什么
它满足说p_{m-2}这部分等于
V_{m-2}的维数
整个的这个数目减掉
前面是V_{m-1}的维数
好 我们说补充出来的向量
这部分向量我们可以从σ
的核里头去取
我们来看一下
这是因为V_{m-1}是等于V_{m-2}
在σ下的像的
那我们就可以设
补充出来的这些个向量
在σ下的像一定可以写成
V_{m-1}的基底
e_1^{m-1},…, e_{p_{m-1}}^{m-1}的
一个线性组合
组合的系数是这些个x
我们来令
一个新的ẽ 这种向量
ẽ_{p_{m-1}+i}^{m-2}
它等于补充的这个向量
e_{p_{m-1}+i}^{m-2}减掉
右手边相应的这些系数
给你出来的一个新的向量
减掉x_{i1}e_1^{m-2}
注意到我们把这个m-1
换成了m-2一直减到
这个x_{i p_{m-1}}e_{p_{m-1}}^{m-2}
那么我们可以很容易验证σ
作用在这样的向量上面
它是等于零的
那么
我们仍然把这个ẽ的向量
就记成e这个向量
那因为同样地
V_{m-2}是等于V_{m-3}在σ的像
所以在V_{m-2}中找出来的这些个基
它在V_{m-3}中一定都有原像
我们把它的原像记成是
e_1^{m-3},…, e_{p_{m-2}}^{m-3}
运用同样的方法
可以证明这样找出来的向量
是线性无关的
就是这些部分是线性无关的
那么我们可以继续扩充得到
V_{m-3}的一组基
同样地可以证明
补充出来的这些向量
都可以在σ的核里头去取
一步步地构造我们就得到
整个大空间V
也就是V_0的一组基
那我们从V_{m-1}出发
得到V_{m-2}中的这些向量
然后补充出来的向量
在核里头去取
又在V_{m-3}里头找出来向量
然后补充的向量在核里头取等等
这种办法最后得到
V中的这个向量表
那么在σ的作用下
每一列向量构成σ
的一个不变子空间
那我们注意到σ作用在它上面
就等于这个e_1^{m-2}
那e_1^{m-2}被σ一作用
就跑到e_1^{m-1}
而e_1^{m-1}再一作用就等于零
那么这一串向量
构成σ的一个不变子空间
σ限制在这些子空间上
是循环线性变换
每一列最低的那个向量可以作为
这个循环线性变换的向量e
在例子里中的e
而这个V就是这些
不变子空间的直和
一共有多少不变子空间呢?
每个不变子空间对应一串向量,而每串向量最顶端的向量
被σ作用跑到0,是属于特征值0的特征向量。
所以幂零变换σ有多少线性无关的特征向量
就有多少不变子空间。
这样我们就证明了这个定理
说任何一个幂零变换
它一定可以把大空间分解成
幂零变换的不变子空间的直和
那幂零变换限制在每个
不变子空间上是循环线性变换
那么办法就是在找基底
我们注意到说
这些个不变子空间
它一共有p_{m-1}列
每一列对应出来一个不变子空间
这个幂零变换
限制在这个不变子空间上
是一个循环线性变换
循环线性变换
在你找出来的这一列基上
它的矩阵表示是一个
这样的一个Jordan块
那么这是一个
m阶的一个Jordan块
这样的m阶的Jorda块
一共有p_{m-1}个
那么这些个呢
是m-1阶的Jordan块
它一共有p_{m-2}减掉p_{m-1}个
那么这是m-2阶的Jordan块
它所对应的Jordan块的个数
是由p_{m-3}减掉p_{m-2}个
因此我们有下面的这个说法
说m阶的Jordan块
一共是有p_{m-1}个
我们把m阶Jordan块的个数
叫做d_m d_m等于p_{m-1}
m-1阶的Jordan块
d_{m-1}是等于p_{m-2}-p_{m-1}
m-2阶的Jordan块的个数
记成是d_{m-2}
它等于p_{m-3}-p_{m-2}
2阶的Jordan块d_2是等于p_1-p_2
一阶的Jordan块同理
d_1=p_0-p_1
那样如果用
这些个V_i的维数来表示
我们来看d_m=p_{m-1}
p_{m-1}是向量子空间
子空间V_{m-1}的维数
那么V_{m-1}的维数也就是
这个σ的m-1次幂的秩
d_{m-1}=p_{m-2}-p_{m-1}
p_{m-2}等于V_{m-2}的维数
减掉V_{m-1}的维数
p_{m-1}等于V_{m-1}的维数
因此d_{m-1}是等于V_{m-2}的维数
减掉2倍的V_{m-1}的维数
那么也可以写成是σ
的m-2次幂的秩
减掉2倍的σ^{m-1}的秩
那d_{m-2}是m-2阶Jordan块的个数
那么它是等于p_{m-3}-p_{m-2}
那么等于
p_{m-3是等于V_{m-3}的维数
减掉V_{m-2}的维数
那p_{m-2}是等于V_{m-2}的维数
减掉V_{m-1}的维数
因此这个d_{m-2}是等于
V_{m-3}的维数减掉
2倍的V_{m-2}的维数
再加上V_{m-1}的维数
那么也可以记成是说σ^
{m-3}的秩减掉2倍的σ^{m-2}的秩
再加上σ^{m-1}的秩
那么依此类推我们可以得到
在第二节里头我们讲过的
一个i阶Jordan块的个数的公式
是等于σ^{i-1}的秩
减掉2倍的σ^i的秩
再加上σ^{i+1}的秩
这个i是大于等于1小于等于m
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语