当前课程知识点:简明线性代数 > 第7章 矩阵的特征值理论 > 7-2 特征多项式与特征子空间 > 7-2 特征多项式与特征子空间
同学们 大家好
欢迎来到mooc课程
线性代数先修课
第七章 矩阵的特征值理论
7.2节特征多项式与特征子空间
在本讲当中
我们将围绕
特征值与特征向量
的几个基本问题展开讨论
首先通过讨论
特征多项式的性质
来分析特征值之间的关系
其次我们将分析
属于同一个特征值的
特征向量的性质
进而引入特征子空间的概念
最后我们将分析
属于不同特征值的
特征向量之间的相互关系
首先
我们先来讨论
特征多项式的性质
由于特征多项式
是关于λ的首一n次多项式
所以我们不妨把它
所有的系数设出来
其中这里的ci表示
它第n-i次方的系数
均为实数
我们将用两种方式将
特征多项式的上述系数表示出来
第一种方式
就是用矩阵的元素aij来表示
第二种方式
就是用矩阵的特征值
好
我们先来看
特征多项式的部分系数
与矩阵的元素的关系
首先
我们把A按列分块表示
为α1、α2和αn
并且将单位阵也表示
为n个自然基的列向量的排列
于是我们把这个
n阶行列式的每一列都表示
成为λ倍的ei再减去αi的形式
那么根据行列式的
列加法的拆分性质
我们就可以得到
上述行列式可以拆分为
2的n次方项
于是
我们可以得到
如下两个系数与A中元素的关系
也就是我们发现常数项
应该等于A的行列式
再乘以-1的n次方
而它的次高项
也就是n-1次方的系数就应该
等于所有主对角线上元素相加
再乘以-1
在这里我们
把一个方阵A的主对角线上元素之和
称为A的迹
也就是把它记为tr(A)的形式
另外一方面
我们来看特征多项式的
部分系数与A的特征值之间的关系
我们假设方阵A的特征多项式的
全部复根为λ1、λ2到λn
于是特征多项式就可以表示为
λ-每一个根再相乘的形式
将此式展开
我们利用韦达公式
也就是根与系数之间的关系
我们也可以得到常数项应该
等于所有特征根相乘
再乘以-1的n次方
而次高项的系数应该等于
所有特征值的求和再乘以-1
比较上述两方面所得到的
四个等式
我们就可以得到如下的结论
也就是我们的定理1
对于一个n阶方阵A
设λ1、λ2
到λn为它的全部特征值
则所有特征值的和就等于
A的主对角线上元素的求和
也就是等于A的迹
而所有特征值的乘积
就等于A的行列式
根据定理1
我们就可以得到
一个利用特征值来判断
A是不是可逆的结论
也就是我们的推论
即n阶方阵A可逆
当且仅当A的
行列式不等于0
又当且仅当A的
特征值不全为0
它的等价命题也就是
n阶方阵A不可逆
当且仅当行列式等于0
这又当且仅当0是
A的一个特征值
我们提出
如下的扩展性问题
除了常数项cn
与次高项系数c1以外
特征多项式的其他项系数ck
实际上也可以由韦达公式表示
为特征值的表达式
那么另外一方面
ck与A的分量元素
有什么关系呢?
这个问题留给
大家课后进行思考
下面
我们来看两个例子
第一个例子
是这样的一个上三角阵
那么我们很容易求出
它的特征多项式就等于
λ减去主对角线上的元素
再相乘
从而三角阵A的特征值
就为主对角线上的全体元素
也即a11、a22一直到ann
推广一下
我们设A为这样的
一个准三角阵
其中每一个大Ai为ni阶的方阵
那么很容易我们
可以计算出A的特征多项式
就等于它的主对角线上的
每一个子块的特征多项式
再相乘
从而准三角阵A的特征值
就是主对角线上
每一个子块A1、A2
一直到An的全部特征值的并集
下面我们进一步讨论
特征值与特征向量的性质
我们分为如下几条
假设λ0为A的一个特征值
X0为对应的特征向量
则第一条
kλ0就为kA的特征值
而X0依然为对应的特征向量
第二条性质就是
λ0的h次方就为A的h次方的特征值
其中h为任意正整数
而X0依然为对应的特征向量
第三条性质
对于矩阵A的多项式g(A)
它的特征值就为g(λ0)
其中X0依然为对应的特征向量
进一步
如果A可逆
则还有如下两条性质
也就是性质四
λ0的逆就为A的逆的特征值
而对应的特征向量还是保持不变
还是X0
第五条
λ0的逆再乘以A的行列式
就为A的伴随的特征值
X0依然为对应的特征向量
这这里我们只验证后两条性质
首先先来看性质四
由特征值和特征向量的定义式
我们有AX0=λ0X0
那么对于等式的两边
我们都左乘以A逆
于是就可以得到X0=λ0
再乘以A逆X0
由于A是可逆的
其特征值不为0
所以我们再可以把λ0再除过来
于是就得到了
A逆乘以X0就等于λ0的逆
再乘以X0
所以从这个式子
我们就得到了想要的结论
第五条
利用伴随的性质
我们有A星乘以A
等于A的行列式倍的单位阵
对等式的两边我们都右乘X0
进一步利用ax0=λ0x0
我们就可以得到这样的等式
最后把λ0除到等式右边
就得到这个等式
而这个等式就说明性质5是成立的
下面
我们用性质来求一些具体的问题
例2 设a是三阶方阵
已知它特征值为1 2 -1
另外我们知道一个矩阵b
和a有这样的代数关系
也就是b=a3-5a2
请大家求矩阵b的行列式
我们首先来分析下这个问题
从题设题条件我们
只能得到A的部分信息
而题目还要求
利用A与B的代数关系
来求B的行列式
那么由于
我们之前给出了
行列式与特征值之间的关系
因此
我们转而希望
能够求出B的特征值
于是可以假设
λ为a的一个特征值
x为属于λ的特征向量
于是就得到了这样一个定义式
下面
我考虑矩阵b乘以x
再把a和b之间的代数关系
代到这个式子里
就可以计算的
它等于λ3-5λ2
这个等式就说明了λ3-5λ2
就为b的特征值
那么当我们把a的特征值
也就是λ=1 2 -1
分别代进去可算得
b的特征值-4 -12 -6
最后
根据b的行列式
应该等于
它所有特征值的乘积
计算结果
就可得到它
的行列式等-288
说明一下
本例
就是上述性质3
的一个简单应用
由于我们
没有验证前3条性质
故在本例当中
我们给出了具体的推导
而性质1 性质2和性质3的
证明方法与本例类似
下面再来看一个例子
例3 已知n阶方阵
a的n个特征值为λ到λn
请大家求2I-A的特征值
及其行列式
这个问题和刚才的
例2类似的
首先
由题设可以知道
a的特征多项式
就等于λ-λi
再乘起来
为求2I-A的特征值
我们首先考虑
2I-A的特征多项式
它的特征多项式应该等于
当我们用μ来代替λ
就等于
这样的行列式
当我们把整个行列式
提出(-1)n
之后
它就等于这样的行列式
这里把2-μ看成上式当中λ
借助A的特征多项式
我们就得到了这个式子
再把这是做变形
我就知道2-λi
即为我们所求
矩阵的全体特征值
所以我就是知道了
2I-A的n个特征
就为2-λi
从而
它的行列式就等于所有特征值
相乘就等于这样的一个结果
同样本列也可以
由上述性质3来直接得到
例4 已知A的平方等于A
求矩阵A的特征值
首先我们
假设λ是A的一个特征值
并且设X是λ所属的特征向量
于是可以得到这样的一个等式
所以对这个等式两边左乘以A
就可以知道A平方乘X应该
等于λ平方乘X
那么另一方面利用已知条件
也就是A的平方等于A
于是我们就知道A乘X就
应该等于A平方再乘以X
再利用上式
它就等于λ平方再乘X
于是我们再把它们移到
等式的同一边
就得到了这样的一个等式
由于X为特征向量
所有它是一个非零向量
因此我们就知道
只有系数等于0
也即λ平方要等于λ
这就是A的特征值
要满足的要求
所以这说明了
只可能等于0或者1
本例可以推广为一般的情形
也就是如果A满足某个多项式
也就是g(A)=0
则A的特征值
λ也满足该多项式
也就是g(λ)也要等于0
也就是我们的性质3
二 特征向量的性质与特征子空间
下面我们来讨论
特征向量的性质
取定n阶方阵A的一个特征值λ
则第一点如果我们
设X是A的属于特征值
λ的特征向量
于是就有这样的一个定义式
又设k是一个实数
则对X做数乘k倍
再左乘A
就等于kA再乘X
进而又等于k乘λ再乘X
由于k和λ是两个数
可以交换次序
所以它就等于
λ再乘以k倍的X
于是这就说明
在k不等于0的时候
k倍的X就是
A的属于特征值λ的
一个特征向量
另外一方面
如果我们设X1、X2
同样是A的属于λ的特征向量
于是有这样的两个定义式
把这两个式子相加
并且同样的都利用分配率
把A提出来
也把λ提出来
我们就可以知道
当X1+X2不等于0的时候
则它也为A的
属于特征值λ的特征向量
那么以上两点说明
属于同一个特征值的特征向量
对于数乘和加法运算都保持封闭
所以就说明A
属于特征值λ的特征向量的
任意非零线性组合仍是λ的特征向量
再加上零向量它们
就构成了Rn当中的一个子空间
把上述讨论总结一下
我们就可以得到如下的定义
也就是定义1
设A为n阶方阵
λ是A的一个特征值
则我们把满足AX=λX的所有向量
这里包含了零向量
它们构成的集合称为
A的关于特征值
λ的特征子空间
记为Vλ
其维数称为
特征值λ的几何重数
对于定义1
我们有如下的说明
第一点
特征子空间
Vλ中并不全都是特征向量
因为它还包含了零向量
第二点
很容易知道
它的几何重数实际上就等于
对应λI-A为系数
的齐次线性方程组
的解空间的维数
也就是等于n减去它的
系数矩阵的秩
而根据我们之前的讨论
几何重数是大于等于1的
至此
我们就解决了
之前提出的结构问题
也就是属于A的同一个特征值
λ的特征向量再加上零向量
就构成了Rn当中的子空间
我们就把它称为特征子空间
自然的问题是
属于A的不同特征值的
特征向量有什么关系呢
下面我们就来回答这个问题
也就是第三节
特征向量的相互关系
也就是定理2
属于A的不同特征值的
特征向量是线性无关的
下面我们来证明这个结论
设λ1到λs为
A的s个互不相同的特征值
这里s小于等于n
而设X1到Xs是
相应的特征向量
于是对于λi和Xi
就满足这样的定义式
下面我们对不同特征值的
个数s做归纳法
当s=1的时候
由于特征向量是非零的
所以我们知道一个特征向量
一定是线性无关的
假设我们的结论
对s-1的时候成立
那么下面考虑矩阵
具有s个不同的特征值时的情形
那么我们要证这s个特征向量
是线性无关的
那么首先先把它们的
线性组合等于0设出来
并且记为1式
我们用A来左乘1式的两边
就得到了这样一个等式
那么利用
特征值和特征向量的定义式
我们可以把左乘以A写为
左乘以特征值λi
于是就可以写成这个式子
我们把这个式子记为2式
另一方面
我们用λs去左乘1式的两边
我们又可以得到这样的一个式子
这样的式子我们把它记为3式
那么对比2式和3式
我们会发现它们的
最后一项是相同的
于是我们就把2式和3式相减
就得到了这样一个等式
这个等式观察一下
我们就会发现
它是X1、X2到Xs-1,s-1个
向量的线性组合
等于0
由归纳假设X1到Xs-1是
线性无关的
于是我们只有组合的
系数要等于0
那么由已知条件
我们会知道这里的λi
是互不相同的特征值
所以λi-λs均不等于0
于是得到ki=0
这里i从1跑到s-1
再把这s-1个0代回到1式里边
就得到了ks倍的Xs就等于零向量
那么又因为Xs是特征向量
它是非零的
所以只能有系数ks也要等于0
从而我们就推出了
1式当中的所有组合的系数均为0
所以X1到Xs是线性无关的
我们定理的结论成立
如果我们再把几何重数考虑上
那么我们的定理2
还可以推广为以下的结论
也就是定理3
我们设λ1到λs为
A的s的互异的特征值
并且通过
求解对应的齐次线性方程组
我们可以得到属于
λ1的m1个线性无关的特征向量
把它记为X11、X12到X1m1
而这m1个特征向量就是
对应齐次线性方程组的
一个基础解系
同样的道理
对于特征值λ2
我们也可以得到
m2个线性无关的属于
λ2的特征向量
以此类推
对于λs我们可以得到
ms个线性无关的特征向量
于是我们把上述
所有的特征向量合并起来
得到了m1加m2
一直加到ms个特征向量构成的集合
我们得到的结论
就是这个向量组是线性无关的
定理3的证明方法与
定理2是类似的
我们需对每组特征向量
使用归纳法
即可证明
在这里我们就不再展开
请同学们课下进行推导
本讲小结
在本讲当中
我们进一步讨论了
特征值与特征向量的基本问题
首先我们通过
特征多项式的系数的
不同表示方式
得到了两个关于特征值的
重要性质
即全体特征值之和
等于矩阵对角线上元素之和
也即等于矩阵的迹
而全体特征值之积
等于矩阵的行列式
进一步
我们讨论了
特征向量的性质
一方面
对于属于
同一个特征值的特征向量
我们证明了
它们组成的集合
再加上零向量构成了
Rn中的一个子空间
称为特征子空间
从而回答了之前提出的结构问题
其维数称为特征值的几何重数
这与特征值的代数重数是相对应的
它们俩的关系
将来将成为一个重要的理论判则
另一方面
对于属于不同特征值的特征向量
我们证明了
它们必然线性无关
从而回答了之前提出的关系问题
好
本讲的内容就到这
我们下讲再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换