当前课程知识点:简明线性代数 > 第8章 矩阵与变换 > 8-4 矩阵变换的不变量与特征值理论 > 8-4 矩阵变换的不变量与特征值理论
同学们大家好
欢迎来到MOOC课程
线性代数先修课
第八章 矩阵与变换
8.4节
矩阵变换的不变量与特征值理论
在本讲当中 我们将讨论
矩阵的特征值
与特征向量的几何意义
具体来说
我们将分析矩阵变换的特征值
与特征向量所对应的
几何不变量以及关系
并进一步
通过分析投影 反射 旋转等
具体的矩阵变换
来验证上述变换中
代数意义和几何意义的一致性
我们先来看这样的一个问题
在第七章当中
我们介绍了
矩阵的特征值
与特征向量的概念
并讨论了其性质和求法
特征值与特征向量
是方阵内在的特性指标
那么它们在矩阵变换中
代表了什么含义呢
我们还是从二维的情况
入手开始讨论
发现规律后再推广到更高的维数
先来看这样的一个例子
例1 设A是由
1和2组成的实对称阵
而在平面R2中有三个点
分别记为E F和G
请问 由EFG构成的三角形
在矩阵变换A的作用下
将变换成什么图形
具体求解如下
由于矩阵变换将线段变成线段
故A的作用将△EFG
还是映为另外一个三角形
我们不妨设E'为E在A下的像
F'为F在A作用下的像
而G'为G在A作用下的像
于是我们很容易计算出
E' F'以及G'的坐标
通过观察
我们发现由1和1构成的
二维列向量
经过A的作用后改变了大小
但是并没有改变方向
而(-1 0)这个二维列向量
经过A作用
大小与方向 也就是所在的直线
均发生了变化
而(1 -1)这个二维列向量
经过A的作用后
仍在同一条直线上
但是方向发生了变化
进一步向量(1 1)
与向量(1 -1)
所在直线上的
所有向量在A的作用下
分别满足以下的两个关系式
经过观察
我们发现第一个关系式
A的作用就相当于
对原来的向量
进行一个伸缩变换
而这个伸缩的倍数就是3
而第二个关系式
把原来的向量进行一个反射变换
而这两个关系式
在k和t不等于0的时候
就满足我们的特征值
与特征向量的定义式
所以我们根据这两个式子
可以得出A的两个特征值
分别为3和-1
而分别对应的特征向量为
(1 1)以及(1 -1)
由它们生成的特征子空间
就是这样的两条直线
我们分别把它们记成L1和L2
于是 在本例当中
在特征向量的方向上
也即在特征子空间中
矩阵变换作用的形式较为简单
仅为相同倍数的伸缩或者反射变换
而特征值就是伸缩
或者是反射的倍数
根据这个例子
我们可以把结论
推广到一般的情形
也即第二点
矩阵变换的特征值与特征向量
首先 我们给出不变子空间的概念
定义1 设A为n阶方阵
若有Rn的子空间W
满足W中的任意向量x
均有A作用x后仍然属于W
则我们称W是
矩阵变换A的不变子空间
那么对于2阶矩阵而言
R2中的0维和2维子空间
均为平凡子空间
他们显然是
所有2阶矩阵变换的不变子空间
故我们只关心
是否有1维的不变子空间
对于上述例1
很容易验证
特征子空间也就是
直线L1与L2就是A的
1维不变子空间
又因为特征向量v1
与特征向量v2线性无关
所以对于平面中的任何向量
x均存在唯一的k1 k2
使得x能够表示为
v1和v2的线性组合
组合系数为k1 k2
又将A对x的作用分解为了
两个方向
一个方向是在v1上的作用
它为一个伸缩变换
另一个方向就是在v2上的作用
它为一个反射变换
这样的分解可以简化
我们矩阵和向量的乘法
特别是在计算A的
k次方乘以x的时候
具体可以参见我们7.6节当中
各个例题当中的方法二
对于一般情形
根据矩阵特征值
与特征向量的定义
很容易证明如下的结论
从而说明特征值
与特征向量的几何意义
结论 设A为n阶方阵
λ为A的任意特征值
向量v为属于λ的
任意特征向量 则第一
由v生成的子空间Lv
为矩阵变换A的
1维不变子空间
而特征子空间Vλ
为矩阵变换A的
m1维不变子空间
其中m1为λ的几何重数
第二点
A在特征子空间上的作用
仅为倍乘变换
包括伸缩变换
反射变换和恒等变换等
其中特征值λ
为这个倍乘的公共系数
下面我们将对
2维和3维空间当中的
一些具体变换
展开讨论以验证我们刚才的结论
例2 对3维空间当中的
线投影变换
我们把它记为Pl
其中l为单位向量
我们首先计算P作用在l上
将P的表达式代入
就得到了这样的一个算式
再利用结合律
我们先算后面的一个算式
因为l为单位向量
所以l的转置乘以
l就等于壹
所以这个计算结果就等于l
那么这个式子说明了
矩阵A具有壹的特征值
而l就是属于壹的一个特征向量
因此由l生成的子空间
就构成了A的
一个1维特征子空间
此外 若v与l正交
则我们去计算P作用在v上
将P的表达式代入
利用结合律
先算后面两个向量相乘
发现它们等于零
从而P作用在v上等于零向量
这个式子说明了
矩阵A具有0的特征值
并且所有与l正交的向量
构成了上一个特征子空间的
正交补
那么根据正交补的维数
它应该等于2维的
因此我们得到了
另外一个2维的特征子空间
综上 我们得到了
线投影变换作用
在l生成的子空间中
保持向量不动
而投影变换
作用在l生成的子空间的
正交补空间当中
向量均变成零向量
这一点与线投影的
几何意义是一致的
例3 对于3维空间当中的
面投影变换
其中n为投影平面
π的单位法向量
根据面投影的变换矩阵
我们首先先来计算
P作用在法向量n上
代入之后呢很容易计算
它作用结果为零
这推出了A具有0的特征值
并且它所对应的特征子空间
就是由n生成的子空间
即维数为1维
此外 我们考虑任意
与n正交的向量v
那么P作用在v上
很容易计算它等于v
所以我们就得到了
另外一个特征值为1
而属于1的特征向量组成的
特征子空间
就是它法向量的生成
子空间的正交补
也就是我们的投影平面
而这个维数是等于2维的
因此根据特征值为1
我们就知道
P作用在投影平面π上
保持向量不变
而根据特征值为零
我们就知道
P将π的法方向的向量
变为零向量
而这一点与面投影变换的
几何性质是一致的
进一步再来看空间当中的
线反射变换
变换矩阵如下
其中l为反射直线的单位向量
首先我们还是来考虑
R作用在单位向量l上
经过计算它等于l本身
所以这个式子推出了
变换具有壹的特征值
并且对应了一个特征子空间
就是由l生成的子空间
其维数为壹维
那么对于所有与l正交的向量v
经过计算我们会知道
R作用在v上会等于-v
这个式子推出了
变换具有负壹的特征值
并且对应了
一个2维的特征子空间
即为上一个特征子空间的
正交补空间
由于特征值等于壹
我们就知道R作用
在反射直线上保持向量不变
而由于特征值为负壹
则R作用在所有
与l正交的向量上
将其变为相反的向量
而这一点与线反射变换的
几何性质是一致的
考虑完线反射
那么我们来考虑面反射变换
面反射变换的矩阵如下
其中n维反射平面π的
单位法向量
同样道理 我们考虑
R作用在n上等于-n
于是就得到了-1的特征值
并且得到了一个
由n生成的1维特征子空间
此外 我们考虑所有
与n正交的向量v
R作用在v上就等于v自己
从而我们就推出了
变换具有1的特征值
而同时就对应了
一个2维的特征子空间
而这个特征子空间
正好就是反射平面π
因此根据我们本讲的主要结论
由于特征值等于1
所以R保持反射平面上的向量不变
而由于特征值等于-1
而R将π的法方向上的
向量变为其反向量
而这一点
与面反射变换的
几何性质是一致的
最后 我们再来看
2维空间当中的
旋转变换
旋转变换的矩阵
根据我们上节讨论
它就等于这样一个2阶矩阵
其中θ表示旋转的角度
首先我们来分析它的特征值
根据矩阵形式
我们得到特征多项式
为这样的形式
那么利用二次方程的求根公式
我们能计算出
它具有两个特征值
分别为如下的形式
因此当旋转角度θ
不等于0和π的时候
旋转矩阵没有实的特征值
从而就没有实特征向量
这说明 当旋转角度
不等于0和π的时候
旋转变换在实平面中
除了零向量以外
没有向量是保持方向不变
或者是方向相反的
而这一点和旋转变换的
几何性质也是一致的
本讲小结
在本讲中
我们讨论了特征值
与特征向量的几何意义
具体来说
矩阵变换在特征向量的方向上
较为简单
仅为倍乘变换
包含伸缩 反射 恒等变换等
而特征值为该倍乘的系数
此外 特征向量所在的直线
为矩阵变换的1维不变子空间
利用好这些性质
可以使矩阵变换的运算得到简化
例如 在7.6节中
几个实际问题的求解方法二
就是如此
进一步 我们具体讨论了
低维空间中
线 面投影变换 线 面反射变换
以及平面中的旋转变换
对于这些变换
我们通过代数方法分析它们的
特征值与特征向量
以及特征子空间
从而验证了它们几何作用的效果
说明了它们的代数意义
与几何意义是一致的
好本讲的内容就到这里
下一讲 再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换