当前课程知识点:简明线性代数 > 第7章 矩阵的特征值理论 > 7-5 实对称阵的对角化 > 7-5 实对称阵的对角化
同学们 大家好
欢迎来到mooc课程
线性代数先修课
第7章 矩阵的特征值理论
7.5节 实对称阵的对角化
在本讲中
我们将对一批特殊的方阵
也即实对称阵展开讨论
首先我们分析
实对称阵的特征值
与特征向量的性质
并利用其较好的性质
我们可得到
实对称阵可正交对角化的结论
接下来我们将给出
实对称阵正交对角化的
具体方法和步骤
最后我们将给出一些
实对称阵相关的例题
矩阵的相似对角化问题
是本课程中
一个非常重要的理论问题
并且在很多实际问题中
都有应用
我们在上一讲中给出了
n阶方阵对角化的充要条件
也即A可对角化
当且仅当A有n个
线性无关的特征向量
又当且仅当对A的
每个特征值均有
几何重数等于代数重数
然而上述
两个充要条件都不太直观
我们的问题是
是否有一批n阶方阵
我们可以从其直观形式上
就可以判断
它们是否可对角化
而无须去具体计算
它们的特征值和特征向量
我们的回答是有的
例如实对称阵
就是一批一定
可以对角化的矩阵
本节就对实对称阵展开讨论
对于一般的n阶方阵而言
是否可对角化是
一个不易判断的问题
一个实矩阵想要
在实数范围内对角化
首先要保证其特征值
均为实数
其次它要有n个
线性无关的特征向量
但是并非任何一个
实矩阵都有实的特征值
从而就不一定可以
在实数范围内对角化
那么n阶实对称阵的概念
我们已经在
第三章当中介绍过了
也即一个n阶方阵A
如果它的转置等于它自己
则称为n阶实对称阵
本节主要的内容就是要说明
任意实对称阵在
实数范围内可以对角化
不仅如此还能找到
一个正交矩阵Q使得
Q逆乘以A再乘Q为对角阵
也即实对称阵可正交对角化
而这就要求
实对称阵的特征值均为实数
并且特征向量
可构成一组标准正交基
首先我们先来讨论一下
实对称阵的特征值
与特征向量的性质
为了说明实对称阵的性质
我们先要介绍一些
关于复数的基本概念和结论
定义1
设复数z表示为a加bi的形式
这里a b属于实数
而i表示根号-1
于是复数z的复共轭运算
就定义为如下算式
并且用z加一个
上划线的形式来表示
从复平面的图像上来看
如果z是一个黄色向量的话
则它的复共轭
就对应了
与x轴对称的一个红色向量
我们用一个简单的口诀
来表示复共轭
即实部不变
虚部取反
容易验证
复共轭运算有如下性质
1与复数的四则运算
即加减乘除相容
这里的相容
就是指可交换运算次序
也就是先做共轭再做加减
等于先做加减再做共轭
先做共轭再做乘除
等于先做乘除再做共轭
具体验证比较容易
希望大家在课下自行验证
另一条性质我们称为正定性
也即复数和它自己的
共轭相乘等于
它所对应向量的模长的平方
也即a平方加b平方
是大于等于0的
且等号成立
当且仅当z等于0
由于实数属于复数
我们可以把实矩阵的概念
拓展为复矩阵
把复数的共轭运算
拓展为复矩阵的共轭运算
具体如下
我们把这样形式的矩阵
称为一个复矩阵
其中它的每一个分量
小aij是属于复数
而对于一个复矩阵
它的共轭运算就定义为
每一个分量的共轭运算
根据复数
及复数共轭运算的定义
我们很容易证明
共轭的矩阵有如下的性质
即第一条
两次共轭等于它自己
共轭转置等于转置再共轭
倍乘之后再共轭
等于共轭的倍乘
再乘以共轭的矩阵
共轭之后再相加
等于两个矩阵
相加之后再共轭
两个矩阵共轭之后
再相乘等于相乘之后再共轭
第五 若A可逆
则A逆的共轭等于A共轭的逆
第六条
A共轭的行列式
等于A的行列式再共轭
第七条
A为实对称阵则
当且仅当A转置等于A
A共轭等于A
这些运算规律
也请大家自行在课后进行推导
有了以上理论准备
我们来看
实对称阵的特征值
与特征向量的性质
定理1
设A是n阶实对称阵
则A的特征值均为实数
下面我们就用
复数的性质来证明这条结论
由A必有复的特征值
所以我们可以设
复数λ是A的特征值
而复向量X是对应的特征向量
于是根据特征值
与特征向量的定义
我们就有AX=λX的形式
则两边都取共轭
就得到了这样的一个式子
其中我们用到了
A是一个实矩阵
所以它等于它自己的共轭
再利用共轭
与其他运算相容的性质
我们就得到了这样的一个等式
而对刚才的定义式
两边左乘X的转置再共轭
就得到了这样一个等式
其中第二步我们优先计算A乘X
从而就得到了这样的式子
我们把它记为2式
另一方面在上式当中
如果对于第2个等式
我们优先计算X的转置共轭
再乘A的话
那么经过推导
我们就得到这样的一个式子
我们把它记为3式
把2式和3式相减
我们就得到了
0等于λ减去λ的共轭
再乘以X的共轭转置再乘X
由于X是一个特征向量
因此它是一个非零向量
所以我们去计算
上述等式的最后一项
也即X的共轭转置
再乘以X就等于
xi的模长平方再相加
这是一个实数
由于X不为零向量
所以这个实数计算不等于0
从而推出了λ减去
λ共轭要等于0
而这个式子就说明了
λ必须为实数
那么再由λ的任意性
就知道了实对称阵的
所有特征值均为实数
对定理1
我们有如下的说明
第一条
未必所有的实矩阵
对应的特征值都是实数
例如我们可以
举一个简单的例子
这样的一个2阶矩阵
它很容易计算它的
特征多项式是这样的
一个二阶行列式
计算之后它等于λ平方加1
求解这个关于λ的二次方程
我们很容易得解出
λ等于正负i
所以A虽然是一个实矩阵
但是它的两个特征值
均不为实数
定理1说明
在特征值方面
实对称阵比起一般的矩阵
有更好的性质
第二条说明
因为实对称阵A的
特征值λ为实数
所以对应的齐次线性方程组
λi乘单位阵再减A再乘X等于0
就是一个实系数的方程组
那么由于该齐次线性方程组
一定有实的基础解系
从而属于λi的
全体特征向量均为实向量
也即它的特征子空间
一定是Rn当中的子空间
下面我们来讨论
实对称阵特征向量的性质
也即定理2
实对称阵A的属于
不同特征值的特征向量
是正交的
下面证明
设λ1 λ2是实对称阵A的
两个不同的特征值
而X1 X2分别为
与之对应的特征向量
我们要证明X1与X2是正交的
首先由特征值
与特征向量的定义式
我们可以得到这样的两个等式
对于λ2的定义式的左边
我们左乘以X1的转置
就可以得到这样的一个式子
我们把它记为4式
而对于λ1的
定义式的两边转置之后
再右乘X2
那么就得到这样的一个等式
其中我们要用到A为对称阵
也即A的转置等于A的这条性质
我们把这个等式记为5式
观察下4式和5式
他们的左边是相等的
而右边只有微小的差别
因此我们把4式和5式相减
就得到这样的一个等式
由于我们之前已经假设
λ1与λ2是两个不同的特征值
所以就只能推出X1的转置
乘以X2等于0
这就等价于X1与X2的
标准内积是等于0的
从而这就说明了
X1与X2是正交的
因此我们就证明了定理2
例如在7.4节当中的
例1的第1小题当中
我们取得A就是一个
3阶实对称阵
那么经过计算我们得到了
A的特征值为λ1=1
并且代数重数为2
而λ2=4
从而属于特征值λ1=1的
两个线性无关的特征向量
是这样的两个向量
我们把它记为X11和X12
而属于特征值λ2=4的
一个线性无关的特征向量
就是这样的一个特征向量
我们把它记为X21
很容易验证X21与X11
以及X12均是正交的
代入验证就发现
他们的内积都等于0
从而我们就推出了
第一个特征值的特质子空间与
第二个特征值的特质子空间
是相互正交的
所以作为实对称阵的
两个不同的特征值
它们的特征子空间是正交的
第二点
实对称阵正交对角化的结论
相较于一般矩阵
实对称阵在特征值
与特征向量方面有较好的性质
于是根据特征值
特征向量与矩阵
相似对角化的一些关系
我们可以得到
本节最主要的结论
具体如下
定理3
对于n阶实对称阵A
总存在正交矩阵Q
使得Q逆乘以A
再乘Q为对角阵
由于Q为正交阵
所以Q逆就等于Q转置
所以我们也可以得到
Q转置乘A再乘Q为对角阵
下面我们来证明定理3
我们证明的方法是
对A的阶数n作归纳法
当n=1时
也即A为一个元素组成的矩阵
则一个元素的矩阵一定是对角阵
因此结论明显成立
假定结论对于n减1成立
下面来看n的情形
由定理1
我们知道
A的所有特征值均为实数
所有特征向量均为实向量
所以可在欧式空间
Rn中讨论问题
我们下设λ1为
A的一个实特征值
而X1是属于λ1的
一个单位特征向量
于是我们可以把
X1扩充成为Rn的
一组标准正交基
不妨设为X1 X2一直到Xn
我们令Q1等于
由X1 X2一直到Xn组成的矩阵
那么由于他们是标准正交基
所以Q1为正交矩阵
并且我们去计算A乘以Q1
相当于把A分别乘到
Q1的每个列上
由于X1是特征向量
所以它的第一列
就等于λ1再乘X1
进一步我们可以把
这个等式表示成为
X1 X2一直到Xn组成的
形式行向量乘以
这样的一个矩阵的形式
其中这个矩阵的
第一列为λ1和一个零向量
而其他列我们
并不清楚它等于什么
于是用*号的形式表示
当然我们也可以
把*号的形式具体表示出来
其中α转置为
某个n减1维行向量
而A1为某一个n减1阶方阵
因而我们对于上述等式两边
都左乘以Q1的逆
就得到了这样一个等式
我们注意到Q1为正交阵
所以Q1的逆
也可以表示为Q1的转置
故上式的左边依然为对称阵
从而右边也是对称阵
因此我们就得到了
刚才假设的那个α转置
就必然为零向量
而假设n减1阶矩阵A1
也要为对称阵
于是A1符合我们的归纳假设
也即存在n减1阶正交矩阵Q2
使得A1可以正交对角化
并且设对角阵为Λ1
它的主对角线上的
n减1个元素分别为
λ2 λ3一直到λn
下面我们令矩阵Q
等于这样的形式
由于Q1 Q2均为正交阵
很容易验证矩阵Q也为正交阵
因此我们去计算
Q转置乘A再乘Q
就等于这样的一个式子
而我们刚才已经算得
Q1转置乘A再乘Q1是
等于这样的一个准对角阵
进一步把这三个准对角阵
相乘就等于这样的
一个准对角阵
那么这个准对角阵的
右下角根据归纳假设
就等于一个对角阵Λ1
所以整个矩阵
就等于一个对角阵
其主对角线上的元素
就为λ1 λ2一直到λn
从而我们就证明了
结论对n的情形也成立
因此根据归纳法
我们就完成了定理3的证明
需要说明的是
我们对定理3的证明方法
是存在性的
而非构造性的
换言之
也就是我们并没有直接给出方法
去计算对角阵Λ与正交阵Q
但是很容易知道对角阵Λ
可由全体特征值决定
那么问题就集中到
正交阵Q应该如何确定呢
当然决定正交阵Q需要
从特征向量入手
那么由矩阵可对角化的
充要条件我们就可以得到
这样的一个推论
即推论2
n阶实对称阵必有
n个线性无关的特征向量
且对A的全体互异的
特征值λ1到λs
我们有其几何重数之和
等于整个空间的维数n
进一步还可以得到
实对称阵在
特征向量方面的特性
也即推论3
n阶实对称阵
有n个相互正交的单位特征向量
我们给出推论3的证明
由推论2取定
n个线性无关的特征向量
在每个特征子空间Vλi内
对已有的mi个线性无关的
特征向量做施密特正交化
于是就可以得到
特征子空间内的单位正交基
再将全体特征子空间的
单位正交基并起来
由推论1我们就知道
上述所得的即为
实对称阵的
n个相互正交的单位特征向量
三 实对称阵正交对角化的方法
实际上
刚刚的定理3及其推论
已经说明了
第一点
实对称阵有n个
线性无关的特征向量
它的每个特征值λi的
几何重数等于代数重数
第二点
如果不要求用
正交矩阵做相似对角化
则可直接用特征向量组成的
矩阵P来作相应的可逆矩阵
如果还要求
用正交矩阵做相似对角化
则在所求出的特征向量后
用施密特正交化方法进行正交化
用正交化后所得到的
特征向量即组成相应的
正交矩阵Q
于是把上一节中
n阶方阵对角化的步骤
稍作修改
即可以得到n阶实对称阵
正交对角化的步骤
具体如下
第一步 分解特征多项式
求A的特征值
假设A的特征多项式
能表示为这样的形式
则λ1到λs为A的
互异实特征值
其代数重数分别为n1一直到ns
第二步 对每一个特征值λi
分别去计算属于它的特征向量
也即求解对应的齐次线性方程组
λi乘I减A再乘X等于0
通过高斯消元法
得到一组基础解系
我们把它记为Xi1
Xi2一直到Ximi
其中mi为λi的几何重数
并且由A可正交对角化
则必有mi=ni
第三步 求变化矩阵
若没有正交的要求
则把刚才所有的
基础解系并起来得到的
可逆矩阵P就是变换矩阵
并且由对应原则
可以得到对应得对角阵
若还有正交对角话的要求
则我们分别对
每一组特征向量Xi1
一直到Xini用施密特
正交化方法进行正交化和单位化
得到的一组向量
记为εi1一直到εini
进而我们把
这些单位特征向量并起来
就得到了一个正交矩阵
把它记为Q
从而就得到了正交对角化的方法
这里如果我们得到了一个正交阵
则我们可以把它表示为
Q转置乘A再乘Q的形式
这里的好处是
不必要再去计算Q的逆
好 有了上述步骤
我们来看一个具体的例子
例1
设A是这样的一个4阶实对称阵
题目要求我们用
两种方法将其对角化
一种是普通的对角化
另一种是正交对角化
首先我们按照步骤
先求A的特征值与代数重数
通过计算其特征多项式
也即这样一个4阶的含参行列式
得到它的有两个特征值
分别为λ1等1
其代数重数n1等3
λ2等负3
其代数重数n2等1
其次对于特征值λ1等1
求解对应的齐次线性方程组
来求特征向量
具体
把对应的系数矩阵写出
并且经过初等行变换
得到简化的阶梯阵如下
这个简化的阶梯阵
告诉我们其基础解系分别为
X11 X12和X13
为这样的3个列向量
再次我们对特征值
λ2等负3去求解它的特征向量
具体地
把对应的齐次线性方程组的
系数矩阵列出
并且经过初等行变换化为
简化的阶梯阵
经过简化阶梯阵
我们可以得到其基础解系
为这样的一个列向量
记为X21
于是我们给出A的
普通对角化的方法
就是把刚才的
4个列向量并起来
得到可逆阵P
而对应的把特征值
按重数的方式列出
就得到了对应的对角矩阵大Λ
第二种方法为
正交对角化的方法
我们分别对刚才
求得的两组基础解系
去做施密特正交化方法
其中套用施密特
正交化方法的公式
我们先做正交化
得到三个β的向量
再做单位化就得到了
这样三个ε的向量
对于另外一组基础解系
只有1个向量
因此直接做单位化
就得到了这样的第4个列向量
需要说明是对于
每一组基础向量
分别做施密特正交化
其计算量明显优于
对4个列向量做施密特正交化
也就是整体正交化
将刚刚分别局部正交化
所得到的单位正交向量
ε11 ε12 ε13以及
ε21按列并起来
就得到了如下的正交矩阵Q
并且对角阵
就是Q转置乘A再乘Q
等于这样的形式
我们提出一个问题
这样求出的正交阵Q是唯一的吗
根据我们上一节的
讨论可以知道
由于之前求得的
基础解系可以不唯一
因此这样得到的
正交阵Q并不是唯一的
接下来我们再来看一个例子
例2 已知A为3阶实对称阵
其特征值分别为1 1和2
且属于2的特征向量
是1 0 1这样的一个列向量
请大家求A
我们还是来分析一下
由题设我们已知特征值
与部分特征向量
要求是把实对称阵A给求出来
由于已经说明
是一个3阶实对称阵
因此A一定可以对角化
也即存在正交阵Q
使得Q转置AQ等于对角阵Λ
那么反过来我们就可以解出
A等于QΛ再乘以Q转置
其中Λ与Q分别
可由A的特征值
与特征向量来确定
那么由于我们
只有部分特征向量的信息
所以要决定矩阵A
就需要把剩余的特征向量
来决定出来
而剩余的特征向量
可以由不同特征值下的
特征向量的正交性来确定
好 具体的求解步骤如下
A是一个3阶实对称阵
正交相似于对角阵Λ
主对角线上元素分别为1 1 2
属于特征值1的特征向量
必然与属于特征值2的
特征向量是正交的
所以这就等价于
去求解这样一个
齐次线性方程组
它的系数矩阵就是1 0 1
由高斯消元法
很容易求解出这个
齐次线性方程组的
两个线性无关的解
为0 1 0和1 0 -1
并且它们已经彼此正交了
所以直接单位化以后
就可以得到相应的
正交矩阵Q是这样的形式
最后我们再把Q和Λ
代到这个等式里就可以计算出A
具体计算我们留做课后习题
对于这个例题
我们做如下的几点说明
第一 在具体计算过程当中
正因为我们采用了正交阵
所以这里可以避免去求矩阵的逆
而直接去求转置即可
第二点
当实对称阵只有
两个特征值的时候
其两个特征子空间互为正交补
所以我们可以由其中的
一个子空间来决定
另一个子空间
而这个方法
还可以推广到实对称阵
具有s个不同特征值的情形
但是要求
要已知其中s减1个特征子空间
从而可以由正交性
决定最后一个特征子空间
本讲小结
在本讲中
我们说明了实对称阵
是一类性质较好的方阵
具有一般矩阵所没有的结论
我们首先证明了
实对称阵的特征值均为实数
其次证明了实对称阵的属于
不同特质值得特征向量
是相互正交的
进而利用上述两条较好的性质
我们证明了实对称阵
可以正交对角化
最后我们在
一般矩阵对角化步骤的基础上
略做调整就得到了
实对称阵正交对角化的具体步骤
实际上若要求变换矩阵为正交阵
我们只需要在
求出各组特征向量的基础解系后
再进行局部的施密特正交化
即可以得到相互正交的
单位特征向量
从而得到对应的正交阵
实对称阵的正交对角化理论
是本门课程之前所学
所有内容的综合运用
比如在计算过程中
我们需要做含参行列式的计算
需要做因式分解
需要解齐次线性方程组
还需要做施密特正交化等等
因此实对称阵的正交化理论
是将来考察的重点
同学们一定要多加练习
熟练掌握
本讲的内容就到这
我们下讲再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换