当前课程知识点:线性代数(2) > 第一讲:正定矩阵 > 1.1 实对称矩阵A正定的充要条件 > 1.1 实对称矩阵A正定的充要条件
各位同学大家好
欢迎来到线性代数2的课堂
我们在线性代数1
介绍了一类重要的矩阵
实对称矩阵
实对称矩阵的特征值都是实数
其中特征值都是正数的矩阵
叫做正定矩阵
我们在这一节我们将介绍
正定矩阵的判别方法 性质
和应用
以及与之相关联的
二次型的性质和应用
矩阵特征值的符号
具有重要的意义
比如说对于微分方程du/dt=Au
那么如果矩阵A的特征值
全是负数
那么对于每一个特征值 lambda
以及相应的特征向量x
我们就总有衰减解e lambda tx
但是对一个给定的矩阵
如果不能确定特征值是不是实数我们就无从讨论
它特征值的符号
我们上学期已经了解到
有一类非常重要的矩阵
也就是实对称矩阵
实对称矩阵的特征值全是实数
那我们就可以讨论
实对称矩阵特征值是否为正
这时候就变成一件有意义的事情
我们定义
特征值全是正数的实对称矩阵
称为正定矩阵
我们接下来讨论
正定矩阵的判别条件和应用
对于一个实对称矩阵A而言
我们希望
在不计算特征值的前提下来讨论
实对称矩阵正定的判别条件
我们有下面的6条等价的命题
第1条呢
A的所有特征值 lambda i都是正的
这是我们的定义
第2条
对于任意的非零向量x
总是会有x的转置乘以矩阵A
再乘以x
那这变成一个数
因为x如果是
看成是n乘1的一个矩阵
A是n乘n的一个方阵
x的转置是1乘以n的一个矩阵
那整个的x的转置Ax是一个数
1乘1的一个矩阵
那么它大于0
对于所有的非零向量x都成立
这是我们第二条判别条件
第3条
A的所有顺序主子式都是正的
一会我们来再交代一下
顺序主子式的概念
第4条
A的所有的主元都是正的
当我们谈主元的时候
是在谈不经过行交换的情况下
变成对角阵
这时候来谈主元
我们说A的主元都是正的
第5条
存在列满秩的矩阵R
使得A等于R的转置乘以R
那这个R不见得是一个方阵
我们只要求它的列是满秩就好
第6条呢
A的所有的主子式都是正的
好 这6条等价的
我们用它来作为实对称矩阵
正定的判别条件
我们来证一下
从第1条到第2条
也就是说假设一个矩阵A
它的特征值都是正数
我们来看
是否对于所有非零向量x
都会有x转置乘以A
再乘以x 是一个大于0的数
那我们知道对于实对称矩阵A
我们总存在着正交矩阵Q
使得A等于Q lambda Q转置
那其中的 lambda 它是一个对角矩阵
对角线上是A的特征值
这是实对称矩阵的一条
重要的性质
实对称矩阵
一定正交相似于对角阵
这个Q是由A的相应特征向量
作为列向量所构成的正交矩阵
也就是AQ=Q lambda
这是我们上学期学的内容
那么这时候如果它的特征值
都是正数的话
也就是这些 lambda i都是正数
于是我们任给一个非零的向量x
我们来看x的转置Ax这个数
那我们把A用Q lambda Q转置给取代
这个时候我们把这个Q转置x
我们叫做是y
于是相应的x转置Q就是y的转置
我们把这个y的分量
记成是y1到yn
那y的转置就记成是一个行向量
y1到yn
lambda 是一个对角阵
对角线上的元素是A的特征值
而这个乘出来是一个数
是一个1乘1的一个矩阵
那我们来看一下
它恰好就是 lambda 1 y1的平方
一直加到 lambda n yn的平方
那我们注意到这时候
这个y是等于Q的转置乘以x
Q是正交矩阵
它的转置仍然是正交矩阵
是一个可逆矩阵
x是一个非零的向量
所以Q转置乘以x
仍然是一个非零向量
也就是说它的分量y1到yn
不全为0
而这些个 lambda i又都是大于0的
于是这个和一定是一个正数
这样我们就由(1)证到了(2)
那从(2)到(1)是怎么看呢
第二条是说
对于所有的非零向量x
我们都有x转置乘以Ax
这个数是一个正数
特别地 我们把这个x
取成是相应于
特征值 lambda 的特征向量
我们把这样的x
代到我们的xTAx里头去
好 Ax就变成了 lambda x
我们第2条知道
这个数一定是大于0的
那到这边呢
lambda 因为是一个数
我们总可以提到前面来
那x的转置去乘以x
就变成是x这个向量的模长平方
由于x是一个非零向量
所以它的模长平方是大于0的
那它和 lambda 的乘积又是一个正数
因此我们一定有 lambda 是一个正数
这样就对于A这个矩阵
它任意的特征值
如果我们满足条件2的话
就一定知道这个特征值是大于0
这样由(2)得到了(1)
我们也可以把这个第2条
叫做是正定矩阵的一个定义
那么由(2)之后
我们来看看这个矩阵A
它所有的顺序主子式
是不是都是正的
我们知道行列式
是等于矩阵特征值的乘积的
如果已知第2条的话
我们可以得到第1条
刚才已经证过
那么这个矩阵A的行列式
就等于它这些特征值的乘积
而由第1条知道
这些特征值都是正数
因此矩阵A的行列式是大于0的
那我们在第2条的定义里头
取特殊的x
什么样特殊x呢
这个x它的后n-k个分量
我们取成是0
前k个分量我们记成是xk
它可以任意地取
是一个任意的k维的非零向量
这样的x的转置乘以A乘以x
是一个大于0的数
这是第2条的条件
那么把这样特殊的x乘出来
我们就得到
k维向量xk它的转置去乘以
在这个位置的矩阵
Ak再去乘以xk
那么对于Ak而言它满足第2条
所以我们说Ak是正定的
对于正定矩阵我们又知道
它的行列式一定是大于0的
因此我们也就证明了说
所有的顺序主子式都是正的
那如果这个矩阵A
所有的顺序主子式都是正的
我们来看看它的主元
我们说顺序主子式
与主元有直接的联系
第k个主元dk它是等于
k阶的顺序主子式(的行列式)
去除以k-1阶的顺序主子式
那么如果顺序主子式
都是正数的话
因此这个商也是正数
因此所有的主元都是正的
这个Ak我们叫顺序主子矩阵
它的行列式我们叫做顺序主子式
我们来看一下k阶主子式的定义
在n阶的行列式中
任取出同标号的行与列
构成的一个新的行列式
也就是说我们任取k行
第i1 i2 ik行
再取相应的第i1 i2 ik列
那么由上述的这k行k列
交汇处得到的元素
所构成的新矩阵的行列式
我们称为是
原来k阶行列式中的一个
k阶主子式
那特别地
在这个n阶行列式中
由第1到第k行
和第1到第k列所确定的主子式
我们是叫做k阶顺序主子式
那它是这个行列式
左上角的那个主子式
我们叫做顺序主子式
我们来看例子
A是一个5乘5的矩阵
那它的三阶顺序主子式
是在左上角的第1行 第2行 第3行
第1列 第2列 第3列
所构成的这个矩阵 它的行列式
这是它的三阶顺序主子式
那下面呢 A235
这是在原来矩阵的第2行
第3行和第5行
第2列 第3列 第5列
交汇出得到的这个新的矩阵
它的行列式
这是它其中的一个三阶主子式
我们叫A235
好 这样我们接下来
再来看如何从第4条来证第2条
也就是来看
假设A的所有的主元都是正的
我们如何来看x的转置Ax大于0
对于所有的非零向量x成立
我们对对称矩阵
来做高斯消元法的时候
我们矩阵表达式LU分解
变成了LDLT分解
对于任何一个对称矩阵
我们都可以找到L矩阵
使得它等于LDLT
其中的这个D是一个对角矩阵
它的对角元是A的主元
那第4条我们知道说
所有的主元都是正的
也就是D的对角元都是正的
我们来看看
对于任意的非零向量x
我们看x的转置乘以Ax
那我们把A用LDLT给代 lambda
这个时候和刚才类似
我们把L的转置乘以x
记成是y
那么相应地x的转置乘以L
就是y的转置
于是又变成了是
一个向量的转置 y的转置
再乘以一个对角矩阵
D是对角矩阵
再去乘以y的形式
那这个数打开来不是别的东西
就是d1 y1的平方加上dn yn的平方
这时候我们仍然是把y1到yn
表示的是y这个向量的分量
那因为x是一个非零向量
L是一个下三角阵
对角线上的元素是1
所以这是一个可逆矩阵
L的转置也是一个可逆矩阵
于是一个可逆矩阵
乘以一个非零向量
叫做y之后
它仍然是一个非零向量
也就是说它的分量y1到yn
是不全为0的
又因为这些个d1到dn
它是大于0的
那我们这个和也是大于0的
这样就证明了对于这个矩阵
它对任意的非零向量
x转置乘以A再乘以x
是一个大于0的数
我们由(4)证出来了(2)
接下来我们来看一下从(2)到(5)
也就是说假设我们知道
对于任何非零向量x
有x的转置Ax大于0
我们来看一下是否存在着
列满秩矩阵R
使得A等于R转置乘以R
那我们对于实对称矩阵呢
我们知道可以从两个角度来看
它有LDLT分解
那因为我们刚才由(2)
我们总可以去证出来
它的所有主元都是正的
我们知道D这个对角矩阵
它的对角元是主元
这些主元都是正数
因此
我们可以把D这个矩阵
来求开平方
我们记成是根下D乘以根下D
那所谓根下D这个矩阵
它就是对角线上是主元的
平方根的这样的一个对角阵
这点能够实现
是由主元都是正数决定的
那我们就把根下D和LT
这个矩阵放在一起
那前面就变成了是根下D
乘以LT的乘积的转置
那我们就R叫做
记成是这个矩阵
那我们就把A写成了
R的转置乘以R的样子
而这时候R是一个可逆矩阵
因为根下D这个矩阵的对角线上
是正的主元的平方根
它是一个可逆矩阵
L是一个对角线上
都是1的下三角矩阵
L的转置是变成
对角线上都是1的一个
上三角矩阵
两个可逆矩阵的乘积
还是可逆矩阵
这样我们就把A写成了
R的转置乘以R的形式
这时候R这个矩阵是一个方阵
那么或者我们来利用实对称矩阵
它一定正交相似于对角阵
也就是说
我存在着正交矩阵Q
使得A等于Q lambda Q的转置
lambda 是一个对角元
是矩阵A的特征值的对角阵
同样地
我们可以把 lambda 这个矩阵
去给开平方
我们把它写成根下 lambda
去乘以根下 lambda
对角线上是正特征值的平方根
同样呢
我们把根下 lambda 和Q的转置
合在一起
前面这个因子
变成这个矩阵的转置
那我们来令R是取成根下 lambda
去乘以L的转置
这个矩阵也是一个可逆矩阵
这样
我们也把A给写成了R的转置
乘以R的形式
我们由(2)可以得到(5)
我们说(5)也很容易会得到(2)
假设一个矩阵
它存在着列满秩的矩R
使A=R的转置乘以R
那我们来看看
对于任何的非零向量x
x的转置乘以Ax
A可以写成是R的转置乘以R
那Rx可以合在一起
前面x的转置乘以R的转置
就变成Rx的转置
于是这个乘积就变成是
Rx这个向量它的模长平方
那因为我们要求
R是一个列满秩矩阵
x是一个非零向量
所以R去乘以x
还是一个非零向量
因此它的长度是一个大于0的数
于是这边就大于0
我们就证明了
对于任意的非零向量x
x的转置Ax一定是大于0的
得到了(2)
刚才第三条我们讲的是
A的所有顺序主子式都是正的
事实上对于A所有的主子式
我们也可以证明它都是正的
我们来看一下
先从第6条到第2条
我们说
如果A的所有主子式都是正的
那特别的
它的所有顺序主子式都是正的
也就是说有第3条
那有了所有顺序主子式都是正的
我们就可以证明第2条
所以由6可以证出来2
那我们再看由2是否能证出6来
看这个所有主子式
是不是都是正的
我们来假设来记这个Ai1到ik
是一个k阶的主子矩阵
我们还是通过取特殊的x
来实现这一点
我们任取一个非零的向量x
使得它除了xi1 xik这几个分量
这k个分量以外
其余分量都是0
这样一个特殊的n维向量
那么由第2条我们知道
对于这样的一个非零向量
x转置Ax是大于0的
那这个x的特殊性质我们代进去
我们就会得到
说起作用的只是这k个
不全为0的分量xi1 xik
它去乘以k阶主子矩阵Ai1 ik
再去乘以xi1到xik这个k维的向量
那从这个里头 我们就
它大于0我们就知道
这个主子矩阵它是正定的
那么根据一个正定矩阵
它的行列式一定大于0
我们就知道
这个主子矩阵的行列式
是大于0的
也就是说这个主子式是大于0的
这样我们就证明了说
如果第2条成立的话
我们所有的主子式就是大于0的
好 这样我们证明了
这6条是互相等价的
我们可以用它们来作为
判断一个实对称矩阵的判别条件
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语