当前课程知识点:线性代数(2) > 第一讲:正定矩阵 > 1.4 二次型 > 1.4 二次型
实对称矩阵跟二次型密切相关
我们来看一下二次型
其实在前面的计算中
二次型已经自然的出来了
我们看一下定义
对于n维的实向量X
以及一个n阶的实矩阵A
我们把下面这个函数X转置AX
我们叫做是一个实二次型
我们注意到X是一个n维向量
我们可以把它看成是一个
n乘1的矩阵
A是一个n乘n的矩阵
X转置是一个1乘n的矩阵
因此这是一个数值函数
如果把X的分量
记成是x1到xn
把A的分量记成是aij的话
你把这个乘积给乘出来
其实就是后面的这个aijxixj
i从1到n j从1到n
这样的一个二次齐次的多项式
关于X的n个分量的一个
二次齐次多项式
我们把这个二次齐次多项式
叫做是二次型
那由于这个X的转置乘以AX
我们可以把A
给写成一个对称矩阵
和一个反对称矩阵的和
那注意到
两个矩阵加起来还是A
并且前面这个矩阵
A加上A的转置除以2
是一个对称矩阵
A减掉A的转置除以2
是一个反对称矩阵
而且呢
X的转置乘以这个反对称矩阵
再乘以X以后是等于0的
那么于是X的转置乘以AX就等于
X转置去乘以这个对称矩阵
再乘以X
所以在二次型的定义里头
我们总是可以预先假定
这个矩阵A是对称的
并把这个对称矩阵
称为是二次型f(x)的矩阵
这样我们的任何一个二次型
总是跟一个对称矩阵
一一对应起来
这件事情没有讲得这么玄妙
其实我们接下来的例子里头
很容易看得到这一点
那如果是对于n维的复向量呢
我们给一个复矩阵A
我们相应于实对称这个条件
换成叫Hermitian矩阵这个条件
也就是说A等于它的共轭转置
也就是说
我们对A的每个分量都去取共轭
然后矩阵取转置
那这时候X的共轭转置
去乘以A乘以X
我们把它叫做一个复二次型
下面如果不特别说明的时候
我们讨论的都是实二次型
这样我们来看几个简单的例子
我们给一个二次型
注意到f(x、y)等于
x的平方加3xy加y的平方
这个二次型
是关于xy的一个二次齐次多项式
我们看一看它的矩阵表示
我们说它总可以写成
xy这个行向量和平方项
系数都是1 交叉项系数是3
我们分成两部分3/2 3/2
去乘以这个对称矩阵
再去乘以列向量xy
这就是我们的二次型f(x、y)
中间的这个矩阵呢
是二次型相应的矩阵
这个就体现出来我们刚才说
A加上A的转置再除以2这件事情
体现在我们把交叉项的系数
去除以2
那这个简单的例子
A是这样的一个实对称矩阵
我们看它所对应的二次型是什么
那也就是说
我们去给一个向量x1 x2 x3
作为分量的一个向量去乘以A
然后再去乘以
以x1 x2 x3为分量的一个列向量
好 乘出来看发现它等于
在平方项上
这是相应的系数
x1的平方加上2x2的平方
再加上5x3的平方
那么在交叉项上
x1 x2的系数是负2倍的根2
x1 x3的系数是1/2的2倍 是正1
好 这是这个矩阵
实对称矩阵所对应的二次型
那么在这个关系里头
我们很容易看到实对称矩阵
和一个二次型一一对应
所以研究二次型的问题
可以转化成
研究它相应的实对称矩阵
同样研究实对称矩阵
也可以转化成
去看它的相应的二次型
在这里头一个特别的情况
如果这个矩阵是一个对角阵
我们就把它
相应的二次型X转置DX
乘出来我们发现
是这个D的对角元
作为平方项的系数出现的
这样的一个特别的二次型
我们叫它是对角形的
我们可以看到
对于任何的一个二次型
总可以通过坐标变换
把它化成对角形的二次型
这是为什么呢
我们其实通过配方
总可以做到这一点
我们已经悄悄做过了
另外一方面
我们对于实对称矩阵A
我们来用它的分解
我们说总存在着正交矩阵Q
使得Q转置AQ等于Lambda
这个对角阵
对角元是A的实特征值
那么我们来看f(x)
也就是我们的X的转置AX
把A给换成QLambdaQ转置
那再利用矩阵乘法的结合律
把Q转置X给叫成是y
那于是原来的二次型f(x)
关于X的这样的一个表达式
就换成了关于y的表达式
y的转置乘以Lambda 去乘以y
那就可以展开来
用y的坐标写成是yi的平方
去乘以相应的Lambdai
然后再去求和 也就是说
我们之前的任意的一个二次型
f(x)等于X的转置乘以AX
经过坐标变换
y等于Q转置X
给化成了一个对角形的二次型
这是从我们实对称矩阵的性质
它的这个分解可以得到这一点
我们看道简单的例题
我们给了一个2乘2的
一个实对称矩阵 5 4 4 5
我们来解释一下
X转置AX 这是一个关于X的分量
x1 x2的一个二次齐次函数
是一个二次型
我们说 我们来解释一下
在平面上满足X转置AX等于1
的点的集合
那把这个矩阵代进去以后
X转置AX写出来这个
二次齐次多项式就是
5x1的平方加5x2的平方
再加上8倍的x1x2
这个方程
所表示的几何意义是什么
好 这个中学我们就会的
我们现在
从线性代数的角度上来看看
我们说X转置AX等于1
它定义了平面中的一条曲线
是二次齐次多项式来定义的
所以我们叫它二次曲线
那对于这个矩阵A呢
这个实对称矩阵
我们容易可以求出来它的特征值
是1和9
那你注意到说
我这个2乘2的矩阵
当然很好求特征值
另一方面你也可以看到
特征值的和
也就是这个矩阵A的迹
矩阵A的trees是5加5等于10
两个特征值的乘积
是矩阵A的行列式 也就是9
所以我们容易用韦达定理
求出来A的特征值
好 也可以相应地求出来
对于每一个特征值
所对应的单位特征向量q1和q2
我们在这里不写具体的计算步骤
那么我们用
这两个相应的单位特征向量
作为列向量
就可以构成我们的过渡矩阵Q
Q这个矩阵是正交矩阵
在这种情况下
A等于QLambdaQ的转置
Lambda这个矩阵
是以特征值为对角元的对角矩阵
好 这样我们具体做出来
A等于QLambdaQ转置
那么 我们的X转置AX等于1
具体形式写出来是这样
这不是本质的
我们来看这件事情
把A用QLambdaQ转置给代进去
然后把Q的转置乘以X
我们记成是y
好 原来的二次型就转化成
以y来表示的这样的一个形式
因为Lambda是一个对角形
所以Y转置LambdaY就是y1的平方
加上9y2的平方
相当于是从x坐标换到y坐标之后
我们这个二次曲线的方程
变得简单了
变成了标准方程
y1的平方加9y2的平方等于1
在新坐标系下
它是中心在原点的椭圆
它的长轴方向是(1,0)
长半轴的长是1
它的短轴方向是(0,1)
短半轴的长是1/3
这个长半轴和短半轴的长
分别对应着特征值Lambda1
根下Lambda1分之一
和根下Lambda2分之一
这是在这个y坐标系下
这个二次曲线的形状
那么我们换回到原来的旧坐标系
x1 x2坐标系下面
注意到我们刚才已经给出来说
Y和X的转换关系
就是Y等于Q的转置X
那这样就会有
y1等于x1加上x2除以根2
那我们把这个y1 y2的表达式
代到在y坐标下的标准方程里头去
我们就变成x1减x2除以根2的平方
再加上9倍的x1加x2
除以根2的平方等于1
那它表示的是中心在原点
长半轴的方向是
根2分之一 1 -1
长半轴长没有改变 是1
短轴的方向呢
是根2分之一 1 正1这个向量
短半轴的长是1/3(请忽视讲解中的口误)
短半轴的长是1/3(请忽视讲解中的口误)
那这里呢
正交矩阵Q的列向量
也就是矩阵A的单位特征向量
q1 q2给出来了这个椭圆的主轴
这是我们的这个
在x1 x2旧的坐标系下面
一个椭圆的样子
从这个例子里头
我们可以看到
下面的所谓主轴定理
我们说
假设A是一个n阶的实对称矩阵
我们总存在着正交变量代换
X等于Qy
使得二次型X转置AX
可以化成y转置LambdaY
那么y转置LambdaY
它可以写成Lambdaiyi的平方
然后对i再求和
这时候把原来的二次型
化成了对角形的二次型
其中我们的Q转置AQ等于Lambda是以
特征值为对角元构成的对角矩阵
我们这个定理叫做是主轴定理
那它就是简单的
由这件事情代进去得到的
那它有一个自然的推论
如果特别地说
我A这个矩阵它是正定矩阵的话
我们来看X转置乘以AX等于1
这个方程
它表示的中心在原点
主轴是沿着A的特征向量的方向
半轴长相应的是
1除以根下Lambdai分之一的一个
椭球面
这是在高维的情况
刚才我们的例子里头是在平面上
然后A呢
相应的也是二阶的一个正定矩阵
注意到这些LambdaI是A的特征值
好 这样给出来X的转置
乘以AX等于1它的几何意义
那从这里头我们说主轴是
由A的特征向量方向给出来的
半轴长是由特征值开平方
再取倒数给出来的
定理的证明很简单
定理的几何意义
我们也可以看清楚
从例子里头可以看出来
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语