当前课程知识点:简明线性代数 > 第8章 矩阵与变换 > 8-6 正交变换 > 8-6 正交变换
同学们 大家好
欢迎来到MOOC课程
线性代数先修课
第八章 矩阵与变换
8.6节 正交变换
在本讲中
我们将讨论一类特殊的矩阵变换
它们能保持几何对象的形状
也即正交变换
我们首先介绍
引入正交变换的背景
以及正交变换的定义
其次我们会给出
正交变换的等价形式
说明它与正交矩阵的联系
再次我们将在低维空间中
给出几类正交变换的例子
最后我们将证明
2 3维空间中的
正交变换基本定理
在几何问题中
常常需要求保持
几何图形的形状的变换
那么在物理问题中
有时需要描述物体
保持形状的运动过程
简称为刚体运动
本节我们就来讨论
这种保持形状的矩阵变换
因为它与正交矩阵的关系
我们就称这样的矩阵变换
为正交变换
那么何为保持形状呢
形状实际上与向量的
长度与夹角有密切关系
而我们在第六章中
已经讨论过长度与夹角
均可由内积来定义
因此我们可以用
如下保内积的条件
来刻画所需要的矩阵变换
一 正交变换的定义
定义1
在n维欧式空间Rn中
设给予了标准内积
并且设φA为一个矩阵变换
若对于任意向量α β
均有这个等式成立
我们把它记为(1)式
则我们称φA为正交变换
我们具体地来分析一下(1)式
(1)式的左边表示φA作用
在α与φA作用
在β两个向量做内积
也就等于Aα和Aβ做内积
它要求等于α和β之间的内积
这个式子说明
A的作用不改变
α和β之间的内积
那么我们做如下几点说明
第一 正交变换的定义
也适用于非标准内积
第二 根据刚才的分析
(1)式也可以称为保内积
第三 由于正交变换保持内积
所以它一定保持长度 保持夹角
统称为保度量
具体地用数学符号表示
就是这样的
也即Aα的长度
与α的长度相等
Aα与Aβ之间的夹角
等于α与β之间的夹角
对于任意向量α β成立
第四 平移变换
虽然是保持形状的
但是我们已经知道
它并非矩阵变换
所以平移变换不是正交变换
另外一方面
由平移变换不保持原点
故它不保持长度
所以这也说明
平移变换不是正交变换
下面我们来讨论
正交变换的几种等价形式
定理1
在n维欧式空间中
φA为矩阵变换
则下述条件等价
即1 φA为正交变换
也即保持内积
2 A的作用保持长度
对于任何α成立
我们把它记为(2)式
3 A为正交矩阵
下面我们来证明
这三个条件的等价性
首先 由刚才的注释
我们已经证明了
1可推出2
下面我们反过来验证2可推出1
假设对于任意向量α β
由(2)式可知
A作用在α加β上
其长度等于α加β的长度
那么对于这个等式
我们左边取平方
并且表示为内积的形式
进一步再把A乘到括号里边
就得到了这样的
两个向量做内积
进一步利用内积的
性质展开计算
就等于下面这三项
而对于另外一边
也就是α加β的平方
我们也用同样的方法
表为内积的形式
并进一步展开之后
就等于这三项相加
那么对比上面的三项
和下面的三项
再利用条件2
那么我们就得到了
Aα和Aβ做内积
等于α和β做内积
由α和β的任意性
我们就得到了
φA为正交变换
接下来我们来验证
1和3的等价性
在(1)式当中
我们取α等于第i个自然基
β等于第j个自然基
于是我们可以知道
A作用在ei上
与A作用在ej上
取内积就等于
ei和ej做内积
由于ei和ej做内积
等于δij
因此Aei和Aej作用
也等于δ
由于Aei和Aej分别为
A的第i列和第j列
于是上面这个式子说明
A的列构成了Rn的
一组标准正交基
于是A就是一个正交矩阵
反过来3推1
对于向量α β
首先我们先把α和β表示为
自然基德线性组合
组合系数分别为ai和bj
那么由于A是正交阵
所以A的列构成一组
标准正交基
因此满足Aei与Aej
做内积等于δij
从而我们去计算
Aα和Aβ之间的内积
把线性组合式代入
并且展开以后
就等于右边这个算式
由于Aei与Aej作用之后
等于δij
所以这些求和式当中
只有ai乘以bi的项不为0
而ai乘以bi正好就是
α与β之间的标准内积
因此我们验证了
Aα与Aβ做内积
等于α与β做内积
因此A的作用是保持内积的
所以φA为正交变换
接下来我们来看
二维和三维空间当中
哪些变换是正交变换
例1 对于二维平面当中的
旋转变换
由于我们已经给出了
它的变换矩阵式是这个形式的
那么很容易验证
对于0到2π之间的任意角度
上述矩阵的第一列
和第二列总是满足
做内积等于δij
因此旋转变换的
变换矩阵为正交阵
并且它的行列式等于1
根据刚才的等价描述
旋转变换为正交变换
例2 我们来考虑
三维空间当中的线反射变换
由于变换矩阵如下
我们把它简记为R
其中利用l为单位向量
所以l转置乘l就等于1
最后计算结果
R乘以R转置为单位阵I
所以根据正交阵的定义
R就为正交阵
所以对应的线反射变换
就为正交变换
进一步 由施密特正交化方法
我们总可以把单位向量l
扩充成为
Rn中的一组标准正交基
我们设为l1 l2 一直到ln
其中l1就等于
刚才的那个单位向量l
我们考虑把R作用在li上
其中i等于2 3一直到n
利用它们之间的正交性
我们可以验证R作用
在li上等于负的li
因此说明这些向量均为
属于特征值-1的特征向量
此外我们考虑R作用在l上
很容易验证 它等于l
因此这个式子说明
l为属于特征值1的
一个特征向量
总之正负1就为R的特征值
而l1为正1的特征向量
l2到ln为负1的特征向量
由于l1到ln相互垂直
因此它们必然线性无关
所以R有n个
线性无关的特征向量
因此R可对角化
并且我们把l1 l2
一直到ln并起来
就得到了一个正交阵
因此R还可以正交对角化
具体形式如下
从而线反射变换R为正交变换
并且很容易计算它的行列式
等于-1的n-1次方
再来看一个例子
我们考虑R3当中的面反射变换
由于面反射变换的
变换矩阵如下
其中n为反射平面
π的单位法向量
由于Rπ等于-Rn
则由上例可知Rπ也为正交变换
且将单位向量n扩充为R3的
一组标准正交基以后
Rπ可以正交对角化
也即存在正交阵Q
使得Q转置RπQ等于
-1 1 1组成的对角阵
从而三维空间当中的
面反射变换为正交变换
且它的行列式等于-1
接下来我们再来考虑
三维空间当中的旋转变换
在8.2节当中
我们给出了任意方向
以及任意角度的
旋转变换矩阵如下
其中l为单位向量
它的三个分量为a b c
而整个旋转的几何意义
就是围绕单位向量l
按右手法则旋转θ角度
从代数的角度
我们可以验证
如上给定的矩阵T为正交阵
也就是去验证T转置乘T等于I
但是比较繁琐
然而从几何意义上我们容易知道
旋转变换时保持长度的
故利用定义1的等价条件
我们知道旋转变换是正交变换
另外我们也可以直接验证
变换矩阵的行列式等于+1
进一步 我们设
λ1 λ2和λ3为变换矩阵T的
三个复特征值
则根据特征值的性质我们知道
λ1加λ2加λ3应该等于
T的主对角线上元素之和
根据刚才的表达式
我们很容易算出
T的迹等于1+2cosθ
而三个特征值相乘
应该等于T的行列式
也就是等于1
下面我们来计算I-T的行列式
由T是正交阵
所以T乘T转置等于I
所以我们可用
T乘T转置来替代I
接着再把T提出来得到了
T的行列式乘以
T转置减I的行列式
那么它又等于T的行列式
乘以T-I的行列式
那么由于T的行列式等于1
所以它就等于T-I的行列式
那么由于这是一个三阶矩阵
对整个矩阵提出一个负号之后
行列式就多一个负号
因此我们就得到了
I-T的行列式等于
负的I-T的行列式
这个式子就说明必然有
I-T的行列式等于0
也即1要为T的一个特征值
我们不妨设λ1就等于1
因此我们将λ1=1
代入上面两个算式
就可以得到
λ2与λ3满足的两个等式
那么由韦达公式
与二次方程的求根公式
我们可以解得λ2与λ3
等于这样的两个复数
也即旋转T的
一对共轭复特征值的辐角
恰好为旋转变换的旋转角
我们设v1为属于1的
一个特征向量
由于几何重数
小于等于代数重数可知
属于1的
特征子空间的维数为1维
于是由v1生成的子空间
就是T的一个不变子空间
由特征值等于1
则在该特征子空间内
T的作用保持向量不变
因此v1在绕轴转动θ角之后
仍然为v1
所以v1所生成的直线
就是旋转轴
这就是三维空间中
旋转的特征值
与特征向量的几何意义
四 正交变换基本定理
刚才我们所举的
几个正交变换的例子
均为反射变换和旋转变换
下面我们将证明
二维和三维空间当中的
所有正交变换
即为反射变换和旋转变换
下面我们将来证明
二维与三维空间当中
任意正交变换
只能是旋转变换和反射变换
或者它们的复合
首先对于正交矩阵而言
它的行列式只能为+1或者是-1
所以我们对于行列式取+1的
正交矩阵对应的变换为
第一类正交变换
而对于行列式等于-1的正交阵
我们成为第二类正交变换
所以我们的
正交变换基本定理叙述如下
在二维和三维空间中
第一类正交变换必为旋转变换
而第二类正交变换必为反射变换
或者某个反射变换
与某个旋转变换的复合
下面我们就来证明这个定理
我们先证平面的情况
设A为任意2阶正交矩阵
我们不妨设A的分量如下
那么有A乘A转置等于I我们知道
它的四个分量
应该满足这样的关系
所以我们可以设
a11等于cosθ1
a21等于sinθ1
而a12等于cosθ2
a22等于sinθ2
又由于它的四个分量
还要满足这样两个等式
这就说明A的
两个列向量之间是正交的
从而θ1和θ2之间
应该相差一个90度的夹角
也即θ2要等于θ1加减2分之π
所以利用三角函数的关系
我们可以知道
A只能有如下的两种形式
分别对应到上式当中的
正2分之π和负2分之π的情形
而当A的行列式等于1的时候
只有第一种情况满足
所以这种情况
正好就对应了旋转变换
而当A的行列式等于-1的时候
就对应了第二种情况
而它正好可以表示为
一个二维平面上的旋转
再乘以一个1 -1的矩阵
而因此这个时候
A就对应了
反射变换与旋转变换的复合
下面我们再来考虑
三维空间的情况
设A为一个三阶的正交阵
且A的行列式等于1
则根据如下的推导我们可以得到
I-A的行列式
应该等于负的I-A的行列式
所以这就得到了I-A的
行列式等于0
这个式子说明
1必为A的一个特征值
设v1为属于特征值1的
一个特征向量
且v1为单位向量
那么根据施密特正交化方法
我们可以将v1扩充成为
R3的一组标准正交基
记为v1 v2 v3
由于A作用在v1上等于v1自己
所以下面这个等式成立
这说明A倍的v2属于
v1生成子空间的补空间
也即属于v2 v3生成的子空间
同理A作用在v3上
也属于v2和v3生成的子空间
综合上述两点 我们可以知道
由v2和v3生成的子空间
就构成了A的一个不变子空间
所以φA在坐标系v1 v2 v3下的
矩阵表示就可以写为
这样的形式
其中它的第j列
等于φA作用vj的坐标
那么又根据坐标变换公式
与矩阵相似的关系
我们就得到了
这个矩阵B就等于P逆AP
又因为P为正交矩阵
所以它等于P转置AP
根据P A都是正交阵
因此我们很容易验证
P转置乘以B等于单位阵I
所以B也为正交阵
并且B的行列式
等于A的行列式等于1
这相当于分块子矩阵
A1为2阶的正交阵
且A1的行列式也等于1
那么由本定理上部分的证明
也即二维情况的证明
我们知道A1必然为如下形式
从而B只能等于这样的准对角阵
而这个矩阵我们很熟悉
它说明φA相当于
围绕v1方向
按右手法则旋转θ角
因此我们就证明了
当A为第一类正交变换的时候
必然为旋转
下面我们来看
对于第二类正交变换
我们设A为第二类正交变换
那此时可以对
A右乘一个对角矩阵
主对角线上元素为别为-1 1 1
这样的话乘积矩阵
就变为一个第一类的正交矩阵
从而根据刚才的讨论A
就等于一个第一类正交矩阵
与一个反射变换的复合
因此它就是一个
反射变换与旋转变换的复合
从而我们就证明了定理2
本讲小结
在本讲中
我们定义了一类特殊的矩阵变换
即正交变换
它保持向量的内积
从而保持几何对象的形状与度量
其次我们给出了
正交变换的等价形式
说明正交变换
与正交矩阵有密切关系
接下来
作为例子
我们在低维空间中验证
反射变换 旋转变换均为正交变换
最后我们证明了
正交变换基本定理
说明了在二维 三维空间中
正交变换
只能有旋转
反射以及它们的复合
需要说明的是
这个定理的证明
综合利用了本章之前
很多相关的概念和理论
技巧性较强
初学者需要细细体会
本章小结
在本章中
我们以几何的观点
来重新考虑了之前学过的
代数概念和理论
我们首先把矩阵
和向量的乘法视为向量空间之间的
映射或者是变换
给出了矩阵映射
和矩阵变换的概念
进一步我们介绍了
若干二维 三维空间中
一些特殊的变换
发现它们都是矩阵变换
如恒等变换
伸缩变换
投影变换
反射变换和旋转变换
之后我们讨论了
矩阵乘法的几何意义
矩阵特征值
与特征向量的几何意义
相似矩阵的几何意义
最后我们从保持
几何形状的需求出发
定义了正交变换
并与正交矩阵建立了联系
最后证明了正交变换基本定理
对二维 三维空间中此类变换
给出了简单清晰的分类和总结
这是代数与几何
完美结合的优美结论
横看成岭侧成峰
远近高低各不同
事物都具有两面性
我们分别从代数
和几何两个层面出发
探索了若干概念和理论
代数层面严谨精确
几何层面形象直观
同学们在学习过程中
一定要结合这两方面
不断地体会高等数学的
概括之美 简约之美 严谨之美
有所学 有所得 更有所提高
好的 同学们
我们线性代数先修课的
讲解就到这里
再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换