当前课程知识点:简明线性代数 >  第8章 矩阵与变换 >  8-6 正交变换 >  8-6 正交变换

返回《简明线性代数》慕课在线视频课程列表

8-6 正交变换在线视频

8-6 正交变换

返回《简明线性代数》慕课在线视频列表

8-6 正交变换课程教案、知识点、字幕

同学们 大家好

欢迎来到MOOC课程

线性代数先修课

第八章 矩阵与变换

8.6节 正交变换

在本讲中

我们将讨论一类特殊的矩阵变换

它们能保持几何对象的形状

也即正交变换

我们首先介绍

引入正交变换的背景

以及正交变换的定义

其次我们会给出

正交变换的等价形式

说明它与正交矩阵的联系

再次我们将在低维空间中

给出几类正交变换的例子

最后我们将证明

2 3维空间中的

正交变换基本定理

在几何问题中

常常需要求保持

几何图形的形状的变换

那么在物理问题中

有时需要描述物体

保持形状的运动过程

简称为刚体运动

本节我们就来讨论

这种保持形状的矩阵变换

因为它与正交矩阵的关系

我们就称这样的矩阵变换

为正交变换

那么何为保持形状呢

形状实际上与向量的

长度与夹角有密切关系

而我们在第六章中

已经讨论过长度与夹角

均可由内积来定义

因此我们可以用

如下保内积的条件

来刻画所需要的矩阵变换

一 正交变换的定义

定义1

在n维欧式空间Rn中

设给予了标准内积

并且设φA为一个矩阵变换

若对于任意向量α β

均有这个等式成立

我们把它记为(1)式

则我们称φA为正交变换

我们具体地来分析一下(1)式

(1)式的左边表示φA作用

在α与φA作用

在β两个向量做内积

也就等于Aα和Aβ做内积

它要求等于α和β之间的内积

这个式子说明

A的作用不改变

α和β之间的内积

那么我们做如下几点说明

第一 正交变换的定义

也适用于非标准内积

第二 根据刚才的分析

(1)式也可以称为保内积

第三 由于正交变换保持内积

所以它一定保持长度 保持夹角

统称为保度量

具体地用数学符号表示

就是这样的

也即Aα的长度

与α的长度相等

Aα与Aβ之间的夹角

等于α与β之间的夹角

对于任意向量α β成立

第四 平移变换

虽然是保持形状的

但是我们已经知道

它并非矩阵变换

所以平移变换不是正交变换

另外一方面

由平移变换不保持原点

故它不保持长度

所以这也说明

平移变换不是正交变换

下面我们来讨论

正交变换的几种等价形式

定理1

在n维欧式空间中

φA为矩阵变换

则下述条件等价

即1 φA为正交变换

也即保持内积

2 A的作用保持长度

对于任何α成立

我们把它记为(2)式

3 A为正交矩阵

下面我们来证明

这三个条件的等价性

首先 由刚才的注释

我们已经证明了

1可推出2

下面我们反过来验证2可推出1

假设对于任意向量α β

由(2)式可知

A作用在α加β上

其长度等于α加β的长度

那么对于这个等式

我们左边取平方

并且表示为内积的形式

进一步再把A乘到括号里边

就得到了这样的

两个向量做内积

进一步利用内积的

性质展开计算

就等于下面这三项

而对于另外一边

也就是α加β的平方

我们也用同样的方法

表为内积的形式

并进一步展开之后

就等于这三项相加

那么对比上面的三项

和下面的三项

再利用条件2

那么我们就得到了

Aα和Aβ做内积

等于α和β做内积

由α和β的任意性

我们就得到了

φA为正交变换

接下来我们来验证

1和3的等价性

在(1)式当中

我们取α等于第i个自然基

β等于第j个自然基

于是我们可以知道

A作用在ei上

与A作用在ej上

取内积就等于

ei和ej做内积

由于ei和ej做内积

等于δij

因此Aei和Aej作用

也等于δ

由于Aei和Aej分别为

A的第i列和第j列

于是上面这个式子说明

A的列构成了Rn的

一组标准正交基

于是A就是一个正交矩阵

反过来3推1

对于向量α β

首先我们先把α和β表示为

自然基德线性组合

组合系数分别为ai和bj

那么由于A是正交阵

所以A的列构成一组

标准正交基

因此满足Aei与Aej

做内积等于δij

从而我们去计算

Aα和Aβ之间的内积

把线性组合式代入

并且展开以后

就等于右边这个算式

由于Aei与Aej作用之后

等于δij

所以这些求和式当中

只有ai乘以bi的项不为0

而ai乘以bi正好就是

α与β之间的标准内积

因此我们验证了

Aα与Aβ做内积

等于α与β做内积

因此A的作用是保持内积的

所以φA为正交变换

接下来我们来看

二维和三维空间当中

哪些变换是正交变换

例1 对于二维平面当中的

旋转变换

由于我们已经给出了

它的变换矩阵式是这个形式的

那么很容易验证

对于0到2π之间的任意角度

上述矩阵的第一列

和第二列总是满足

做内积等于δij

因此旋转变换的

变换矩阵为正交阵

并且它的行列式等于1

根据刚才的等价描述

旋转变换为正交变换

例2 我们来考虑

三维空间当中的线反射变换

由于变换矩阵如下

我们把它简记为R

其中利用l为单位向量

所以l转置乘l就等于1

最后计算结果

R乘以R转置为单位阵I

所以根据正交阵的定义

R就为正交阵

所以对应的线反射变换

就为正交变换

进一步 由施密特正交化方法

我们总可以把单位向量l

扩充成为

Rn中的一组标准正交基

我们设为l1 l2 一直到ln

其中l1就等于

刚才的那个单位向量l

我们考虑把R作用在li上

其中i等于2 3一直到n

利用它们之间的正交性

我们可以验证R作用

在li上等于负的li

因此说明这些向量均为

属于特征值-1的特征向量

此外我们考虑R作用在l上

很容易验证 它等于l

因此这个式子说明

l为属于特征值1的

一个特征向量

总之正负1就为R的特征值

而l1为正1的特征向量

l2到ln为负1的特征向量

由于l1到ln相互垂直

因此它们必然线性无关

所以R有n个

线性无关的特征向量

因此R可对角化

并且我们把l1 l2

一直到ln并起来

就得到了一个正交阵

因此R还可以正交对角化

具体形式如下

从而线反射变换R为正交变换

并且很容易计算它的行列式

等于-1的n-1次方

再来看一个例子

我们考虑R3当中的面反射变换

由于面反射变换的

变换矩阵如下

其中n为反射平面

π的单位法向量

由于Rπ等于-Rn

则由上例可知Rπ也为正交变换

且将单位向量n扩充为R3的

一组标准正交基以后

Rπ可以正交对角化

也即存在正交阵Q

使得Q转置RπQ等于

-1 1 1组成的对角阵

从而三维空间当中的

面反射变换为正交变换

且它的行列式等于-1

接下来我们再来考虑

三维空间当中的旋转变换

在8.2节当中

我们给出了任意方向

以及任意角度的

旋转变换矩阵如下

其中l为单位向量

它的三个分量为a b c

而整个旋转的几何意义

就是围绕单位向量l

按右手法则旋转θ角度

从代数的角度

我们可以验证

如上给定的矩阵T为正交阵

也就是去验证T转置乘T等于I

但是比较繁琐

然而从几何意义上我们容易知道

旋转变换时保持长度的

故利用定义1的等价条件

我们知道旋转变换是正交变换

另外我们也可以直接验证

变换矩阵的行列式等于+1

进一步 我们设

λ1 λ2和λ3为变换矩阵T的

三个复特征值

则根据特征值的性质我们知道

λ1加λ2加λ3应该等于

T的主对角线上元素之和

根据刚才的表达式

我们很容易算出

T的迹等于1+2cosθ

而三个特征值相乘

应该等于T的行列式

也就是等于1

下面我们来计算I-T的行列式

由T是正交阵

所以T乘T转置等于I

所以我们可用

T乘T转置来替代I

接着再把T提出来得到了

T的行列式乘以

T转置减I的行列式

那么它又等于T的行列式

乘以T-I的行列式

那么由于T的行列式等于1

所以它就等于T-I的行列式

那么由于这是一个三阶矩阵

对整个矩阵提出一个负号之后

行列式就多一个负号

因此我们就得到了

I-T的行列式等于

负的I-T的行列式

这个式子就说明必然有

I-T的行列式等于0

也即1要为T的一个特征值

我们不妨设λ1就等于1

因此我们将λ1=1

代入上面两个算式

就可以得到

λ2与λ3满足的两个等式

那么由韦达公式

与二次方程的求根公式

我们可以解得λ2与λ3

等于这样的两个复数

也即旋转T的

一对共轭复特征值的辐角

恰好为旋转变换的旋转角

我们设v1为属于1的

一个特征向量

由于几何重数

小于等于代数重数可知

属于1的

特征子空间的维数为1维

于是由v1生成的子空间

就是T的一个不变子空间

由特征值等于1

则在该特征子空间内

T的作用保持向量不变

因此v1在绕轴转动θ角之后

仍然为v1

所以v1所生成的直线

就是旋转轴

这就是三维空间中

旋转的特征值

与特征向量的几何意义

四 正交变换基本定理

刚才我们所举的

几个正交变换的例子

均为反射变换和旋转变换

下面我们将证明

二维和三维空间当中的

所有正交变换

即为反射变换和旋转变换

下面我们将来证明

二维与三维空间当中

任意正交变换

只能是旋转变换和反射变换

或者它们的复合

首先对于正交矩阵而言

它的行列式只能为+1或者是-1

所以我们对于行列式取+1的

正交矩阵对应的变换为

第一类正交变换

而对于行列式等于-1的正交阵

我们成为第二类正交变换

所以我们的

正交变换基本定理叙述如下

在二维和三维空间中

第一类正交变换必为旋转变换

而第二类正交变换必为反射变换

或者某个反射变换

与某个旋转变换的复合

下面我们就来证明这个定理

我们先证平面的情况

设A为任意2阶正交矩阵

我们不妨设A的分量如下

那么有A乘A转置等于I我们知道

它的四个分量

应该满足这样的关系

所以我们可以设

a11等于cosθ1

a21等于sinθ1

而a12等于cosθ2

a22等于sinθ2

又由于它的四个分量

还要满足这样两个等式

这就说明A的

两个列向量之间是正交的

从而θ1和θ2之间

应该相差一个90度的夹角

也即θ2要等于θ1加减2分之π

所以利用三角函数的关系

我们可以知道

A只能有如下的两种形式

分别对应到上式当中的

正2分之π和负2分之π的情形

而当A的行列式等于1的时候

只有第一种情况满足

所以这种情况

正好就对应了旋转变换

而当A的行列式等于-1的时候

就对应了第二种情况

而它正好可以表示为

一个二维平面上的旋转

再乘以一个1 -1的矩阵

而因此这个时候

A就对应了

反射变换与旋转变换的复合

下面我们再来考虑

三维空间的情况

设A为一个三阶的正交阵

且A的行列式等于1

则根据如下的推导我们可以得到

I-A的行列式

应该等于负的I-A的行列式

所以这就得到了I-A的

行列式等于0

这个式子说明

1必为A的一个特征值

设v1为属于特征值1的

一个特征向量

且v1为单位向量

那么根据施密特正交化方法

我们可以将v1扩充成为

R3的一组标准正交基

记为v1 v2 v3

由于A作用在v1上等于v1自己

所以下面这个等式成立

这说明A倍的v2属于

v1生成子空间的补空间

也即属于v2 v3生成的子空间

同理A作用在v3上

也属于v2和v3生成的子空间

综合上述两点 我们可以知道

由v2和v3生成的子空间

就构成了A的一个不变子空间

所以φA在坐标系v1 v2 v3下的

矩阵表示就可以写为

这样的形式

其中它的第j列

等于φA作用vj的坐标

那么又根据坐标变换公式

与矩阵相似的关系

我们就得到了

这个矩阵B就等于P逆AP

又因为P为正交矩阵

所以它等于P转置AP

根据P A都是正交阵

因此我们很容易验证

P转置乘以B等于单位阵I

所以B也为正交阵

并且B的行列式

等于A的行列式等于1

这相当于分块子矩阵

A1为2阶的正交阵

且A1的行列式也等于1

那么由本定理上部分的证明

也即二维情况的证明

我们知道A1必然为如下形式

从而B只能等于这样的准对角阵

而这个矩阵我们很熟悉

它说明φA相当于

围绕v1方向

按右手法则旋转θ角

因此我们就证明了

当A为第一类正交变换的时候

必然为旋转

下面我们来看

对于第二类正交变换

我们设A为第二类正交变换

那此时可以对

A右乘一个对角矩阵

主对角线上元素为别为-1 1 1

这样的话乘积矩阵

就变为一个第一类的正交矩阵

从而根据刚才的讨论A

就等于一个第一类正交矩阵

与一个反射变换的复合

因此它就是一个

反射变换与旋转变换的复合

从而我们就证明了定理2

本讲小结

在本讲中

我们定义了一类特殊的矩阵变换

即正交变换

它保持向量的内积

从而保持几何对象的形状与度量

其次我们给出了

正交变换的等价形式

说明正交变换

与正交矩阵有密切关系

接下来

作为例子

我们在低维空间中验证

反射变换 旋转变换均为正交变换

最后我们证明了

正交变换基本定理

说明了在二维 三维空间中

正交变换

只能有旋转

反射以及它们的复合

需要说明的是

这个定理的证明

综合利用了本章之前

很多相关的概念和理论

技巧性较强

初学者需要细细体会

本章小结

在本章中

我们以几何的观点

来重新考虑了之前学过的

代数概念和理论

我们首先把矩阵

和向量的乘法视为向量空间之间的

映射或者是变换

给出了矩阵映射

和矩阵变换的概念

进一步我们介绍了

若干二维 三维空间中

一些特殊的变换

发现它们都是矩阵变换

如恒等变换

伸缩变换

投影变换

反射变换和旋转变换

之后我们讨论了

矩阵乘法的几何意义

矩阵特征值

与特征向量的几何意义

相似矩阵的几何意义

最后我们从保持

几何形状的需求出发

定义了正交变换

并与正交矩阵建立了联系

最后证明了正交变换基本定理

对二维 三维空间中此类变换

给出了简单清晰的分类和总结

这是代数与几何

完美结合的优美结论

横看成岭侧成峰

远近高低各不同

事物都具有两面性

我们分别从代数

和几何两个层面出发

探索了若干概念和理论

代数层面严谨精确

几何层面形象直观

同学们在学习过程中

一定要结合这两方面

不断地体会高等数学的

概括之美 简约之美 严谨之美

有所学 有所得 更有所提高

好的 同学们

我们线性代数先修课的

讲解就到这里

再见

简明线性代数课程列表:

第0章 序论 · 开篇

-宣传片

--宣传片

-序论

--序论

第1章 线性方程组

-1-1 二元、三元一次方程组

--1-1 二元、三元一次方程组

-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法

-1-2 一般线性方程组的解法:Gauss消元法

--1-2 一般线性方程组的解法:Gauss消元法

-第1章 线性方程组--1-3 线性方程组解的判定

-1-3 线性方程组解的判定

--1-3 线性方程组解的判定

-第1章 线性方程组--1-4 齐次线性方程组

-1-4 齐次线性方程组

--1-4 齐次线性方程组

第2章 行列式

-第2章 行列式--2-1 二阶、三阶行列式的性质

-2-1 二阶、三阶行列式的性质

--2-1 二阶、三阶行列式的性质

-第2章 行列式--2-2 n元排列

-2-2 n元排列

--2-2 n元排列

-第2章 行列式--2-3 n阶行列式的定义

-2-3 n阶行列式的定义

--2-3 n阶行列式的定义

-第2章 行列式--2-4 行列式的性质

-2-4 行列式的性质

--2-4 行列式的性质

-第2章 行列式--2-5 行列式的计算1-利用性质

-2-5 行列式的计算1-利用性质

--Video

-第2章 行列式--2-6 行列式的展开公式

-2-6 行列式的展开公式

--2-6 行列式的展开公式

-第2章 行列式--2-7 行列式的计算2-综合

-2-7 行列式的计算2-综合

--2-7 行列式的计算2-综合

-第2章 行列式--2-8 Cramer法则

-2-8 Cramer法则

--2-8 Cramer法则

第3章 矩阵

-第3章 矩阵--3-1 矩阵及其线性运算

-3-1 矩阵及其线性运算

--3-1 矩阵及其线性运算

-第3章 矩阵--3-2 矩阵的乘法

-3-2 矩阵的乘法

--3-2 矩阵的乘法

-第3章 矩阵--3-3 矩阵的其他运算

-3-3 矩阵的其他运算

--3-3 矩阵的其他运算

-第3章 矩阵--3-4 分块矩阵

-3-4 分块矩阵

--3-4 分块矩阵

-第3章 矩阵--3-5 初等矩阵

-3-5 初等矩阵

--3-5 初等矩阵

-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件

-3-6 逆矩阵及矩阵可逆条件

--3-6 逆矩阵及矩阵可逆条件

-第3章 矩阵--3-7 逆矩阵的求法

-3-7 逆矩阵的求法

--3-7 逆矩阵的求法

第4章 向量空间

-第4章 向量空间--4-1 n维向量空间

-4-1 n维向量空间

--4-1 n维向量空间

-第4章 向量空间--4-2 向量组的线性相关性

-4-2 向量组的线性相关性

--4-2 向量组的线性相关性

-第4章 向量空间--4-3 线性相关性的更多理论

-4-3 线性相关性的更多理论

--4-3 线性相关性的更多理论

-第4章 向量空间--4-4 极大线性无关组

-4-4 极大线性无关组

--4-4 极大线性无关组

-第4章 向量空间--4-5 向量组的秩

-4-5 向量组的秩

--4-5 向量组的秩

-第4章 向量空间--4-6 矩阵的秩

-4-6 矩阵的秩

--Video

-第4章 向量空间--4-7 矩阵秩的运算律与相关结论

-4-7 矩阵秩的运算律与相关结论

--4-7 矩阵秩的求法

第5章 线性方程组的解理论

-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论

-5-1 齐次线性方程组的解理论

--5-1 齐次线性方程组的解理论

-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论

-5-2 非齐次线性方程组的解理论

--5-2 非齐次线性方程组的解理论

-第5章 线性方程组的解理论--5-3 线性方程组的几何意义

-5-3 线性方程组的几何意义

--5-3 线性方程组的几何意义

-第5章 线性方程组的解理论--5-4 矩阵方程

-5-4 矩阵方程

--5-4 矩阵方程的求解

第6章 内积空间

-第6章 内积空间--6-1 向量空间中的内积与度量

-6-1 向量空间中的内积与度量

--6-1 向量空间中的内积与度量

-第6章 内积空间--6-2 标准正交基与正交矩阵

-6-2 标准正交基与正交矩阵

--6-2 标准正交基与正交矩阵

-第6章 内积空间--6-3 Schmidt正交化与QR分解

-6-3 Schmidt正交化与QR分解

-- 6-3 Schmidt正交化与QR分解

-第6章 内积空间--6-4 正交投影与正交分解

-6-4 正交投影与正交分解

--6-4 正交补与正交分解

-第6章 内积空间--6-5 最小二乘问题

-6-5 最小二乘问题

--6-5 最小二乘问题

第7章 矩阵的特征值理论

-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量

-7-1 矩阵的特征值与特征向量

--7-1 特征值与特征向量

-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间

-7-2 特征多项式与特征子空间

--7-2 特征多项式与特征子空间

-第7章 矩阵的特征值理论--7-3 相似矩阵

-7-3 相似矩阵

--7-3 相似矩阵

-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题

-7-4 矩阵的对角化问题

--7-4 矩阵的对角化问题

-第7章 矩阵的特征值理论--7-5 实对称阵的对角化

-7-5 实对称阵的对角化

--7-5 实对称阵的对角化

-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用

-7-6 特征值理论的几个应用

--7-6 特征值理论的几个应用

第8章 矩阵与变换

-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换

-8-1 矩阵映射与矩阵变换

--8-1 矩阵映射与矩阵变换

-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换

-8-2 二维三维空间中几类特殊的矩阵变换

--8-2 二维三维空间中几类特殊的矩阵变换

-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法

-8-3 矩阵映射的复合与矩阵乘法

--8-3 矩阵映射的复合与矩阵乘法

-8-4 矩阵变换的不变量与特征值理论

--8-4 矩阵变换的不变量与特征值理论

-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似

-8-5 坐标系替换与矩阵相似

--8-5 坐标系替换与矩阵相似

-第8章 矩阵与变换--8-6 正交变换

-8-6 正交变换

--8-6 正交变换

8-6 正交变换笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。