当前课程知识点:简明线性代数 > 第8章 矩阵与变换 > 8-1 矩阵映射与矩阵变换 > 8-1 矩阵映射与矩阵变换
同学们 大家好
欢迎来到MOOC课程
线性代数先修课
第八章 矩阵与变换
8.1节 矩阵映射和矩阵变换
从本讲开始
我们将从几何角度
来看过去介绍过的
代数对象和问题
首先我们将介绍
由矩阵所确定的映射和变换
也即矩阵映射和矩阵变换的定义
接下来
我们将讨论
矩阵映射的基本性质
我们将重点讨论
矩阵映射的线性性质以及线性结构
(一)问题的引入
首先我们先来回顾一下
我们在之前讨论过的
线性方程组的几何意义
一方面在代数上看
线性方程组有普通形式
向量形式和矩阵形式
那么对应的
普通形式从几何上看
就对应了线性方程组的行图
而向量形式所对应的几何意义
就是线性方程组的列图
那么自然的问题就是
代数上看线性方程组的矩阵形式
到底对应了什么样的
几何意义呢?
而这正是我们
本章所要讨论的主要问题
在本章当中
我们将以几何的观点
来看矩阵与向量的乘法
也即将矩阵视为
向量空间之间的
映射或者是变换
我们将介绍
这种由矩阵所确定的
映射的定义及其基本性质
进一步我们将介绍
二维与三维空间中
一些特殊的矩阵变换
例如恒等变换
伸缩变换
投影变换
反射变换和旋转变换
进一步
我们还将从几何的角度
解释本课程之前所讲过的
一些代数概念和理论
例如矩阵的乘法
矩阵的特征值与特征向量
相似矩阵以及正交矩阵等概念
希望同学们
在学习本章的过程中
不断体会矩阵代数
所对应的几何意义
也可感受代数理论作为
工具是如何严格化的
解决几何问题的
(二)矩阵映射与矩阵变换的定义
定义1 给定一个m*n型的矩阵
则我们可如下定义
由A确定的矩阵映射
我们把它记为\phi_A
它是一个从n维向量空间
R^n到m维向量空间R^m的映射
具体的
它把一个n维向量\alpha映为
A乘\alpha
特别的
当m等于n时
我们把\phi_A称为矩阵变换
那么从图像上来看
\phi_A就是一个
R^n到R^m的一个映射
而对应在元素上来看
就是把一个n维列向量\alpha
通过左乘A的作用
变成一个m维的列向量
也就是A\alpha
对于定义1
我们做如下的一些说明
通常我们可以将
\phi_A就简记为A
此时A既可以表示一个映射
也可以表示为一个矩阵
而A乘\alpha既可以表示
矩阵和向量的乘法
也可以表示列向量\alpha
在A作用下的像
同时从定义1里面
我们可以看到
矩阵映射的定义集
以及像集的维数
与矩阵的尺寸有密切的关系
具体的来说
定义集的维数
就等于矩阵的列数
在这里就是所有定义当中的n
而像集的维数就等于
矩阵的行数
在这里就是定义中
所有出现的m
这条对应规则将来
我们还会反复用到
请同学们一定要记牢
下面我们来看一个具体的例子:
令A是这样的一个二阶矩阵
求下面的列向量在矩阵变换
A的作用下所对应的像
我们分别去考虑两个自然基
以及这样给定的\alpha
好,那么具体的计算很容易
只需要去计算矩阵A
与对应的列向量相乘
是等于什么就可以了
其中第一个自然基
在A的作用就等于向量(0,1)
而第二个自然基在矩阵A的
作用下就等于向量(1,0)
这时我们会发现自然基
在A的作用下正好交换了次序
而对于\alpha来说
它在A的作用下就等于(-2,-1)
这个时候我们就发现
在A 的作用下
\alpha的两个分量交换了次序
具体到我们可以画出图像
通过图像我们可以看出
矩阵变换A将上述三个向量
均映射为关于直线
x_1=x_2所对称的向量
再来看一个简单的例子
我们考虑平移变换
设\phi为平面到
平面上的一个变换
它将所有的点向右移动
a_1个单位
同时向上移动a_2个单位
那么用向量的形式
就可以表示为这样的一个算式
也即\phi作用在向量x上就相当于
在第一分量上加a_1
而在第二个分量上加a_2
而它又可以表示为
x加上\alpha的形式
而这个\alpha就是由
a_1和a_2组成的列向量
那么由矩阵变换的定义
我们可以看出平移变换
一般并不是矩阵变换
而这一点从下一小节矩阵
映射的性质中也可以看出来
(三)矩阵映射的性质
根据矩阵代数的运算律
可得到矩阵映射有如下的性质
性质1:
矩阵映射把零向量映成零向量
我们把它简称为保零元
这条性质很容易验证
性质2:
矩阵映射保持向量的线性运算
也即保持向量的加法和数乘运算
具体来说,对于任意向量
\alpha和\beta以及实数k
我们均有A作用在
\alpha加\beta上就等于A
分别作用在\alpha
和\beta上再相加
那么A作用在k倍的\alpha上
就等于A先作用在\alpha
再做数乘k
那么对于性质2
我们做如下的说明:
第一点
上述两条运算律实际上
还可以合并为一条等价的运算律
也就是写为这样的形式
即\alpha和\beta的线性组合
再通过A去作用等于A
作用以后再做对应的线性组合
一般的,
如果一个映射
从n维空间映到m维空间
它保持向量的线性运算
即满足这样的一个等式
则我们把这个映射称为线性映射
那么性质2就说明了
矩阵映射\phi_A是线性映射
反过来我们还要说明
任意一个R^n到R^m的
线性映射\sigma
也必然为矩阵映射
我们设e_1,e_2,…
e_n是R^n的自然基
则任意的n维向量\alpha
如果\alpha的分量为a_1
a_2,…,a_n
则可以把\alpha表示为
自然基的线性组合
组合系数就是它的每一个分量
那么由\sigma的形式
我们就知道
\sigma作用在\alpha上
就相当于把\sigma作用到
求和号里面
并且直接作用到
每一个基向量上
再做线性组合
再把这个算式可以写为
形式行向量乘以列向量的形式
其中我们会发现前面的这个
形式行向量实际上是一个
m*n型的矩阵
我们把它记为\Phi
所以我们就得到了
\sigma作用在\alpha上
就相当于矩阵\Phi
左乘在向量\alpha上
而得到的向量应该是一个
m维的列向量
我们把矩阵\Phi称为线性映射
\sigma的表示矩阵
因此我们就得到了
以下的一个定理
即任意一个R^n
到R^m的线性映射\sigma均为
矩阵映射
并且其表示矩阵的第j列
就是第j个自然基e_j在
\sigma作用下的像
换言之
要决定一个线性映射的表示矩阵
只需要决定它在自然基的
每一个基向量上的像
并且把这些项按列排列起来即可
关于表示矩阵列的结论
我们今后还会用到
请同学们一定要记住
进一步
矩阵映射不仅保持线性运算
而且我们还可以证明
矩阵映射保持子空间
也即性质3:
矩阵映射将子空间映为子空间
下面我们来证明性质3
首先设W是像集R^n的子空间
那么我们要去证明
\phi_A(W)构成了
m维向量空间中的子空间
要证明如此
我们就需要证明\phi_A(W)
对于加法和数乘是封闭的
于是我们在\phi_A(W)里面
任取两个向量\beta_1和\beta_2
由于它们都落在像集合里边
所以一定存在n维向量
\alpha_1和\alpha_2
使得\beta_1就等于
\alpha_1在\phi_A作用下的像
而\beta_2等于\alpha_2在
\phi_A作用下的像
也就是这样的两个算式成立
因此由矩阵映射的性质2
也即保持线性运算
我们可以知道
对于任何的实数k_1,k_2
那么\beta_1
和\beta_2的线性组合
就可以写为A倍的alpha_1
和A倍的alpha_2的线性组合
而且进一步这个A
就可以提到括号的外面来
因为W是子空间
所以等式右边的括号里
也就是\alpha_1和\alpha_2的
线性组合是属于W的
因此等式的右边
就是属于\phi_A(W)
从而我们就说明了
\beta_1和\beta_2的
任意线性组合都属于\phi_A(W)
所以这就说明了
\phi_A(W)对于线性运算
是封闭的
于是这就说明\phi_A(W)
构成了R^m中的子空间
从而我们就证明了性质3
由性质3
我们实际上可以把子空间
\phi_A(W)也叫做W在
\phi_A作用下的像空间
那么根据性质3
一个自然的问题
就是从数量关系来考虑
如果原来的子空间W的维数
是等于s的话
那么像空间\phi_A(W)
我们把它记为W’
那么它的维数是多少呢?
下面我们就来
设法回答这个问题
设\alpha_1
\alpha_2到\alpha_s
是W的一组基
则对于W里的任意向量\alpha
均可以表示成为
这组基的线性组合
那么对于像空间中的
任意向量\beta
我们知道一定存在一个
\alpha属于W
使得\beta等于A
乘以\alpha,那么由于性质2
我们可以知道
A\alpha就可以表示成
A\alpha_1,A\alpha_2
一直到A\alpha_s的线性组合
那么由\beta的任意性
这就说明像空间W’
就可以由A\alpha_1
A\alpha_2到A\alpha_s线性生成
因此W’ 的维数就应该等于
A\alpha_1到A\alpha_s的秩
那么如果我们令矩阵B
是由\alpha_1,\alpha_2到
\alpha_s为列组成的矩阵
则B是由s个线性无关的列
组成的矩阵
于是B的秩就等于s
那么由分块矩阵的运算律
我们就可以知道W’
的维数就应该等于矩阵A乘B的秩
进一步
由矩阵乘积的秩的性质
我们可以得到W’的
维数应该有这样的一个下界
和这样的一个上界
特别的,红色的划线部分
就给出了我们想要的结论
也即子空间在矩阵映射
\phi_A的作用下
只能变成维数相等
或者是更低的子空间
下面我们就来考虑
三维空间中一个具体的例子
例1,在R^3当中
矩阵变换把线段
变成什么样的图形呢?
我们来分析一下这个问题
R^3当中的矩阵变换
为一个3*3的方阵
我们可设它为\phi_A
也可以把它记为A
设线段的两个端点
分别为X和Y
则以线段上点为终点的
向量就应该满足这样的条件
即这些向量可以表示为
\lambda(OX)+(1-\lambda)
(OY)的形式
其中\lambda跑遍
[0,1]这个闭区间
如果我们把OX
记为\alpha
OY记为向量\beta
则在矩阵A的作用下
我们去计算可以得到
这样的一个结果
进一步
我们把A乘到括号里边
那么通过这个等式的右边
我们就可以发现
这依然是一条线段
而这个线段的两个端点
分别为向量A\alpha
与向量A\beta的终点
因此矩阵变换
将线段变成线段
或者变换成线段退化的情形
也就是一个点
此时A\alpha等于A\beta
最后我们简单的说明一下
如何将一般的矩阵映射化为
等效的矩阵变换
换言之
也就是如何将
一个非方阵变为
作用效果相同的方阵
具体来说,在定义1当中
如果m不等于n,则A不是方阵
对应的矩阵映射
是不同维数的
向量空间之间的映射
我们分成以下的两种情况
来分别考虑
第一种情况,当m大于n时
考虑一种简单的情况
也即3乘2的矩阵
设A是这样一个3乘2的矩阵
则A就是一个二维空间
到三维空间的矩阵变换
下面我们在A的右边
添加一个全零列
得到一个3乘3的方阵
把它记为A’
于是我们发现A’
是一个三维空间到
三维空间的变换
并且不管它的自变量的
第三个变量如何取
均不影响其计算结果
所以我们可以看到A和A’
的作用效果是相同的
由此可见,当m大于n时
我们可以通过
添加全零列的方法
把矩阵A补成一个
m乘m 阶方阵
这可将映射A 的定义集
从R^n延拓到R^m
且矩阵作用的效果相同
另外一种情况
也就是当m小于n时
我们也是考虑一种
简单的情况
我们考虑如下的
2乘3 的矩阵
那么它就对应一个
三维空间到二维空间的
一个矩阵映射
我们在A的下方
添加一个全零行
并且把它记为A’
那么我们就得到A’
是一个三维空间
到三维空间的矩阵变换
它的作用效果就是它的
像的第三个分量始终为零
于是通过比较
我们就会发现
矩阵A和矩阵A’的作用效果
在局部上看也是相同的
由此我们可以知道
当m小于n时
我们可以通过添加
全零行的方法把矩阵A
补成一个n乘n阶方阵
这可将映射A作用的像集
嵌入到R^n中去
并且从局部上看
与原矩阵的作用效果相同
综合上述两点
我们总是可以把
非方阵补成方阵
也即将来我们将重点考虑m
等于n的情况
也即矩阵变换的情况
此时A就是一个n阶方阵
而\phi_A就是一个R^n
到R^n的线性变换
本讲小结
在本讲中
我们以几何的观点
来看矩阵与向量的乘法
给出了矩阵映射
和矩阵变换的概念
有时为了方便
我们直接用矩阵A
来表示矩阵映射
此时A既可以表示一个映射
也可以表示一个矩阵
另外还需要注意一点
矩阵映射的定义集的
维数等于矩阵的列数
而像集的维数等于
矩阵的行数
接下来我们讨论了
矩阵映射的线性性质
包括矩阵映射保原点
矩阵映射保线性运算
矩阵映射保子空间
对于线性运算
我们还反过来证明了
任意向量空间之间的
线性映射必为矩阵映射
它的表示矩阵的列即为
自然基在该映射下的像
对于子空间
我们证明了矩阵映射
把子空间映为维数相等
或者是更低的子空间
最后,我们介绍了
用补零法把矩阵映射化为
等效的矩阵变换的思路
所以今后我们将重点讨论
矩阵变换相关的问题
好,本讲的内容就到这里
下讲再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换