当前课程知识点:线性代数(2) > 第四讲:线性变换 I > 4.1 线性变换的定义和性质 > 4.1 线性变换的定义和性质
大家好
历史上英国数学家Arthur Cayley
是为了描述线性变换的复合
而引入矩阵的乘法
从而使矩阵正式成为
数学的研究对象的
线性变换是两个向量空间之间
保持线性运算的映射
线性代数就是从其中心问题
求解线性方程组出发发展起来
研究向量空间 线性变换
以及相关的问题的数学学科
对有限维向量空间间的
线性变换的研究
总可以转化成对矩阵的研究
这是线性代数的核心特点
这节课我们先来讨论
线性变换的定义 性质 运算
以及给定基底下的矩阵表示
我们首先回忆中学学过的函数
比如f(x)=2x
g(x)=x^2+3
h(x)=sinx等等
那它们都是一个映射
从定义域中的一个数
映成值域中的一个数
我们现在想推广到把向量
映射到向量的映射
比如
f是从R^3映到R^2的一个映射
我们定义成把三维向量x y z
给映成2x 3y-z
这样的一个二维向量
特别地
你给定1 2 3
这个三维向量
根据上面的映射法则
我们就映成2 7
这样的二维向量
那这里呢
我们关心把向量空间映到
向量空间的映射
首先我们先回顾一下
向量空间的概念
我们说人们发现平面上的点
空间中的点 矩阵
多项式函数
连续函数等等集合
看上去不同
但是它们各自的加法和数乘
满足同样的性质
于是就引入了向量空间
这样的一个抽象的概念
来统一地研究
向量空间的概念
是以公理化的形式给出的
包含四个因素
非空集合V 数域F
我们这里通常地是用实数域
和负数域
向量的加法和数乘两种运算
满足相应的性质
具体而言
设V是一个非空的集合
F是一个数域
在V上定义了加法和数乘
其中加法是说
对于V中的任何两个元素x y
我们有x y也长在V里头
F和V的数乘呢是说
对于F中的任何的一个数k
V中的任何一个元素x
kx也长在V里头
并且加法和数乘的运算
满足下面的性质
第一条性质x+y=y+x
这是加法的交换率
第二条性质x+y+z等于y+z
然后再和x相加
这是加法的结合律
那加法存在着零元素
我们叫零向量
x和0相加等于x
而对于V中的任何一个向量x
存在着-x
存在负元素
x和-x相加等于零向量
这是关于加法的四条性质
那数1和x相乘等于x
这是说我们在数域F里头1的作用
k,l长在数域里头
kl先相乘再跟x作数乘
等于l先跟x作数乘
再去跟k作数乘
k去乘以x+y等于kx+ky
k+l再乘以x等于kx+lx
这是关于数乘的两条分配律
好 这四条是数乘的性质
那么加法的数乘
满足这八条性质的话
我们就把这个集合V
叫做数域F上的向量空间
我们或者是叫线性空间
那对于一个向量空间
我们之前讨论了
向量空间的子空间
向量空间的基 向量空间的维数
矩阵的四个基本子空间等
为了研究两个向量空间的关系
我们需要讨论
两个向量空间之间的映射
最自然的一类映射
是保持加法和数乘的线性运算的
所谓线性变换
具体而言假设V和W
是数域F上的向量空间
V到W的映射T
如果是保持加法和数乘运算
也就是说
T(x+y)=T(x)+T(y)
T(kx)=kT(x)
那这是在V里头做加法
被T打过去以后
变成在W作加法
这是在V里头作数乘
被这个T做了映射之后
这是在W里头在作数乘
那如果加法和数乘运算被保持
我们就把这个映射称为是
V到W的线性变换
linear transformation
或者是叫做线性映射
linear map
一般的呢把V到V的线性变换
叫做是线性算子 linear operator
那我们这里不加区别这几个词
线性变换 线性映射和线性算子
我们来看例子
特殊的线性变换
向量空间V到W的零变换
也就是这个线性变换
把V中的任何的向量x
全都映成W中的零向量
而这个线性变换我们记成0
这是零变换
那向量空间V上的恒等变换
它把V中的任何向量x映成它自身
恒等变换
零变换和恒等变换
是特殊的两个线性变换
还有我们比如是
看R^3到R^3中的一个映射
假设c是给定的一个数
R^3中的任何一个向量x
映成cx
成为长在R^3里头
我们把这个
这是一个线性变换
把这个线性变换
称为是R^3中的数乘变换
一般地
如果在数域F里头给定一个数k
从V到V的变换T
我们定义是把任意的x映成kx
那这个变换呢
我们称为是V上
由k所决定的数乘变换
这也是一个特殊的线性变换
而接下来
我们再来看一个具体的线性变换
在R^3中给定一个向量
它的分量是1 3 4
那它把R^3中的任何一个向量x
映成A和x的点积
那么点积的定义
是对应分量相乘再相加
我们设x的分量是x_1 x_2 x_3
ax就是x_1加上3x_2 再加4x_3
很容易验证
它保持加法和数乘
由这个点积的性质可以知道
保持加法和数乘
它是一个线性变换
那再来看这个例子
A是m×n的一个实矩阵m行n列
x是R^n中的任何一个向量
我们T(x)呢定义成是
矩阵A和x相乘
我们来看这个矩阵是m×n的
x是一个n维向量
可以看成是n乘1的
那这是可以相乘的
映出来以后是映到R^m里头
这是从R^n到R^m的一个映射
并且由矩阵乘法的性质
我们容易知道
A去乘以x加y等于Ax加Ay
A去乘以kx等于kAx
所以这个变换是一个线性变换
那特别地
如果A是n乘n的实矩阵
那这个T就是R^n
到自身的线性变换
我们由矩阵A定义出来了
一个线性变换
再来看假设P_n表示的是
次数小于等于n的一元实系数
多项式的集合
而P_{n-1}表示的是次数小于等于
n-1的一元实系数多项式集合
我们如果对P_n中的元素
也就是一个一元的实系数多项式
我们对这个x去求导
这个T 我们说根据求导的性质
如果任意的f+g
f和g是在P_n里头
对它们来关于x求导等于
df/dx加dg/dx
如果常数去乘以多项式f
再关于x求导
常数可以提出来
那么由导数的性质我们知道
这个定义的T这个映射
是从P_n到P_{n-1}的线性变换
我们接下来这个例子呢
假设V表示的R上的连续函数集合
T这个映射是对V上的函数
去求不定积分
那么f(t)从0到x来做积分
我们说由这个积分的性质
f+g去求积分等于f去求积分
加上g求积分
常数k去乘以f(t)求积分
等于常数t出来
所以T这个映射
也是V到V的一个线性变换
那接下来这个例子呢说
我们把R^2中的向量U
逆时针旋转𝜽角
这个旋转变换
我们说这个旋转变换
是一个线性变换
而如果我们把U的坐标
给记成(x,y)
对它逆时针旋转𝜽角之后
变成Q(u)
它的坐标是xcos𝜽-ysin𝜽
xsin𝜽+ycos𝜽
特别地呢
它把(1,0)这个向量给映成
(cos𝜽,sin𝜽)
把(0,1)这个向量映成(-sin𝜽, cos𝜽)
我们注意到说这个映射
Q(u)等于(xcos𝜽 - ysin𝜽,
xsin𝜽 + ycos𝜽)
那它等于是说用这个2×2的矩阵
cos𝜽 -sin𝜽 sin𝜽 cos𝜽
这个矩阵去乘以二维向量x y
那么根据刚才我们说
把x映成Ax
这是一个线性变换
我们说这里特别的这个旋转Q呢
也是一个线性变换
而下面这个例子我们来看
R^3到xoy平面的投影变换
R^3中的向量(x,y,z)
然后我们把它投影到xoy平面上去
那变成(x,y,0)
而这是一个线性变换
我们注意到说u+v
假设u的这个分量是(x,y,z)
v的分量是(x’,y’,z’)
那么u+v呢
就是(x+x’,y+y’,
z+z’)
而作一下投影之后
投到xoy平面上就变成
(x+x’,y+y’,0)
那么这个等于P(u)+P(v)
保持加法 同样地
数k去乘以u
那分量变成(kx,ky,kz)
作了一下投影之后
变成(kx,ky,0)
这个等于k(x,y,0)
也就是kP(u)
保持数乘运算
我们还可以看到
这个简单的线性变换
如果我们u的分量是(x,y,z)的话
这个相当于是用对角矩阵
1 1 0作对角元的对角矩阵
去乘以(x,y,z)
从而得到(x,y,0)
那它也是一个线性变换
我们再来看R^3中的向量
到xoy平面
关于xoy平面的反射变换
在三维空间中的向量(x,y,z)
关于xoy平面去作投影
那么得到的是(x,y,-z)这个向量
我们也很容易看到
假设我们把(x,y,z)这个向量
叫u的话
那么这个反射变换
是把以(x,y,z)为分量的u
给映成矩阵1 1 -1
为对角元的对角阵去乘以(x,y,z)
从而得到(x,y,-z)
那么这是一个矩阵
去乘以一个向量
它是一个线性变换
好 我们看看若干例子
我们注意到对于线性变换T而言
它一定是把V中的零向量
映到W中的零向量
那我们可以从数乘的性质来看
我们说零向量它可以看成是
数零去乘以任何V中的一个元素
那么根据数乘的性质
数可以提出来
而零去乘以
w中的任何一个向量T(x)
还等于零向量
总之我们一定会有这条性质
线性变换一定把
零向量变成零向量
那么我们来看说
如果一个映射
R到R的一个映射T(x)
把x映成x+1
那我们注意到它把零给映成了1
它一定不是一个线性变换
而R到R的线性变换
它一定满足什么样子呢
它一定是数乘变换的样子
一定会存在一个数k_0
使得T(x)等于k_0 x
这是R到R的线性变换
那如果变成是
R^2到R^2的线性变换的话
我们知道说你数乘变换
它一定是一个线性变换
但是呢R^2到R^2的线性变换
可以不仅仅是这种数乘变换
而比如是我们把(x,y)
这个二维向量给映成(x+y,x-y)
那么它又等于是1 1 1 -1
这个矩阵去乘以(x,y)这个向量
它也是一个线性变换
而我是想说对于R到R的线性变换
它一定是数乘变换的样子
而高维的向量空间
之间的线性变换
就有更丰富的例子
好 那下面这个例子呢
是R^3到平面z=1的投影变换
它把R^3中的任何一个向量
(x,y,z)映成平面z等于1上的向量
(x,y,1)
那它也是说 特别地我们注意到
零向量这时候映成了(0,0,1)
所以这个投影变换
它一定不是线性变换
那么给定一个三阶的矩阵A
给定一个非零向量x
长在R^3里头
我们的变换
把三维空间中的向量x
映成Ax+x_0这还是落在R^3里头
但是特别地
它把零向量给映成A乘以0还是0
再加上x_0
把0映成了x_0
x_0不是零向量
因此这时候T不是线性变换
我们称T(x)等于Ax+x_0
这个变换是仿射变换
affine transformation
当这个x_0不等于0的时候
不是线性变换
我们再来看一个例子
从R^3到R^1的映射
把任何三维向量x映成x的长度
也就是x_1的平方
加x_2的平方 加x_3的平方
再开根号
那可以验证说虽然是把0向量
映到了0
但是这不是一个线性变换
因为我们来看T(x)加T(y)
是等于x的模长加上y的模长
根据三角不等式
它要大于等于x+y的模长
而x+y的模长呢
是T(x+y)
所以这时候线性运算没有保持
如果y不等于0
或者x不等于0的话
那再看T(kx)根据定义
它是k x的模长
那么它等于k的绝对值
再乘以x的模长
如果k是小于0的话
这个是不等于kx的模长的
加法和数乘都不保持
所以它不是线性变换
那由定义呢我们立即可以得到
线性变换由下面的简单的性质
假设T是从数域F上的向量空间
V到W的线性变换
我们有T(0)等于0
把零向量变到零向量
所以线性变换保持原点
T(-x)=-T(x)
对于任意V中的向量x都成立
那T把线性组合c_1x_1+c_2x_2+...+c_nx_n
这些个x_1 x_n是长在v里
它的线性组合被T给映射到T(x_1)
T(x_2) 和T(x_n)的
同样地以c_1 c_2 c_n
为系数的线性组合
也就是说线性变换
保持向量空间的线性关系
那如果是x_1 x_n
是V中的线性相关的一个向量组
那么T(x_1) … T(x_n)是W中的
线性相关的向量组
这个很容易看到 我们说
因为x_1到x_n线性相关
所以存在着不全为0的数
c_1到c_n
那它们落在这个F里头
使得我有c_1x_1+...+c_nx_n等于0
那么由刚才的性质
我们一定有c_1T(x_1)加到c_nT(x_n)
等于0
也就是T(x_1) T(x_n)这n个W中的向量
它有一个不全为零的数
c_1到c_n的这样的一个线性组合
等于零向量
那么也就是这n个向量也线性相关
而反过来是不对的
线性变换
可能把线性无关的向量组
变成线性相关的向量组
特别地零变换就是这样
一开始在V里头
有一个线性无关的向量组
被零变换打过去全变成零向量
那么它一定线性相关的
那么 那线性变换呢
保持向量空间的线性关系
特别地 线性变换总是把直线
映成直线
把三角形变成三角形
平行四边形变成平行四边形等等
我们来看一个例子
假设这个矩阵是2 1
1 2这样的一个2乘2的矩阵
我们由它定义
R^2到R^2上的一个线性变换
它把向量(x,y)
映成A去乘以(x,y)
也就是(2x+y,x+2y)
这是我们的A去乘以这个(x,y)
这是一个线性变换
那我们来看说
你如果在R^2里头有一个正方形
那经过这个线性变换之后
原点变到了原点
(1,0)这个点变成了(2,1)这个点
那么这条直线上的点
映到了这条直线上的点
比如说这个中点
映到了这边的中点
(0,1)这个点映到了(2,1)这个点
我们可以画出来我们说
原来的正方形
变成了这样的一个平行四边形
中点能够变成中点
好 这是线性变换的
几条简单的性质
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语