当前课程知识点:简明线性代数 > 第3章 矩阵 > 3-2 矩阵的乘法 > 3-2 矩阵的乘法
同学们 大家好
欢迎进入MOOC课程
线性代数-先修课
第三章 矩阵
3.2节 矩阵的乘法运算
在本讲当中
我们将给大家介绍矩阵的乘法的概念
这是本门课程当中的一个重点
也是一个难点
首先 我们先来看矩阵乘法引入的背景
我们还是从一个例子出发
例1 假设有如下两组变量替换
第一组变量替换是这样子
是把x_1 x_2分别表示为
y_1 y_2和y_3的一个组合
第二组变量替换
分别把y_1 y_2 y_3表示为
z_1 z_2的一些组合
那么 我们将第二组变量替换
代入到第一组当中
即可将x_1 x_2表示为z_1 z_2的形式
也就得到这样的一个表达式
这个表达式比较复杂
下面 我们先给出一种简便的方法
把这个变量替换的代入
以及它得到的算式给出一种表示
首先 我们来看第一组变量替换
这组变量替换
可以由它的表示系数来决定
其中我们把这些系数
按照原来的位置排起来
就得到了这样一个2行3列的矩阵
对于第二组变量替换
我们同样把系数
按照原来的位置列出来
得到了这样一个3行2列的矩阵
对于代入以后
得到的新的这样的变量替换
我们把对应的系数
表示为c_ij的形式
得到了这样一个2行2列的矩阵
下面我们来具体地看
对于第一组变量替换
x_i为被表示量, y_k为表示量
那么 我们把对应的这个矩阵记为A
则我们会发现
被表示量x_i的个数
正好对应了这个矩阵A的行数
而表示量y_k的个数
正好对应了矩阵A的列数
这不是偶然现象
因为我们来看第二组变量替换
第二组变量替换
y_k为被表示量, 而z_j为表示量
当我们把这个对应的矩阵写出来
得到了这样一个3行2列的矩阵B
那么 被表示量y_k的个数
正好对应了矩阵B的行数
而表示量z_j的个数
正好对应了矩阵B的列数
同样的道理
对于代入之后得到的这个
新的变量替换
其中
x_i为被表示量 z_j为表示量
那么x_i的个数就对应了
这个表示矩阵的行数
而表示量z_j的个数就对应了
表示矩阵的列数
并且 我们通过分析上述表达式
我们可以对c_ij
给出一个统一的表达式
特别 如果我们用求和号的表示
可以得到更加简洁的表达
下面 我们来讨论以下几个问题
我们把变量替换简称为变换
那么 我们变换②可以代入到
变换①的条件是什么呢?
首先我们把x_i
通过第一组变换表示为y_k
其中 这个变换所对应的矩阵
为矩阵A
然后 我们用第二组变换
把y_k通过矩阵B表示为z_j
这就是我们的两组变换
我们之所以可以做这样的代入
原因就是因为变换①的表示量
恰好为变换②的被表示量
在这里就是y_k
第二个问题
代入之后新的变换当中
表示量和被表示量是如何的
那么 代入之后
如果我们用这样的一个箭头表示
代入后所得到的新的变换
并且 用矩阵C来表示这个变换
那么 我们就会知道
这个新的变换的被表示量
就是变换①的被表示量
也就是x_i 这个新的变换的表示量
正好为变换②的表示量 也就是z_j
从而 我们会知道这个矩阵C的行数
就是x_i的个数
这个矩阵C的列数就是z_j的个数
第三个问题
代入以后新的变换变换系数如何
也就是矩阵C的每一个元素(是什么)
根据我们刚才那个表达式
我们可以用这个求和号把c_ij表示出来
那么 我们再把这样的代入过程
就把它表示成为A×B
历史上Arthur Cayley正是为了描述
线性映射的复合而引入了矩阵的乘法
好 假设矩阵A和B分别为
m×s和t×n型的矩阵
那么 我们说矩阵A和矩阵B可以做乘法
也就是它们的可乘原则
就是前面矩阵的列数s
等于后面矩阵的行数t
即矩阵A的列数等于矩阵B的行数
我们用黄色箭头表示
它们必须相等 则我们说
如果这个条件满足
则我们称A与B可以相乘
并且把乘积记为AB
定义的第二部分
我们规定乘积矩阵C的阶数
为前面矩阵的行数m
乘以后面矩阵的列数n
也就是如果C为矩阵A和B的乘积
则矩阵C的行数由矩阵A的行数来提供
矩阵C的列数由矩阵B的列数来提供
对于前两个原则
我们用这样的口诀来给与描述
即左行右列中相等
左行就是指乘积矩阵的行数
由两个矩阵下标的最左边提供
右列就是指乘积矩阵的列数
由两个矩阵四个下标最右边那个提供
中相等就是指可乘条件
即中间两个下标必须相等
矩阵乘法的第三个规定
就是乘积矩阵第(i,j)位置上的
元素c_ij的计算公式
即 乘积矩阵C的(i,j)位置上的
元素c_ij的计算法则
根据我们前边的讨论
推广成一般情况
我们规定c_ij由这样的算式来决定
特别地 当我们把它表示为求和号的时候
为这个样子
下面 我们来具体地解释一下这个算式
为计算乘积矩阵第i行第j列上的元素
也就是c_ij
我们首先提取出
矩阵A的第i行和矩阵B的第j列
然后对提取出来的行和列
对应元素相乘再求和
就得到了对应的c_ij
我们用左行右列中求和的口诀
来表述这个乘积的法则
那么 我们具体来解释一下
所谓的左行就是指
在元素计算公式当中的求和号当中
有四个下标 最左边的一个下标
由c_ij所在的行数也就是i来决定
最右边的一个下标
由c_ij所在的列数 也就是j来决定
那么 中间的两个下标必须相等
并且对其求和
求和的范围就是从1跑到s
这个s就是可乘条件当中
第一个矩阵的列数
也是第二个矩阵的行数
矩阵乘积的定义比较抽象
需要大家做大量具体的计算
方能熟能生巧
下边 我们来看一个这样具体的例子
矩阵A是一个3×3的方阵
而矩阵B是一个3行1列的矩阵
我们要求矩阵A乘矩阵B
那么 根据可乘条件
矩阵A的列数为3
而矩阵B的行数为3,因此可乘
乘积矩阵的尺寸就是由
矩阵A的行数和矩阵B的列数来决定
从而它是一个3行1列的矩阵
对于这乘积矩阵的每个分量
我们是按这样的原则来计算的
其中第1行第1列的元素
是由矩阵A的第1行和矩阵B的第1列
对应元素相乘再相加
而乘积矩阵第2行第1列的元素
是由矩阵A的第2行和矩阵B的第1列
对应元素相乘再相加
而乘积矩阵第3行第1列的元素
是由A的第3行和B的第1列对应元素
相乘再相加来计算的
计算结果就等于这样的一个列矩阵
我们需要补充说明一下
第一点 在本例当中 AB是有意义的
但是反过来 BA是没有意义的
因为B的列数和A的行数是不相等的
也就是说B与A是不可乘的
第二点
如果将本例当中的B换成另一个列向量
也就是x_1 x_2和x_3的话
根据我们的乘法定义
AB得到的就是这样的一个矩阵
这个形式大家很熟悉
就是我们一个线性方程组的左边
那么 把这个例子推广到一般的情况
就可以得到我们的例3
我们考虑如下的线性方程组
这是一个n个变量
m个方程的线性方程组
如果我们把系数矩阵记为A
而未知量X表示为一个n行1列的列矩阵
把常数表示为m行1列的列矩阵
那么 根据矩阵乘法的定义
我们可以把线性方程组
改写为AX=B的形式
其中 这里的矩阵A
就是线性方程组的系数矩阵
而矩阵A并上矩阵B得到一个
新的m行n+1列的矩阵
就是线性方程组的增广系数矩阵
我们再看一个简单的例子
假设A是一个2行1列的列矩阵
而B是一个1行2列的行矩阵
则我们可以去计算AB
等于这样一个2×2的方阵
我们还是具体来看一下
其中的每个分量是如何计算出来的
其中 乘积矩阵第1行第1列的元素
是由A的第1行乘以B的第1列得到的
而乘积矩阵第1行第2列的元素
是由A的第1行乘以B的第2列所得到的
乘积矩阵第2行第1列的元素
是由A的第2行和
B的第1列相乘而得到的
乘积矩阵第2行第2列的元素
是由A的第2行和
B的第2列相乘所得到的
另一方面
在这个例子当中BA也是有意义的
乘完以后我们根据乘积矩阵的尺寸
我们会知道它是一个1×1的矩阵
也就是乘完之后就变成一个数了
那么具体的计算
就是它等于B的第1行和
A的第1行对应元素相乘再相加
得到的就是这样的一个1阶矩阵
我们对例4作如下的说明
通过例4我们会发现
虽然A乘B与B乘A在本例当中都有意义
但是AB是一个2×2的矩阵
而BA是一个1×1的矩阵
从而显然地有:AB不等于BA
也就是在这个例子当中
两个矩阵的乘法并没有交换律
这一点是不符合
我们数的乘法的运算律的
矩阵的乘法对我们来说
是一个新鲜事物
除了记住它的定义以外
大家还需要特别注意
矩阵乘法所具有的反常性
其中 非交换性就是矩阵乘法的一条反常性
下面 我们再来看一个例子
假设A和B分别是这样的两个2阶方阵
那么根据矩阵的乘法
我们知道AB是有意义的
下面 我们来计算AB等于什么
我们提取A的第1行和B的第1列
对应位置相乘再相加就得到了
乘积矩阵第1行第1列的元素 等于0
我们提取A的第1行B的第2列
就得到了乘积矩阵 1 2 置上元素为0
我们再提取A的第2行
B的第1列对应相乘再相加
就得到了AB的第3位置处 计算为0
我们提取矩阵A的第2行和矩阵B的第2列
就可以得到乘积矩阵AB的第2行
第2列上的元素 计算为0
反过来 我们也可以去计算BA
而且根据乘法定义
BA也是一个2阶矩阵
其中我们提取B的第1行A的第1列
计算得BA的第1个位置为2
我们提取B的第1行A的第2列
得到BA第2位置上计算值为2
我们提取B的第2行A的第1列
可以得到BA的第3位置上计算为-2
我们提取B的第2行A的第2列
就可以得到BA的第4位置上
计算值为-2
观察例5当中两个计算结果
我们会发现 虽然AB和BA是同阶方阵
但是AB依然不等于BA
另外一点就是
虽然AB都是非零矩阵
但是A乘以B等于零矩阵
这样的一种现象
我们称为:“具有零因子”
也就是两个不为零的对象乘完以后等于零
对于数的乘法来说 是没有零因子的
但是 对于2阶以上的矩阵
可能就具有零因子
这是矩阵乘法的第二个反常性
我们再来看一个具体的例子
假设A B C分别为如下的2阶方阵
我们要求AB和AC 经过计算
我们会发现
AB等于这样的一个2阶方阵
而AC又等于这样的一个2阶方阵
通过对比我们会发现AB=AC
但是B不等于C
例6告诉我们 虽然A不是零矩阵
而且AB=AC 但是B不等于C
这说明在矩阵的乘法当中
消去律是不成立的
这是矩阵乘法的第三个反常性
下面 我们对矩阵的乘法的性质
以及运算律作一些总结
首先 我们来总结一下矩阵乘法的反常性
通过刚才的例题讨论
我们已经知道矩阵的乘法不具有交换性
也就是一般情况下AB不等于BA
第二点 矩阵的乘法具有零因子
也就是A和B都不为零矩阵的情况下
我们并不能推出AB不为零矩阵
等价的命题就是当AB等于零矩阵的时候
我们并不能推出A等于零(矩阵)或者是B等于零(矩阵)
第三条 矩阵的乘法不满足消去律
也就是当我们知道AB=AC的时候
我们并不能消去A而得到B=C
下面 我们来看一个特殊矩阵的乘法
这个特殊矩阵就是对角矩阵
我们设有如下的一个m阶对角阵
它可以左乘在一个m×n阶的矩阵上
那么 根据矩阵的运算律
我们提取出第1个矩阵的第1行和
第2个矩阵的第1列
可以计算出乘积矩阵
第1行第1列的元素为k_1乘以a_11
我们提取第1个矩阵第1行和
第2个矩阵的第2列
我们可以得到乘积矩阵
第1行第2列的元素为k_1乘以a_12
以此类推 我们选取
第1个矩阵的第1行和第2个矩阵的第n列
我们可以得到
乘积矩阵的第1行第n列元素为k_1乘以a_1n
同样的道理
我们提取第1个矩阵的第2行
以及第2个矩阵的1至n列
就可以计算出
乘积矩阵的第2行为这个样子
进一步计算 我们可以知道
乘积矩阵的其他分量分别是这样子的
那么 观察这个结果
我们会发现左乘以一个对角阵
相当于对原矩阵的第1行
统一地做一个k_1的倍乘
对原矩阵的第2行
统一地做一个k_2的倍乘 以此类推
那么 我们再来考虑一下
当对角矩阵乘在右边的时候
会对原矩阵发生什么样的变化
我们提取第1个矩阵的第1行
和第2个矩阵的第1列
可以计算出乘积矩阵
第1行第1列的元素为k_1乘a_11
提取第1个矩阵的第2行和
第2个矩阵的第1列
可以知道第2行第1列的元素为k_1乘a_21
同样提取第1个矩阵的第m行
和第2个矩阵的第1列
可以计算出对应的位置是k_1乘a_m1
提取第1个矩阵的第1到第m行
以及第2个矩阵的第2列
经过计算我们会发现
乘积矩阵的第2列就是这个样子的
同理 我们也可以计算出
其他位置上的元素
观察一下我们会发现
对于右乘以一个对角阵
相当于对原矩阵做了一个列变换
其中 第1列就是做一个k_1倍的倍乘
而第2列就是做一个k_2倍的倍乘
以此类推
第n列就是做一个k_n倍的倍乘
我们把对角阵的乘法
归纳为这样的一个口诀
即左行右列做倍乘 也就是说
左边乘以对角阵的话
相当于对原来的矩阵做倍乘的行变换
右乘以一个对角阵相当于
对原矩阵做倍乘的列变换
通过例7
我们还可以得到如下的两个结论
我们把例7当中的对角阵特殊化
取成单位阵的时候
我们就可以得到这样的一个结论
即单位阵左乘或者是
右乘任何矩阵均保持原矩阵不变
另一方面 我们把例7当中的对角阵
取为特殊的数量阵的话
那么 我们会知道
数量阵乘以任何矩阵
相当于对这个矩阵做k倍的数乘
另外 我们还可以证明
数量矩阵和任意n阶方阵
都是乘法可交换的
反过 来我们还可以证明
与任意n阶方阵都可以交换的矩阵
只有数量矩阵
而这个证明留给大家做课后习题
接下来我们来讨论矩阵乘法的运算律
假设A是一个m×n型的矩阵
并且取B C使得下列运算可行
则我们得到以下几条运算律
第一条 零矩阵的乘法
即零矩阵乘以任何矩阵都等于零矩阵
第二条 单位矩阵的乘法
即 单位矩阵乘以任何矩阵
以及任何矩阵乘单位阵均保持不变
第三条 数乘与矩阵乘法
即数乘可以作用在前一个矩阵
或者是后一个矩阵
或者是整个乘积矩阵之外
计算结果均相等
第四条 左右分配律
由于矩阵乘法具有非交换性
所以分配律有两条
分别为左分配律和右分配律
第五条 矩阵乘法的结合律
以上五条运算律
前四条证明都比较简单
只需要对每个元素逐一去验证即可
我们下面只给出结合律的证明
要证明结合律
首先 我们先假设A B C的分量
分别为a_ij b_ij和c_ij
并且我们记AB=P,BC=Q
根据矩阵乘法的规定我们知道
矩阵P是一个m×s阶的矩阵
而Q是一个n×t阶的矩阵
于是 结合律等式的两边
所得到的矩阵均为m×t型的矩阵
为同型矩阵
下面 讨论这两个同型矩阵的每一个元素
一方面 左边矩阵位于
第i行第j列位置上的元素
由这样的一个计算公式来决定
其中 第一个等式是由PC来决定
而第二个等式是把
P=AB的每个分量计算公式再代进去
第三个等式就是把
括号展开之后得到的式子
另一方面
右边这个矩阵位于
第i行第j列位置上的元素
由下面这个公式来决定
其中 第一个等式是去计算AQ
第二个等式是由Q=BC的分量所给出
那么 把这个分量代到第一个等式里
再展开就得到了第三个等式
上下两个等式我们会发现它们相等
因此等式左边和等式右边
是两个同型矩阵
且对应元素相等
因此 它们是两个相等的矩阵
我们就证明了结合律
本讲小结
在本讲当中
我们首先由变量替换的复合
引入了矩阵的乘法定义
定义包括 可乘条件
乘积矩阵的阶数
乘积矩阵元素的计算法则
其次 我们分析了矩阵乘法的反常性
包括非交换性 存在零因子
以及无消去律
最后 我们给出了矩阵乘法满足的运算律
包括零矩阵乘法 单位矩阵乘法
数乘与乘法 左右分配律
以及乘法的结合律
矩阵的乘法是本门课程中
第二种主要的算法
是线性代数中的重点,同时也是难点
它的定义比较复杂,也比较抽象
它的运算与我们熟悉的数的乘法相比
有一些反常性
在计算过程中 环环相扣
一步错则全局错
需要大家课后做大量练习 熟悉掌握
本讲的内容就到这儿
我们下讲 再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换