当前课程知识点:简明线性代数 > 第3章 矩阵 > 3-4 分块矩阵 > 3-4 分块矩阵
同学们 大家好
欢迎来到MOOC课程
线性代数先修课
第三章 矩阵
3.4节 分块矩阵
在本节当中
我们将引入分块矩阵的概念
并且介绍几种常用的矩阵分块方式
以及矩阵分块的主要原则
本节的重点将介绍分块矩阵的运算
进一步 再讨论几类特殊的分块矩阵
好 首先我们先来看分块矩阵的概念
在处理有特点的大矩阵时
我们常常需要对矩阵进行分块处理
比如说 上一讲当中
我们在证明两个矩阵的乘积的行列式
等于各自行列式乘积的时候
我们就用到了这样的一个行列式
对于这一个有特点的行列式
我们采用了这样的分块方式
于是将它简记为A,O,-I,B的形式
从而使得表示和计算都得到了简化
那么 在大数据盛行的今天
人们常常要处理一些超大型的矩阵
这些矩阵的行数和列数往往都是上千的
甚至上万 上十万
所以这些超大型矩阵的运算
不适合储存在高速计算机的内存里
如果非要把它们放到计算机的内存里
这就相当于把大象装到冰箱里面一样
是不可能的事情
然而运用分块矩阵
允许计算机处理小块的子矩阵
使得我们处理超大矩阵的运算成为可行的
这就好比我们先把大象切成若干个小块
然后再把每个小块放进冰箱里
下面 来看分块矩阵的定义
对于一个m×n阶的矩阵
如果我们用若干个横线和竖线
把A的行分成p个部分
列分成q个部分
而整个矩阵就分成了p×q个小矩阵
也就是这样的形式
其中每个小矩阵A_ij
我们把它称为矩阵A的子块
同时A也可以看成
由子块A_ij构成的p×q阶的矩阵
于是我们就把这样的矩阵称为分块矩阵
这里需要注意一下
分块矩阵当中的A_ij和之前
我们介绍过的代数余子式是有区别的
代数余子式是行列式
计算之后是等于一个数
而这里的A_ij是一些矩阵
下面 我们来介绍矩阵的常用分块方式
第一种 是把矩阵分成四块
例如A是一个3行4列的矩阵
如果我们用这样的横线和竖线
就可以把矩阵分成四块
从而我们把它记为这样的形式
同样的一个A 我们改变分块方式
用这样的方式来分块
我们也可以分成这样的
一个四块的分块矩阵
同样把它记成这样的形式
这里注意
上面的Aij和下面的Aij
就代表不同的矩阵
另外一类常用的分块方式
我们是按行和按列来分
例如我们按列来分
就是把矩阵按这样的方式
分成所有的列的形式
并且把每一列记为
α1 α2 α3和α4
那么 同样我们也可以按行来分块
对这个矩阵A
我们用这样的横线把矩阵分成了3行
并且分别把它的行记成β1 β2和β3
接下来 我们来讨论矩阵分块的主要原则
我们有以下的三个主要原则
第一 根据矩阵的特点 按需划分
第二 除了乘法的次序以外
能够把子块看成是元素一样的进行运算
第三 保持原有的运算性质
换言之也就是
原来通过元素进行运算的各种性质和结果
当我换成子块进行运算之后
保持原来的运算性质和运算结果
下面 我们来看一个具体的例子
设A和B分别是这样的两个矩阵
请大家观察一下
这两个矩阵有什么样的特点?
那么 对它们进行分块的话
应该分成什么样的块比较合适?
好 也许你已经发现了
对于第一个矩阵A
由于它的右上角有一块整块的0
所以我们可以采用这样的分块方式
使得它的右上角整一块的都是0矩阵
同样对于矩阵B 也是右上角有一块0
因此我们用这样的分块方式
使得右上角的整块都是0矩阵
那么通过元素的计算我们会发现
矩阵A乘以矩阵B等于这样的一个矩阵
那么 这个时候我们同样
对这个乘积矩阵也可以采用
这样的分块方式
使得右上角有一个整块的0矩阵
接下来 我们会用第二个原则
也就是把子块当成元素一样进行运算
来验证这样的分块矩阵的乘积
依然是等于原来元素运算的乘积
所以我们先来介绍一下
分块矩阵的运算
第一种运算 分块矩阵的加法
设分块矩阵A与B的行数和列数均相同
也就是A B是同型矩阵
并且我们还要求
A和B采用同样的分块方法
也就是如果A和B表示成
这样的两个分块矩阵
首先我们要求A的行的分块数和
B的行的分块数完全一样
同时A的列分块数与B的列分块数也一样
进而我们还要求A的子块Aij
与B的子块Bij的行数和列数均相同
也就是Aij和Bij都要求是同型矩阵
也就是说
这里的A11和B11是同型矩阵
A1q和B1q是同型矩阵
以此类推
所有的Aij和Bij都是同型矩阵
由于Aij和Bij均为同型矩阵
所以我们就可以规定
A和B这样两个分块矩阵的相加
就等于它们对应子块分别相加再取矩阵
总结一下就是
分块矩阵的加法 分块需全部相同
下面我们来看分块矩阵的数乘
假设A是这样的一个分块矩阵
而这时我们分块的方式 可以任意
λ是一个数 那么对于λ和A做数乘
就等于A的每个子块A_ij分别做数乘
例如
如果我们有这样的一个分块矩阵
并且设λ=2
则我们去计算2A的时候
就相当于在原来的矩阵基础之上
每个位置都乘以2
这又相当于在A的每个子块上面都做数乘2
下面来看分块矩阵的转置
首先 我们先来看一个例子
设A是这样一个4行3列的矩阵
那么A的转置很容易求
就是这样的一个3行4列的矩阵
如果我们把A分成这样的
一个四块的矩阵
并且把它表示成分块矩阵的形式
其中呢A11 A12
A21和A22分别为
这样的四个矩阵
同样 我们也可以对A转置
进行这样的分块
于是 我们把A的转置也表示成
分块矩阵的形式
其中B11 B12 B21
和B22分别为这样的形式
于是 通过对比我们会发现
A的子块和A转置的子块之间
分别有这样的一个关系
那么总结起来
我们可以得到这样的一个关系
也就是Aij 等于Bji 的转置
相当于分块矩阵的转置等于
每一个子块均进行转置
并且交换子块下边的行坐标和列坐标
那么根据我们这个例子
我们可以对一般的分块矩阵的转置
进行如下的规定
也就是说 A的转置等于这个样子
即A的每一个子块均做转置
且行下标列下标互换
接下来 我们来介绍分块矩阵的乘法
这一部分是我们本讲当中的重点
假设A与B可乘 并且它们的矩阵为C
那么 我们下面给出分块矩阵乘法的可乘条件
第一条 我们先将A,B,C分别表示为
这样的分块矩阵的形式
那么 我们分块矩阵的可乘条件的
第一个要求就是
A的列数等于B的行数
这个是我们一般的矩阵乘法
就已经有要求的
进一步
我们还要求A的列的分法等于
B的行的分法 也就是说
如果A的列n能够拆分为
n1+n2+...+ns的形式
那么对应的 B的行的分法
也要拆分为n1+n2+...+ns的形式
这里的n1+n2+...+ns对应了
n的一个有序的加法拆分
例如 3能够拆分为1+2和2+1
但是在有序的这种原则下
1+2这种拆分不等于2+1这种拆分
接下来 我们再来看乘积矩阵的描述
对于分块矩阵乘积矩阵C
我们先来看C的行
我们要求C的行数及行分块的方法
由A的行数及行分块方法来决定
在这里也就是说
如果A的行数为m
则C的行数也要为m
如果A的行能够拆分为
m1+m2+...+mr 的形式的话
那么C的行的分块也必须拆为 m1 + m2 +...+ mr
再来看C的列
我们要求C的列数及列分块方法
由B的列数及列分块方法来决定
在这里也就是
如果B的列数l能够分拆为
l1+ l2+...+ lt的形式
那么C的列及列分块方式就是
l以及l1+l2+...+lt
我们把上述两个原则统称为
左行右列中同分
具体来说
也就是乘积矩阵的行
由A,B四个下标当中最左边那个下标
以及其分块方式来决定
而乘积矩阵C的列由这四个下标
最右边那个也就是l的拆分方式来决定
那么四个下标当中的中间两个下标以及
它们的分块方式必须完全相同
简称为左行右列中同分
最后来看乘积矩阵的每个子块计算方式
那么根据我们分块矩阵的原则二与原则三
我们可以得到
C的每个子块有这样的计算公式
它和我们元素的计算公式是相同的
我们用一个口诀来说
就是“左行右列中求和”
其中 需要注意的就是
A_ik与B_kj相乘的时候
一定要保持原来乘积的顺序
下面 我们还是来看一个例子
这个例子就是我们之前介绍过的例1
例1 我们给出了
两个矩阵A和B以及它们的乘积
并且我们根据A,B的特点进行了分块
其中A是一个4行3列的矩阵
并且它的行分成了2+2的形式
列分成了1+2的形式
而对于矩阵B
是一个3行5列的矩阵
它的行分成了1+2的形式
而列分成了2+3的形式
我们来检验A的列数以及
列分块方式与B的行数
以及行分块方式完全一样
因此这两个分块矩阵可以相乘
那么 分块矩阵相乘之后
根据左行右列的原则
那么乘积矩阵的分块方式
它的行分块方式就由A的行分块方式
也就是2+2来决定
也就是说我们用这样的一条横线
把乘积矩阵分成这样的两块
同样 乘积矩阵的列分块方式
由B的列分块方式
也就是2+3的形式来分块
所以我们用这样的一条竖线
分成了一个2列和3列的形式
所以乘积矩阵就得到了
这样的一个分块方式
下边我们来逐一地验证
乘积矩阵当中每一个子块的结果
根据左行右列中求和的方式
C11应该等于A1k乘以Bk1
再对k求和
代入具体的子块
那么计算结果就等于这样
于是我们发现
它确实是等于
乘积矩阵最左上角的那一块
同样 我们来算一下C_21
代入具体的矩阵
计算结果是等于这样的一个矩阵
它确实是等于矩阵左下角的这个子块
再来看C12
把具体子块代入之后的计算结果
是一个0矩阵
而确实我们发现
这个分块矩阵的右上角是一个零矩阵
最后再来看C22
计算结果是等于这样的一个矩阵
那么确实也是等于
原矩阵的右下角的这块子块
下面 我们再来看一个例子
我们通过分块矩阵的方式来
对AB=C进行不同的理解
首先 根据左行右列中同分的原则
在保持A的列以及列分块
以及B的行及行分块的同时
我们可以自由地调整A的行的分块方式
以及B的列的分块方式
于是 我们可以对矩阵B进行按列来分块
而不影响分块矩阵的乘积
于是 就可以得到这样的一个等式
再根据分块矩阵的原则二
也就是把子块当作元素一样进行运算
就可以把矩阵A乘到每一个子块里面
得到这样的一个矩阵
另一方面
我们又可以把乘积矩阵C也按列进行分块
对比上下两个式子我们就发现
C的每一列就等于A乘以B的每一列
类似地 我们也可以把矩阵A按行来进行分块
分完以后可以把矩阵B右乘到每一个行上
于是 我们就得到了
C的每一个行就等于A的每一个行乘以矩阵B
类似地
我们也可以把矩阵A按行来进行分块
对矩阵B进行按列来分块
于是 乘积矩阵C呢
就可以看成是一个
列向量乘以一个行向量
它乘积之后就等于一个矩阵
这个矩阵的每一个分量就应该等于Ai乘以Bj
如果按矩阵乘积的方式把它展开
结果就正好等于我们熟悉的
乘积矩阵每个元素的计算公式
换言之 我们用分块矩阵的方式
再一次验证了矩阵乘积当中
每一个分量的计算公式
特别地 如果A乘以B等于零矩阵的时候
根据我们刚才的方式
我们把矩阵B按列分块之后
就可以得到每一个A乘以B_j都等于零向量
说明B的每一列都是
齐次线性方程组Ax=0的一个解
类似地 我们也可以考虑A按行分块
而B作为一个整块的信息
就得到这样的一个式子
从而我们会发现
A的每个行再乘以矩阵B
就等于一个零的行向量
再把这个式子做转置
说明A的每一个行的转置都是
齐次线性方程组B的转置
乘x等于零(向量)的一个解
这样的观点在
我们将来的讨论当中非常有用
它把矩阵乘积与齐次线性方程组的解
联系到了一起
本节的最后 我们来介绍
几类特殊的分块矩阵
第一类 我们称为准对角矩阵
设A为方阵 如果A有这样的分块方式
其中 这里空白的地方表示零矩阵
并且 我们把这个分块矩阵
简记为这样的形式
其中A_11一直到A_nn都是小方阵
则我们就把这样的一个分块矩阵
称为准对角矩阵
准对角阵可以看成是对角矩阵的推广情形
是一类最简单的分块矩阵
例如 这样的一个矩阵
那么根据0的位置
我们作这样的一个划分
得到这样的分块矩阵
就是一个准对角阵
同样 对这样的一个矩阵B
我们根据0的位置作这样的一个划分
从而 它也是一个准对角阵
另外一类特殊的分块矩阵 是准三角阵
首先 我们先来看准上三角阵
设矩阵A的行与列均分为n个子块
并且 分块矩阵当中主对角线下方呢
全为零(矩阵)
对这样的矩阵
我们把它称为准上三角形矩阵
类似地 我们也可以定义准下三角矩阵
同样要求A的行与列 分的子块数相同
并且 右上方全为零(矩阵)
于是 把这样的矩阵称为准下三角矩阵
需要说明的是 一般情形下
准三角形矩阵不一定要求是方阵
比如 在例1当中A和B都不是方阵
但是经过这样的分块划分之后
我们会发现
A和B均可以表示成如下的两个(准)下三角矩阵
那么 如果我们按
分块矩阵的乘积方式计算A乘B
那么 有这样的计算结果
其中 做运算的时候
请大家注意做乘积时的次序
于是我们就发现
乘积矩阵也为准下三角形矩阵
实际上 在可乘的情况下
上面这个式子的推导
对所有分成四块的
准下三角形矩阵均是成立的
我们提出一个问题
对于一般的准三角形矩阵
是否有类似的结论
下面 我们简单讨论一下
准三角形矩阵的运算性质
我们的回答是肯定的
结果用下面的定理来表述
我们说在可运算的条件下
准上三角形矩阵的加法 数乘与乘法
仍然是准上三角形矩阵
同样的结果 对准下三角形矩阵也成立
下面 我们来证明这个结果
第一 先来看加法和数乘
对于有两个相同分块的准三角形矩阵
我们用A和B来表示
很容易验证加法
即子块逐位相加
仍然为准上三角形矩阵
同样 数乘是子块逐块数乘
依然是准上三角形矩阵
接下来 我们来考虑乘法
如果准上三角形矩阵A和B可乘
则A的行列均可拆分为相同的块数
假设可以拆分为n块
下面我们来证明A乘B
一定是等于这样一个形式的
准上三角形矩阵
我们的证明是对分块数n进行归纳
当n=2时 我们可以把子块当作元素
也就是对于这样的两个2阶矩阵进行运算
会发现依然为准上三角形矩阵
我们假设结论对于n-1成立
下面考虑n的情况
矩阵A和矩阵B都分成了n^2块子块
对矩阵A 我们再进行如下的分块
也就是把第一块A_11单独地放在左上角
并且记为这样的一个新的分块矩阵
同样对矩阵B 我们也做相同的分块
并且记为这样一个新的分块(矩阵)
于是 对于这两个新的分块矩阵
又可以把它们看成是2阶矩阵的乘法
计算结果依然是一个准上三角阵
其中右下角的这两个矩阵A''
与B''均为行列均拆分为
n-1个子块的准下三角形矩阵
那么由归纳假设
我们就知道A''乘以B''
就是我们想要的那种形式的
准下三角形矩阵
从而我们就证明了AB依然为
准下三角形矩阵
也就是结论对n也成立
由于三角形矩阵是
特殊的准上三角形矩阵
那么 根据上述的定理
我们也可以得到如下的推论
也就是在可运算的条件下
上三角形矩阵的加法 数乘
与乘积 仍然是上三角形矩阵
同样的结论 对下三角形也成立
本讲小结
在本讲中
我们介绍了矩阵分块的方法
目的是把大型矩阵化为小的子矩阵块
从而简化运算
我们首先给出了
矩阵分块的三条基本原则
第一 按需划分
使得方便操作
第二 分块后
子块可以看成元素一样进行运算
除了乘法的次序以外
第三 子块运算后的结果
与原来按照元素运算后的结果保持相同
其次 我们介绍了
几种常用的矩阵分块方式
又分成四块法 按行分块法与按列分块法
以及按特殊矩阵分块法
如准对角阵 准三角阵等
本节的重点是给出了分块矩阵的运算
包括分块矩阵的加法、数乘、转置
以及分块矩阵的乘法
分块矩阵的乘法
是继行列式的计算之后
本课程中又一个难点
我们分别用“左行右列中同分”
和“左行右列中求和”的口诀
来总结分块矩阵的可乘原则
乘积矩阵的分块方式
以及乘积矩阵的子块计算公式
由于分块方式是根据
具体矩阵的特点按需划分 并无定法
这就要求我们在做分块矩阵乘法的时候
一定要仔细检验可乘条件
分块矩阵及其运算的方法和技巧
好比一根如意金箍棒
可大可小 大可上天 小可入耳
作为初学者
同学们需要做大量练习以增加理解
并不断提高分块矩阵运算的熟练度
将来一定可以运用好这根“如意金箍棒”
本讲的内容就到这儿
我们下节再见
-宣传片
--宣传片
-序论
--序论
-1-1 二元、三元一次方程组
-第1章 线性方程组--1-2 一般线性方程组的解法:Gauss消元法
-1-2 一般线性方程组的解法:Gauss消元法
-第1章 线性方程组--1-3 线性方程组解的判定
-1-3 线性方程组解的判定
-第1章 线性方程组--1-4 齐次线性方程组
-1-4 齐次线性方程组
-第2章 行列式--2-1 二阶、三阶行列式的性质
-2-1 二阶、三阶行列式的性质
-第2章 行列式--2-2 n元排列
-2-2 n元排列
--2-2 n元排列
-第2章 行列式--2-3 n阶行列式的定义
-2-3 n阶行列式的定义
-第2章 行列式--2-4 行列式的性质
-2-4 行列式的性质
-第2章 行列式--2-5 行列式的计算1-利用性质
-2-5 行列式的计算1-利用性质
--Video
-第2章 行列式--2-6 行列式的展开公式
-2-6 行列式的展开公式
-第2章 行列式--2-7 行列式的计算2-综合
-2-7 行列式的计算2-综合
-第2章 行列式--2-8 Cramer法则
-2-8 Cramer法则
-第3章 矩阵--3-1 矩阵及其线性运算
-3-1 矩阵及其线性运算
-第3章 矩阵--3-2 矩阵的乘法
-3-2 矩阵的乘法
-第3章 矩阵--3-3 矩阵的其他运算
-3-3 矩阵的其他运算
-第3章 矩阵--3-4 分块矩阵
-3-4 分块矩阵
--3-4 分块矩阵
-第3章 矩阵--3-5 初等矩阵
-3-5 初等矩阵
--3-5 初等矩阵
-第3章 矩阵--3-6 逆矩阵及矩阵可逆条件
-3-6 逆矩阵及矩阵可逆条件
-第3章 矩阵--3-7 逆矩阵的求法
-3-7 逆矩阵的求法
-第4章 向量空间--4-1 n维向量空间
-4-1 n维向量空间
-第4章 向量空间--4-2 向量组的线性相关性
-4-2 向量组的线性相关性
-第4章 向量空间--4-3 线性相关性的更多理论
-4-3 线性相关性的更多理论
-第4章 向量空间--4-4 极大线性无关组
-4-4 极大线性无关组
-第4章 向量空间--4-5 向量组的秩
-4-5 向量组的秩
-第4章 向量空间--4-6 矩阵的秩
-4-6 矩阵的秩
--Video
-第4章 向量空间--4-7 矩阵秩的运算律与相关结论
-4-7 矩阵秩的运算律与相关结论
-第5章 线性方程组的解理论--5-1 齐次线性方程组的解理论
-5-1 齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-2 非齐次线性方程组的解理论
-5-2 非齐次线性方程组的解理论
-第5章 线性方程组的解理论--5-3 线性方程组的几何意义
-5-3 线性方程组的几何意义
-第5章 线性方程组的解理论--5-4 矩阵方程
-5-4 矩阵方程
-第6章 内积空间--6-1 向量空间中的内积与度量
-6-1 向量空间中的内积与度量
-第6章 内积空间--6-2 标准正交基与正交矩阵
-6-2 标准正交基与正交矩阵
-第6章 内积空间--6-3 Schmidt正交化与QR分解
-6-3 Schmidt正交化与QR分解
-第6章 内积空间--6-4 正交投影与正交分解
-6-4 正交投影与正交分解
-第6章 内积空间--6-5 最小二乘问题
-6-5 最小二乘问题
-第7章 矩阵的特征值理论--7-1 矩阵的特征值与特征向量
-7-1 矩阵的特征值与特征向量
-第7章 矩阵的特征值理论--7-2 特征多项式与特征子空间
-7-2 特征多项式与特征子空间
-第7章 矩阵的特征值理论--7-3 相似矩阵
-7-3 相似矩阵
--7-3 相似矩阵
-第7章 矩阵的特征值理论--7-4 矩阵的对角化问题
-7-4 矩阵的对角化问题
-第7章 矩阵的特征值理论--7-5 实对称阵的对角化
-7-5 实对称阵的对角化
-第7章 矩阵的特征值理论--7-6 特征值理论的几个应用
-7-6 特征值理论的几个应用
-第8章 矩阵与变换--8-1 矩阵映射与矩阵变换
-8-1 矩阵映射与矩阵变换
-第8章 矩阵与变换--8-2 二维三维空间中几类特殊的矩阵变换
-8-2 二维三维空间中几类特殊的矩阵变换
-第8章 矩阵与变换--8-3 矩阵映射的复合与矩阵乘法
-8-3 矩阵映射的复合与矩阵乘法
-8-4 矩阵变换的不变量与特征值理论
-第8章 矩阵与变换--8-5 坐标系替换与矩阵相似
-8-5 坐标系替换与矩阵相似
-第8章 矩阵与变换--8-6 正交变换
-8-6 正交变换
--8-6 正交变换