5.2 图像压缩——基变换的应用慕课视频播放-线性代数(2)-MOOC慕课视频教程-柠檬大学

通讯卫星

互联网络的图像传输

需要处理大量的数据

所以我们需要进行压缩

比如说一张静止的灰度图像

它含有大量的小方块的

这种图像单元

也就是所谓的像素

那每个像素被赋予

从0到255的一个数

其中这个0表示的是黑色

255表示的白色

那么于是一张

比如说

256×256的像素的一个灰度图像

它对应的是一个

256^2维的向量x

那么这时候x写成

x_1 e_1+x_2 e_2+…+x_n e_n

的一个线性组合

其中e_1,e_2,…,e_n是我们所在的

向量空间中的标准基底

我们把这个向量空间取成C^n

那么是说允许之后

我们的每个分量

可以取复数

注意到

这样的一个高维的向量x

我们要传输起来很麻烦

我们想要进行压缩

压缩的本质上是说

我扔掉一些个分量

那么对于这样表示出来的一个x

比如说

我们扔掉百分之九十的分量

也就是说把这些分量

给记成是零的话

那我们需要传输的分量的像素

就变少了

我们可以有效地去传输

但是问题在于

这样如果百分之九十的分量

变成零

那我们的图像就几乎全都变黑了

那这个传输这是没有效果的

那这时候这是因为我们灰度图像它在标准基下对应的

像素灰度向量

它没有充分的利用

图像像素灰度值的一个规律

图像压缩我们想要去做换基底

我们先举例子

假设取一个低维数的

我们取n等于4

在C＾4里头来看

我们来看所谓的小波基

小波基是这样的四个向量

w_1它的四个分量都是1

w_2前两个分量是1

后两个分量是-1

w_3是前两个分量是1 -1

后两个分量是0 0

而w_4前两个分量是0 0

后两个分量是1 -1

我们注意到这四个向量相互正交

用标准内积对应分量相乘再相加

这样的内积去看

它们是相互正交的

并且w_1的模长平方等于4

w_2的模长平方等于4

w_3的模长平方等于2

w_4的模长平方也2

而刚才说的正交

以及它们长度的这个性质

可以用W＾T乘以W来表示

这时候W是以w_1 w_2 w_3 w_4

作为列向量所构成的一个矩阵

W＾T乘以W

就得到一个对角矩阵

因为这些个W相互是正交的

所以是一个对角矩阵

在对角线上的元素

是它们的模长平方

也就是4 4 2 2

好从这个关系式里头

很容易可以得到

W这个矩阵的逆矩阵

是等于对角矩阵1/4 1/4

1/2 1/2去乘以W的转置的

那我们再来看一组著名的基底

就是Fourier基

它的第一个基向量

和刚才第一个基向量相同

四个分量都取成1

而第二个向量呢

它是1 i i＾2 i＾3

这个i就是我们的√-1

是1 i＾2 i＾2＾2

也就是i＾4

i＾2＾3也就是i＾6（）

是1 i＾3 i＾6 i＾9

我们注意到说把𝜉_1,𝜉_2,𝜉_3,𝜉_4

作为列向量构成这个矩阵

我们比如叫F的话

那么这是一个对称矩阵

并且F的共轭

也就是在这个矩阵里头

每一个分量取它的共轭

共轭转置乘以F等于F的共轭

因为F的转置等于它自己

乘以F等于4倍的单位阵

那由此我们可以得到

F这个矩阵的逆矩阵

是1/4去乘以F的共轭

对这个矩阵

也容易求出它的逆矩阵来

这是在n等于4的情况的Fourier基

那对于一般维数的Fourier基呢

这样的一个矩阵的列向量

它的第一列

所有的分量都是1

第二列是1,𝝎,𝝎＾2,.., 𝝎＾{n-1}

第三列是1,𝝎＾2 𝝎＾4, …, 𝝎＾

｛2（n-1）｝

最后一列是1,𝝎＾{n-1}, …, 𝝎＾

｛2（n-1）｝

一直到𝝎＾｛（n-1）＾2｝

那么其中的𝝎

是n次本元单位根 e^｛2πi/n}

那么这个矩阵它的列向量

是长在C＾n里头

那么它满足刚才的性质

F的逆矩阵等于1/n F的共轭

它的列向量是所谓的Fourier基

那么为什么我们要取

这样的基底呢

比如说我们要传输的这张图像

它所有像素点的灰度值都一样

或者是基本上一样

是一张纯色的图片

那么我们这个向量就表示成

是(1,1,…,1)这个基向量去乘以x

这个x来表示它的灰度值

那么我们由x_1去乘以w_1

就能够完成给出这个图像的信息

那又比如我们让图像

它相邻的像素点的灰度值

持续的变化

这张图像的像素的灰度值

就可以写成a -a a -a这种样子

那你这个向量X

它就可以写成是a

去乘以1 -1 1 -1

那1 -1 1 -1这个向量

出现在Fourier基的第三个 ξ_3

在小波基里呢

它可以写成是w_3+w_4

我们就用这样的基底

它前面的一个坐标

就表述出这张图像的信息

那我们压缩的时候

把其他的分量给扔掉

我们仍然能够得到

这张图片的绝大多数的信息

而我们常用的图像压缩的方法

JPEG格式呢

它本质上就是基变换

它把原来的标准基变成Fourier基

那么基本原理是这样

假设我们要传输的这张图片

它的灰度值对应出来这个向量

我们叫做输入信号

我们叫做x

往往这个x用标准基

它可以写成x_1e_1一直加到x_n e_n

那么我们把标准基来换一下

做一下基变换

我们换成Fourier基

或者是换成是小波基

或者是换成另外一组基

那么我们来换基底

把标准基换成一组新的基

那在新的基下

这个x它有坐标c

这个c是什么呢

这个c我们先来看一下

x它可以表示成新基底

w_1 w_2 … w_n的线性组合

组合的系数c_1 c_2 … c_n

构成一个向量

这个向量就叫做x

在新基W下的坐标

那么用矩阵形式来写呢

它可以写成w_1,w_2, …, w_n

去乘以c_1, c_2, …, c_n

那其中呢w_1, w_2,…, w_n作为列向量

构成一个矩阵

我们叫它是W矩阵

去乘以c这个向量

然后c就等于W^{-1}去乘以x

如果我们给的这组基好

它的W^{-1}很容易求

那么这个计算坐标呢

就会计算的很快

这样得出来了在新基底下的坐标

我们想要进行压缩

也就是说

我们想要扔掉一些小系数

比如一张纯色的图像

它那个基向量

(1,1, … ,1)的系数就比较大

这个不能被扔掉

那么(1, -1,1,-1,…)这种

这种系数可能就比较小

我们把它给变成是0

这时候就是说把c变成ĉ

扔掉一些比较小的系数

这时候ĉ中的这个

非零的分量就很少

我们由原来的N项

可能变成了n项

它的压缩比就是N/n

好我们把ĉ去进行传输

完了之后呢

我们要重新建立出这个信号来

我们用ĉ_i去乘以w_i

恢复这个x^

那用矩阵形式写

是由w_1到w_n去构成的这个矩阵

W去乘以新的坐标ĉ

所以从x到c到再ĉ再到x^的

这个过程是我们换基底

压缩再重建的这样一个过程

那在这个过程里头

我们很关键的一步是要换好基底

作基变换

所谓的好基底我们来看

这时候

我们是要求W^{-1}很容易计算

要求说你换的这个基底

从c到ĉ我们保留的分量要少

这样我们传出的效率才高

保留的分量少

但是

它又能够包含图像的信息要多

这样的基底才是好基底

我们刚才的Fourier基也好

小波基也好

它能够快速地计算一个基矩阵W的逆

它满足这个求逆要快

又因为它们取基的向量的时候

它考虑到了图像分布的特点

比如说我有(1, … ,1)这样的向量

来充当基向量

我有(1, -1,…)这种向量

来充当基向量

那么从c到ĉ

扔掉分量的这个过程中

我能够找到包含信息足够多

但是

保留分量又足够少的这种ĉ

这样的好基底

那本质上我们做的是基变换

线性代数(2)课程列表：

第一讲：正定矩阵

-1.1 实对称矩阵A正定的充要条件

-1.2 典型例题

-1.3 半正定矩阵及其判别条件

-1.4 二次型

-1.5* 有心二次曲线(central conic)

--1.5* 有心二次曲线(central conic)

-1.6* 三维空间中的二次曲面-6类基本的二次曲面

--1.6* 三维空间中的二次曲面-6类基本的二次曲面

-1.7 二次型的分类

--1.7 二次型的分类

-1.8 矩阵的合同

--1.8 矩阵的合同

-1.9* 惯性定理的证明

--1.9* 惯性定理的证明

-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号

-1.11* 正（负）定矩阵在函数极值问题中的应用

--1.11* 正（负）定矩阵在函数极值问题中的应用

-第一讲讲义

-第一讲：正定矩阵--课后习题

第二讲：相似矩阵

-2.1 引言

-2.2 相似矩阵的性质

-2.3 Jordan标准形

-2.4 定理的证明

-2.5 Jordan标准形的应用

-第二讲：相似矩阵--课后习题

第三讲：奇异值分解

-3.1 引言

--3.1 引言

-3.2 奇异值分解(Singular Value Decomposition)

--3.2 奇异值分解(Singular Value Decomposition)

-3.3 例题

--3.3 例题

-3.4 奇异值分解的应用

--3.4 奇异值分解的应用

-第三讲讲义

-第三讲：奇异值分解--课后习题

第四讲：线性变换 I

-4.1 线性变换的定义和性质

-4.2 线性变换的运算

-4.3 线性变换的矩阵表示

-4.4 线性变换与矩阵之间的关系

-第四讲：线性变换 I--课后习题

第五讲：线性变换 II

-5.1 恒同变换与基变换

-5.2 图像压缩——基变换的应用

-5.3 线性变换在不同基下的矩阵

-5.4 矩阵分解与基变换

-5.5 线性变换的核与像

-5.6 不变子空间

-5.7* 幂零变换

-5.8* Jordan标准形

-第五讲：线性变换 II--课后习题

第六讲：伪逆

-6.1 伪逆

--6.1 伪逆

-6.2 Moore – Penrose 伪逆

--6.2 Moore – Penrose 伪逆

-6.3 最小二乘法

--6.3 最小二乘法

-第六讲讲义

-第六讲：伪逆--课后习题

第七讲：工程中的矩阵

-7.1 简介

-7.2 弹簧模型

-7.3 变量的线性关系

-7.4 刚度矩阵

-7.5 从离散到连续

-第七讲：工程中的矩阵--课后习题

第八讲：图与网络

-8.1 简介

--8.1 简介

-8.2 图和矩阵

--8.2 图和矩阵

-8.3 网络和加权Laplacian矩阵

--8.3 网络和加权Laplacian矩阵

-8.4 关联矩阵的四个基本子空间

--8.4 关联矩阵的四个基本子空间

-8.5 注记

--8.5 注记

-第八讲讲义

-第八讲：图与网络--课后习题

第九讲：Markov矩阵和正矩阵

-9.1 问题引入

-9.2 Markov矩阵

-9.3 正Markov矩阵

-9.4 正矩阵

-第九讲：Markov矩阵和正矩阵--课后习题

第十讲：Fourier级数

-10.1 引言

-10.2 内积空间

-10.3 傅里叶级数

-10.4 投影

-10.5 关于Fourier变换的注记

--10.5 关于Fourier变换的注记

-第十讲讲义

-第十讲：Fourier级数--课后习题

第十一讲：计算机图像

-11.1 引言

-11.2 平移

-11.3 伸缩

-11.4 旋转

-11.5 投影和反射

-第十一讲：计算机图像--课后习题

第十二讲：复数与复矩阵

-12.1 引言

-12.2 复矩阵

-12.3 复正规阵

-12.4 离散Fourier变换

-12.5 快速Fourier变换

-第十二讲：复数与复矩阵--课后习题

结课寄语

-结课寄语

--结课寄语

5.2 图像压缩——基变换的应用在线视频