当前课程知识点:线性代数(2) > 第五讲:线性变换 II > 5.2 图像压缩——基变换的应用 > 5.2 图像压缩——基变换的应用
通讯卫星
互联网络的图像传输
需要处理大量的数据
所以我们需要进行压缩
比如说一张静止的灰度图像
它含有大量的小方块的
这种图像单元
也就是所谓的像素
那每个像素被赋予
从0到255的一个数
其中这个0表示的是黑色
255表示的白色
那么于是一张
比如说
256×256的像素的一个灰度图像
它对应的是一个
256^2维的向量x
那么这时候x写成
x_1 e_1+x_2 e_2+…+x_n e_n
的一个线性组合
其中e_1,e_2,…,e_n是我们所在的
向量空间中的标准基底
我们把这个向量空间取成C^n
那么是说允许之后
我们的每个分量
可以取复数
注意到
这样的一个高维的向量x
我们要传输起来很麻烦
我们想要进行压缩
压缩的本质上是说
我扔掉一些个分量
那么对于这样表示出来的一个x
比如说
我们扔掉百分之九十的分量
也就是说把这些分量
给记成是零的话
那我们需要传输的分量的像素
就变少了
我们可以有效地去传输
但是问题在于
这样如果百分之九十的分量
变成零
那我们的图像就几乎全都变黑了
那这个传输这是没有效果的
那这时候这是因为我们灰度图像它在标准基下对应的
像素灰度向量
它没有充分的利用
图像像素灰度值的一个规律
图像压缩我们想要去做换基底
我们先举例子
假设取一个低维数的
我们取n等于4
在C^4里头来看
我们来看所谓的小波基
小波基是这样的四个向量
w_1它的四个分量都是1
w_2前两个分量是1
后两个分量是-1
w_3是前两个分量是1 -1
后两个分量是0 0
而w_4前两个分量是0 0
后两个分量是1 -1
我们注意到这四个向量相互正交
用标准内积对应分量相乘再相加
这样的内积去看
它们是相互正交的
并且w_1的模长平方等于4
w_2的模长平方等于4
w_3的模长平方等于2
w_4的模长平方也2
而刚才说的正交
以及它们长度的这个性质
可以用W^T乘以W来表示
这时候W是以w_1 w_2 w_3 w_4
作为列向量所构成的一个矩阵
W^T乘以W
就得到一个对角矩阵
因为这些个W相互是正交的
所以是一个对角矩阵
在对角线上的元素
是它们的模长平方
也就是4 4 2 2
好 从这个关系式里头
很容易可以得到
W这个矩阵的逆矩阵
是等于对角矩阵1/4 1/4
1/2 1/2去乘以W的转置的
那我们再来看一组著名的基底
就是Fourier基
它的第一个基向量
和刚才第一个基向量相同
四个分量都取成1
而第二个向量呢
它是1 i i^2 i^3
这个i就是我们的√-1
是1 i^2 i^2^2
也就是i^4
i^2^3也就是i^6()
是1 i^3 i^6 i^9
我们注意到说把𝜉_1,𝜉_2,𝜉_3,𝜉_4
作为列向量构成这个矩阵
我们比如叫F的话
那么这是一个对称矩阵
并且F的共轭
也就是在这个矩阵里头
每一个分量取它的共轭
共轭转置乘以F等于F的共轭
因为F的转置等于它自己
乘以F等于4倍的单位阵
那由此我们可以得到
F这个矩阵的逆矩阵
是1/4去乘以F的共轭
对这个矩阵
也容易求出它的逆矩阵来
这是在n等于4的情况的Fourier基
那对于一般维数的Fourier基呢
这样的一个矩阵的列向量
它的第一列
所有的分量都是1
第二列是1,𝝎,𝝎^2,.., 𝝎^{n-1}
第三列是1,𝝎^2 𝝎^4, …, 𝝎^
{2(n-1)}
最后一列是1,𝝎^{n-1}, …, 𝝎^
{2(n-1)}
一直到𝝎^{(n-1)^2}
那么其中的𝝎
是n次本元单位根 e^{2πi/n}
那么这个矩阵它的列向量
是长在C^n里头
那么它满足刚才的性质
F的逆矩阵等于1/n F的共轭
它的列向量是所谓的Fourier基
那么为什么我们要取
这样的基底呢
比如说我们要传输的这张图像
它所有像素点的灰度值都一样
或者是基本上一样
是一张纯色的图片
那么我们这个向量就表示成
是(1,1,…,1)这个基向量去乘以x
这个x来表示它的灰度值
那么我们由x_1去乘以w_1
就能够完成给出这个图像的信息
那又比如我们让图像
它相邻的像素点的灰度值
持续的变化
这张图像的像素的灰度值
就可以写成a -a a -a这种样子
那你这个向量X
它就可以写成是a
去乘以1 -1 1 -1
那1 -1 1 -1这个向量
出现在Fourier基的第三个 ξ_3
在小波基里呢
它可以写成是w_3+w_4
我们就用这样的基底
它前面的一个坐标
就表述出这张图像的信息
那我们压缩的时候
把其他的分量给扔掉
我们仍然能够得到
这张图片的绝大多数的信息
而我们常用的图像压缩的方法
JPEG格式呢
它本质上就是基变换
它把原来的标准基变成Fourier基
那么基本原理是这样
假设我们要传输的这张图片
它的灰度值对应出来这个向量
我们叫做输入信号
我们叫做x
往往这个x用标准基
它可以写成x_1e_1一直加到x_n e_n
那么我们把标准基来换一下
做一下基变换
我们换成Fourier基
或者是换成是小波基
或者是换成另外一组基
那么我们来换基底
把标准基换成一组新的基
那在新的基下
这个x它有坐标c
这个c是什么呢
这个c我们先来看一下
x它可以表示成新基底
w_1 w_2 … w_n的线性组合
组合的系数c_1 c_2 … c_n
构成一个向量
这个向量就叫做x
在新基W下的坐标
那么用矩阵形式来写呢
它可以写成w_1,w_2, …, w_n
去乘以c_1, c_2, …, c_n
那其中呢w_1, w_2,…, w_n作为列向量
构成一个矩阵
我们叫它是W矩阵
去乘以c这个向量
然后c就等于W^{-1}去乘以x
如果我们给的这组基好
它的W^{-1}很容易求
那么这个计算坐标呢
就会计算的很快
这样得出来了在新基底下的坐标
我们想要进行压缩
也就是说
我们想要扔掉一些小系数
比如一张纯色的图像
它那个基向量
(1,1, … ,1)的系数就比较大
这个不能被扔掉
那么(1, -1,1,-1,…)这种
这种系数可能就比较小
我们把它给变成是0
这时候就是说把c变成ĉ
扔掉一些比较小的系数
这时候ĉ中的这个
非零的分量就很少
我们由原来的N项
可能变成了n项
它的压缩比就是N/n
好我们把ĉ去进行传输
完了之后呢
我们要重新建立出这个信号来
我们用ĉ_i去乘以w_i
恢复这个x^
那用矩阵形式写
是由w_1到w_n去构成的这个矩阵
W去乘以新的坐标ĉ
所以从x到c到再ĉ再到x^的
这个过程是我们换基底
压缩 再重建的这样一个过程
那在这个过程里头
我们很关键的一步是要换好基底
作基变换
所谓的好基底我们来看
这时候
我们是要求W^{-1}很容易计算
要求说你换的这个基底
从c到ĉ我们保留的分量要少
这样我们传出的效率才高
保留的分量少
但是
它又能够包含图像的信息要多
这样的基底才是好基底
我们刚才的Fourier基也好
小波基也好
它能够快速地计算一个基矩阵W的逆
它满足这个求逆要快
又因为它们取基的向量的时候
它考虑到了图像分布的特点
比如说我有(1, … ,1)这样的向量
来充当基向量
我有(1, -1,…)这种向量
来充当基向量
那么从c到ĉ
扔掉分量的这个过程中
我能够找到包含信息足够多
但是
保留分量又足够少的这种ĉ
这样的好基底
那本质上我们做的是基变换
-1.1 实对称矩阵A正定的充要条件
-1.2 典型例题
--1.2 典型例题
-1.3 半正定矩阵及其判别条件
-1.4 二次型
--1.4 二次型
-1.5* 有心二次曲线(central conic)
-1.6* 三维空间中的二次曲面-6类基本的二次曲面
-1.7 二次型的分类
-1.8 矩阵的合同
-1.9* 惯性定理的证明
-1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
--1.10 惯性定理的应用 —— 实对称矩阵的特征值与主元符号
-1.11* 正(负)定矩阵在函数极值问题中的应用
-第一讲:正定矩阵--课后习题
-2.1 引言
--2.1 引言
-2.2 相似矩阵的性质
-2.3 Jordan标准形
-2.4 定理的证明
-2.5 Jordan标准形的应用
-第二讲:相似矩阵--课后习题
-3.1 引言
--3.1 引言
-3.2 奇异值分解(Singular Value Decomposition)
--3.2 奇异值分解(Singular Value Decomposition)
-3.3 例题
--3.3 例题
-3.4 奇异值分解的应用
-第三讲:奇异值分解--课后习题
-4.1 线性变换的定义和性质
-4.2 线性变换的运算
-4.3 线性变换的矩阵表示
-4.4 线性变换与矩阵之间的关系
-第四讲:线性变换 I--课后习题
-5.1 恒同变换与基变换
-5.2 图像压缩——基变换的应用
-5.3 线性变换在不同基下的矩阵
-5.4 矩阵分解与基变换
-5.5 线性变换的核与像
-5.6 不变子空间
-5.7* 幂零变换
-5.8* Jordan标准形
-第五讲:线性变换 II--课后习题
-6.1 伪逆
--6.1 伪逆
-6.2 Moore – Penrose 伪逆
-6.3 最小二乘法
-第六讲:伪逆--课后习题
-7.1 简介
--7.1 简介
-7.2 弹簧模型
--7.2 弹簧模型
-7.3 变量的线性关系
-7.4 刚度矩阵
--7.4 刚度矩阵
-7.5 从离散到连续
-第七讲:工程中的矩阵--课后习题
-8.1 简介
--8.1 简介
-8.2 图和矩阵
--8.2 图和矩阵
-8.3 网络和加权Laplacian矩阵
-8.4 关联矩阵的四个基本子空间
-8.5 注记
--8.5 注记
-第八讲:图与网络--课后习题
-9.1 问题引入
--9.1 问题引入
-9.2 Markov矩阵
-9.3 正Markov矩阵
-9.4 正矩阵
-第九讲:Markov矩阵和正矩阵--课后习题
-10.1 引言
--10.1 引言
-10.2 内积空间
-10.3 傅里叶级数
-10.4 投影
--10.4 投影
-10.5 关于Fourier变换的注记
-第十讲:Fourier级数--课后习题
-11.1 引言
--11.1 引言
-11.2 平移
--11.2 平移
-11.3 伸缩
--11.3 伸缩
-11.4 旋转
--11.4 旋转
-11.5 投影和反射
-第十一讲:计算机图像--课后习题
-12.1 引言
--12.1 引言
-12.2 复矩阵
--12.2 复矩阵
-12.3 复正规阵
-12.4 离散Fourier变换
-12.5 快速Fourier变换
-第十二讲:复数与复矩阵--课后习题
-结课寄语
--结课寄语