当前课程知识点:多媒体技术基础 >  第五章 音频数据的压缩编码 >  5.1 概述 >  5.1 概述

返回《多媒体技术基础》慕课在线视频课程列表

5.1 概述在线视频

下一节:5.2 人的听觉特性

返回《多媒体技术基础》慕课在线视频列表

5.1 概述课程教案、知识点、字幕

同学们好

欢迎大家学习多媒体技术基础课程

这一章

我们学习音频数据的压缩编码

音频数据的压缩编码

这样一个问题可以描述为

在编码质量

编码延时

以及算法复杂度一定的前提下

如何降低音频数据的数据量

或者反过来说

在给定码率的情况下

如何减小编码的延时

以及算法的复杂度

并且尽量提高重建音频的质量

那么我们先进行概述

对音频信号来说

那么我们可以进行分类

简单的可以分成语音信号

和一般的声音信号

那么语音信号指的就是

我们人的说话的声音

一般的信号

包括音乐效果声等等

那么对于音频进行压缩编码

针对于不同类型的音频信号

可能有相应不同的

压缩编码的技术

那么音频信号

我们在压缩的时候

基于的依据有哪些

我们做一个简单的概括

首先音频信号中

包含有大量的时域冗余

和频域冗余

那么我们知道对于数据来说

如果包含冗余信息

我们就可以通过去除冗余

来实现对数据的压缩

对音频信号也是一样

由于包含大量的时域和频域冗余

所以说可以通过去除这些类型的冗余

实现对音频数据的压缩

另外

我们人的耳朵

对不同频率的声音的敏感程度

是不一样的

那么有些频率成分

我们人的耳朵是感受不到的

所以我们可以通过

去除这些不敏感的信息

来实现对音频的压缩

另外

在音频信号采样的过程中

采样点之间具有很高的相关性

那么有相关性

就是有冗余存在

我们可以通过去除相关

来实现对音频的压缩

所以说

我们在对音频压缩编码的时候

可以通过我们刚才所介绍的

这些方面

来实现对音频的压缩

后面我们所介绍的很多的技术

都是通过去除

刚才我们所说的

这些方面的内容

那么来实现对音频的压缩

音频压缩编码的方法

我们来看一下有哪些

那么对于音频压缩编码的方法

我们可以从不同的角度

对它进行一个分类

那么如果从编码速度来看的话

编码方法可以分为高速的

中高速的

中速的

低速的和极低速的

那么一般我们的语音信号的压缩编码

是处于中速和低速之间

那么如果按编码所在的域来分

音频压缩编码

又分为时域的编码方法

和频域的编码方法

那么时域编码方法

最典型的代表就是

Pcm编码和ADpcm编码

频域的压缩编码方法

像变换编码

子带编码

都是属于频域的编码方法

那么我们还可以按编码方法来划分

可以分为波形编码

参数编码和混合编码

那么所谓的波形编码

它是根据语音信号的波形

导出相应的数字编码形式

那么这一类的方法

力求使重建的语音信号波形

与输入的语音信号波形相同

那么最典型的像Dpcm编码

Ad pcm编码

都是属于这一类的

波形编码的编码方法

那么这一类编码方法

它的优点是

实现简单

在码率相对比较高的前提下

音频的解码质量很高

但是它最大的缺点

就是压缩效率不高

这是波形编码

另外一类编码方法

参数编码

那么参数编码

我们也把它称为声源编码

或者叫声码器

这一类编码算法

是通过对语音信号

特征参数进行提取

并且对参数进行编码

它目标是使重建的语音信号

具有尽可能高的可懂度

但是不要求

重建语音信号的波形

跟原始语音信号波形一致

那么这一类编码的典型代表

像线性预测编码器

那么参数编码的编码算法的优点

就是压缩效率高

这一点相对于波形编码来说

那么它能够

对音频信号

实现很高的压缩率

它的最大的缺点就是

音频的保真度比较低

所以说我们一般这一类的应用

都是用在对音频保真

要求不是很高的

这种场合

那么对于波形编码

和参数编码来说

它们两者各有优缺点

所以就有了第三种

音频编码的混合编码方法

那么这种编码方法

它是吸取了波形编码

和参数编码优点的

一种综合的编码算法

这一类编码算法

既保证了语音的音色

又具有较高的压缩效率

典型的代表

像码本激励线性预测编码

就是属于混合类型的

压缩编码算法

在现代的音频压缩编码标准中

基本上都采用的是混合的压缩

编码技术

我们在后面的内容中

会对这些方法做相应的介绍

音频信号的数字化

对于信号进行

数字化

包含两个主要的环节

一个是采样

一个是量化编码

那么对于音频信号也是一样

首先要进行采样

然后进行量化编码

那么对于音频信号的采样

采样率的设定

根据不同的应用

那么进行不同的选择

我们常用的取样频率

可以从8K一直到192K

针对着不同的应用

我们选用不同频率

来进行音频信号的采样

比方说

是对于语音信号

那么它的带宽

基本上在4K以内

内所以说我们在采样的时候

通常选用8K的采样率

那么对于像高保真一类的音频信号

而它的带宽在20K以内

那么我们的采样率

一般是选择44.1K以上

像cd音质的音频信号

我们在编码的时候

就采用的是44.1K那么更

高质量的音频信号

我们会采用更高的采样频率

那么对于音频信号的量化编码

我们一般采用每个样值

8~24个比特

来进行量化编码

那么每个样值的

比特数越高

我们最终形成的

音频数字信号的码率就会越高

比方说

我们对于5.1声道的环绕立体声

进行48K采样频率的采样

每个样点16比特

进行量化编码的话

那么最终我们形成的

数字的音频的码率

就是4.608兆比特每秒

下面我们来看一下

声音质量的分级

以及对应的数据率

那么对于声音信号

可以分成5个质量等级

包括电话

条幅

调频cd和DAT

那么每一种质量等级

对应所涉及到的声音信号的频率

从低到高

那么我们的采样率

也是从低到高

最终形成的数字音频的数据率

也是从64K到1536K

OK

多媒体技术基础课程列表:

第一章 概述

-1.1 概述

--1.1 概述

-第一章 作业

--第一章 作业

第二章 视觉特性和视频基础

-2.1 光和彩色

--2.1 光和彩色

-2.2 视觉特性

--2.2 视觉特性

-2.3 扫描

--2.3 扫描

-2.4 模拟彩色电视信号

--2.4 模拟彩色电视信号

-2.5 数字电视信号

--2.5 数字电视信号

-第二章 作业

--第二章 作业

第三章 数据压缩的基本技术

-3.1 信息熵理论

--3.1 信息熵理论

-3.2 率失真理论

--3.2 率失真理论

-3.3 预测编码

--3.3 预测编码

-3.4 序列图像中运动矢量的估计

--3.4 序列图像中运动矢量的估计

-3.5 具有运动补偿的帧间预测

--3.5 具有运动补偿的帧间预测

-3.6 正交变换编码

--3.6 正交变换编码

-3.7 子带编码

--3.7 子带编码

-3.8 量化编码

--3.8 量化编码

-3.9 熵编码

--3.9 熵编码

-第三章 作业

--第三章 作业

第四章 视频数据的压缩编码

-4.1 基于帧的视频编码

--4.1 基于帧的视频编码

-4.2 视频压缩编码国际标准

--4.2 视频压缩编码国际标准

-4.3 H.264/AVC

--4.3 H.264/AVC

-4.4 H.265/HEVC

--4.4 H.265/HEVC

-4.5 基于率失真优化的编码模式选择

--4.5 基于率失真优化的编码模式选择

-4.6 恒定速率编码器的速率控制

--4.6 恒定速率编码器的速率控制

-4.7 压缩编码算法性能的评价

--4.7 压缩编码算法性能的评价

-第四章 作业

--第四章 作业

第五章 音频数据的压缩编码

-5.1 概述

--5.1 概述

-5.2 人的听觉特性

--5.2 人的听觉特性

-5.3 音频信号编码方法

--5.3 音频信号编码方法

-第五章 作业

--第五章 作业

第六章 多媒体传输网络

-6.1 多媒体传输对网络的要求

--6.1 多媒体传输对网络的要求

-6.2 网络对多媒体信息传输的支持

--6.2 网络对多媒体信息传输的支持

-第六章 作业

--第六章 作业

第七章 多媒体同步与数据封装

-7.1 多媒体数据及其时域特征的表示

--7.1 多媒体数据及其时域特征的表示

-7.2 分布式多媒体系统中的同步

--7.2 分布式多媒体系统中的同步

-7.3 连续媒体同步的基本方法

--7.3 连续媒体同步的基本方法

-7.4 广播应用的传输层协议

--7.4 广播应用的传输层协议

-7.5 宽带应用的传输层协议

--7.5 宽带应用的传输层协议

-第七章 作业

--第七章 作业

5.1 概述笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。