当前课程知识点:多媒体技术基础 > 第五章 音频数据的压缩编码 > 5.1 概述 > 5.1 概述
同学们好
欢迎大家学习多媒体技术基础课程
这一章
我们学习音频数据的压缩编码
音频数据的压缩编码
这样一个问题可以描述为
在编码质量
编码延时
以及算法复杂度一定的前提下
如何降低音频数据的数据量
或者反过来说
在给定码率的情况下
如何减小编码的延时
以及算法的复杂度
并且尽量提高重建音频的质量
那么我们先进行概述
对音频信号来说
那么我们可以进行分类
简单的可以分成语音信号
和一般的声音信号
那么语音信号指的就是
我们人的说话的声音
一般的信号
包括音乐效果声等等
那么对于音频进行压缩编码
针对于不同类型的音频信号
可能有相应不同的
压缩编码的技术
那么音频信号
我们在压缩的时候
基于的依据有哪些
我们做一个简单的概括
首先音频信号中
包含有大量的时域冗余
和频域冗余
那么我们知道对于数据来说
如果包含冗余信息
我们就可以通过去除冗余
来实现对数据的压缩
对音频信号也是一样
由于包含大量的时域和频域冗余
所以说可以通过去除这些类型的冗余
实现对音频数据的压缩
另外
我们人的耳朵
对不同频率的声音的敏感程度
是不一样的
那么有些频率成分
我们人的耳朵是感受不到的
所以我们可以通过
去除这些不敏感的信息
来实现对音频的压缩
另外
在音频信号采样的过程中
采样点之间具有很高的相关性
那么有相关性
就是有冗余存在
我们可以通过去除相关
来实现对音频的压缩
所以说
我们在对音频压缩编码的时候
可以通过我们刚才所介绍的
这些方面
来实现对音频的压缩
后面我们所介绍的很多的技术
都是通过去除
刚才我们所说的
这些方面的内容
那么来实现对音频的压缩
音频压缩编码的方法
我们来看一下有哪些
那么对于音频压缩编码的方法
我们可以从不同的角度
对它进行一个分类
那么如果从编码速度来看的话
编码方法可以分为高速的
中高速的
中速的
低速的和极低速的
那么一般我们的语音信号的压缩编码
是处于中速和低速之间
那么如果按编码所在的域来分
音频压缩编码
又分为时域的编码方法
和频域的编码方法
那么时域编码方法
最典型的代表就是
Pcm编码和ADpcm编码
频域的压缩编码方法
像变换编码
子带编码
都是属于频域的编码方法
那么我们还可以按编码方法来划分
可以分为波形编码
参数编码和混合编码
那么所谓的波形编码
它是根据语音信号的波形
导出相应的数字编码形式
那么这一类的方法
力求使重建的语音信号波形
与输入的语音信号波形相同
那么最典型的像Dpcm编码
Ad pcm编码
都是属于这一类的
波形编码的编码方法
那么这一类编码方法
它的优点是
实现简单
在码率相对比较高的前提下
音频的解码质量很高
但是它最大的缺点
就是压缩效率不高
这是波形编码
另外一类编码方法
参数编码
那么参数编码
我们也把它称为声源编码
或者叫声码器
这一类编码算法
是通过对语音信号
特征参数进行提取
并且对参数进行编码
它目标是使重建的语音信号
具有尽可能高的可懂度
但是不要求
重建语音信号的波形
跟原始语音信号波形一致
那么这一类编码的典型代表
像线性预测编码器
那么参数编码的编码算法的优点
就是压缩效率高
这一点相对于波形编码来说
那么它能够
对音频信号
实现很高的压缩率
它的最大的缺点就是
音频的保真度比较低
所以说我们一般这一类的应用
都是用在对音频保真
要求不是很高的
这种场合
那么对于波形编码
和参数编码来说
它们两者各有优缺点
所以就有了第三种
音频编码的混合编码方法
那么这种编码方法
它是吸取了波形编码
和参数编码优点的
一种综合的编码算法
这一类编码算法
既保证了语音的音色
又具有较高的压缩效率
典型的代表
像码本激励线性预测编码
就是属于混合类型的
压缩编码算法
在现代的音频压缩编码标准中
基本上都采用的是混合的压缩
编码技术
我们在后面的内容中
会对这些方法做相应的介绍
音频信号的数字化
对于信号进行
数字化
包含两个主要的环节
一个是采样
一个是量化编码
那么对于音频信号也是一样
首先要进行采样
然后进行量化编码
那么对于音频信号的采样
采样率的设定
根据不同的应用
那么进行不同的选择
我们常用的取样频率
可以从8K一直到192K
针对着不同的应用
我们选用不同频率
来进行音频信号的采样
比方说
是对于语音信号
那么它的带宽
基本上在4K以内
内所以说我们在采样的时候
通常选用8K的采样率
那么对于像高保真一类的音频信号
而它的带宽在20K以内
那么我们的采样率
一般是选择44.1K以上
像cd音质的音频信号
我们在编码的时候
就采用的是44.1K那么更
高质量的音频信号
我们会采用更高的采样频率
那么对于音频信号的量化编码
我们一般采用每个样值
8~24个比特
来进行量化编码
那么每个样值的
比特数越高
我们最终形成的
音频数字信号的码率就会越高
比方说
我们对于5.1声道的环绕立体声
进行48K采样频率的采样
每个样点16比特
进行量化编码的话
那么最终我们形成的
数字的音频的码率
就是4.608兆比特每秒
下面我们来看一下
声音质量的分级
以及对应的数据率
那么对于声音信号
可以分成5个质量等级
包括电话
条幅
调频cd和DAT
那么每一种质量等级
对应所涉及到的声音信号的频率
从低到高
那么我们的采样率
也是从低到高
最终形成的数字音频的数据率
也是从64K到1536K
OK
-1.1 概述
--1.1 概述
-第一章 作业
--第一章 作业
-2.1 光和彩色
--2.1 光和彩色
-2.2 视觉特性
--2.2 视觉特性
-2.3 扫描
--2.3 扫描
-2.4 模拟彩色电视信号
-2.5 数字电视信号
-第二章 作业
--第二章 作业
-3.1 信息熵理论
-3.2 率失真理论
-3.3 预测编码
--3.3 预测编码
-3.4 序列图像中运动矢量的估计
-3.5 具有运动补偿的帧间预测
-3.6 正交变换编码
-3.7 子带编码
--3.7 子带编码
-3.8 量化编码
--3.8 量化编码
-3.9 熵编码
--3.9 熵编码
-第三章 作业
--第三章 作业
-4.1 基于帧的视频编码
-4.2 视频压缩编码国际标准
-4.3 H.264/AVC
-4.4 H.265/HEVC
-4.5 基于率失真优化的编码模式选择
-4.6 恒定速率编码器的速率控制
-4.7 压缩编码算法性能的评价
-第四章 作业
--第四章 作业
-5.1 概述
--5.1 概述
-5.2 人的听觉特性
-5.3 音频信号编码方法
-第五章 作业
--第五章 作业
-6.1 多媒体传输对网络的要求
-6.2 网络对多媒体信息传输的支持
-第六章 作业
--第六章 作业
-7.1 多媒体数据及其时域特征的表示
-7.2 分布式多媒体系统中的同步
-7.3 连续媒体同步的基本方法
-7.4 广播应用的传输层协议
-7.5 宽带应用的传输层协议
-第七章 作业
--第七章 作业