当前课程知识点:影视广告设计 >  Ch03 音频基础 >  Ex03 音频基础(实验) >  Ex0303 音频文件数字资产管理

返回《影视广告设计》慕课在线视频课程列表

Ex0303 音频文件数字资产管理资料文件与下载

Ex0303 音频文件数字资产管理


音频文件数字资产管理


1 基本理论

1.1 声音的本质

案例1:

智能手机音质测评报告

vivo x6 player vivo x9 iphone7 plus


案例2:

录音笔测评报告

ls100


案例3:

使用matlabs记录声音信号

正弦波

clear all;
close all;
t=-8:0.01:8;
y=sinc(t);
figure;
plot(t,y);
set(gcf,'position',[200,200,400,300]);

声音的本质

声音的属性包括:幅度(amplitude,用db计量)、频率(frequence,用hz计量)、波长(wavelength,用三角函数计量)、响度(intensity)、速度(speed)等。

1.2 音频信号数字化

1.2.1 基本流程


麦克风将模拟信号记录下来,通过模拟-数字(AD)转化器变成数字信号储存为不同的格式,最后通过数字-模拟信号将数字信号播放出来。


1.2.2 奈奎斯特定理:

案例:

采样率增加/减少对音频质量的影响

(软件演示 : matlab)


随着PCM数字技术的发展,PCM采样已经从当初的CD标准(16BIT/44.1KHZ)发展到了如今数字母带标准(32BIT/384KHZ)。上图中的前半部分竖线表达了采样频率越高,采样间隔时间就越短,所获得的的声音就更加细腻流畅。后半部分的横线则表达了位深越大(比如24BIT),单位数据内可供描述声音信息的空间就越宽(信息量越大),则声音的精度就越好。


定律:

当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max>=2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。


1.2.3 常用音频采样率与量化位数

案例:

不同采样率音频文件的混音

(使用软件:saw studio)


讨论:

采用更高采样率录制或保存音频有无必要?

采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?

假设我们有2段正弦波信 号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,

分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的 结果呢?结果是:20Hz的信号每次振动被采样了

40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信 息远比高频的详细。

这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。

要较好的记录高频信号,需要更高的采样率。

有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!

较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。


1.2.4 频带与均衡(EQ)

案例1:

如何解决录音中的低频轰隆声?


案例2:

高切在音频领域中的应用

16kHz 高切确实是 MP3 的硬伤——这只是视觉上的,一方面三千以内的头戴耳机就别谈 16kHz 了,12kHz 都很悬(见下图);另一方面,30岁以上你基本也听不到 16kHz,MP3 标准之所以切 16kHz(而非 15kHz)是根据详尽的统计数据决定的。

案例3:

《莲花》中的频带


(图29:《莲花》工程中跨在总线的EQ,从图中可以看到20Hz的低切和129Hz、-24dB、Q值100的陷波。)

均衡器(Eqaalizer)将音频频谱(audio spectrum)分割成独立的可调整的频带(band)。在软件中,往往使用EQ曲线编辑器来调整这个频谱。EQ曲线功能很多,可以用来调整曲线的起点、终点、顶点或形状来增强(boost)或剪切(cut)或压缩扩展(compress&expand)音频高低频(frequency)或增益(gain)。


专家观点:

要想真正在你的母带制作中使用好均衡,那么就需要你对频率和带宽(或称为Q值)进行控制。频率控制是指你将频谱中的哪些成分提升或是降低,而带宽是指受提升或是降低的频段有多宽。一条非常基本且有用.的原理就是在进行均衡操作时,进行提升操作的效果不如进行降低操作的效果好。如果你觉得低频成分不足,可以试着降低中频或是高频的成分,而不要一味地将低频进行提升。如果你不得不进行均衡提升操作,那么你应该使用小的提升量值和较宽的带宽,以得到尽量平滑的效果(此时Q值设置为2以下)。

我所说的频率是以它们所产生的影响来定义的。重击声大约在70Hz,温暖的声音大约在250Hz,浑声音产生自400Hz、到800Hz的,鼻音一般在1到2KHz,急噪的声音在3到4KHz左右,齿擦音的声在5KHz,6到8KHz是“噗噗”声, 明亮的声音在10到13KHz 3 而17KHz到更高的频率是空声音。例如,为了在过于刺耳的声音中加入一些温暖的成分,你可以试着在3KHz处降低1到2分贝在275Hz处进行0.5分贝的提升。

如果频率在你的均衡器上已经达到足够高了,那么可以试着在18KHz处增加0.5分贝。照此去做,以得到一个非常具有开放性的混音效果,尽管你可能不得不进行一些衰减并且对12KHz的频率进行少许降低,以防止高频成分过多。我同时还发现许多混音都受益于对120到150Hz处的频率范围进行一个低Q值(0.2到0.7)的提升,以及对400Hz左右的频率进行适当的降低(在Q值为2到3的情况下降低-1.5分贝)。如果你使用的是一台数字式均衡器,那么你就会发现你无法直接得到这一额率,它们会给你一个较大的范围。

如果在频谱中有一些成分十分让人讨厌,可以试着这样去解决:设置一个非常高的Q值(大约5左右),再在均衡器上进行10分贝的提升操作。然后对频点进行移动,使得提升操作慢慢扫过整个频率段。当它经过那个让你心烦的频率点时,你一定会立刻就发现它,并且坐立不安的。将刚才进行的提升操作调个个儿,现在要做的是降低操作(两次的量值要一致),然后在进行Q值控制的情况下进行播放,直到那个让你心烦的声音消除了同时其他声音又没有受到损害。

当进行均衡时,你要经常地使用“旁通”(bypass)功能,以保证所进行的操作得到了更加动听的声音。这在你同时对多段进行均衡时是非常重要的,这主要是因为各段之间是相互影响的。如果你发现在某些地方声音变差了,那么可以先将某些段暂时不通过均衡器,直到你找到了问题所在为止。只要你真的需要,就不必害怕将均衡器设置为零或是随便胡乱设置量值。

(材料来源:神奇的母带制作 midifan.com)



需要注意的是:

低音音箱才能准确的反映出低频,耳机听音是不准确的,它往往会过分渲染。

尽量降低监听音量的情况下检查混音效果,你的用户可能在嘈杂环境或较低音量环境。




1.2.5 数据压缩和动态范围压缩


案例1:

聊聊mp3为什么退出历史舞台

AAC/MP3/ATRAC3三种音频文件有损压缩编码客观测试报告


案例2:

一个简单的compresor/limiter插件



案例3:
声卡需要多大的动态范围?
[[code format="html4strict"]]
要准确听足96dB的动态,声卡、线材、插头的实测规格要高于96dB。例如平衡线本身也有信噪比(好线可以到115dB),非平衡少6个dB。
例如一个声卡,DA芯片动态115dB,实测可能在110dB,用普通平衡线之后是108dB,非平衡线是102dB,到了这一步,你还有要考虑的——你的音箱有前级(音量、EQ什么的)、以及后级(功放),这一步还会加入底噪。
根据我个人的听力,我觉得声卡的动态需要到110dB以上,可以完整的回放电脑中96dB动态的音乐。虽然越高越好,但120dB以上已经难以分辨,得用几万的音箱才能听出差别(公布频响的音箱暂且不多,公布THD数据的音箱寥寥无几...)
90年代末 Digidesign 旗舰DA(888|24)是108dB动态,那时候“专业声卡”MAYA大概是90dB动态
2002年初 Digidesign 等专业DA(192 IO、DA16)是120dB动态,这时中端专业接口(Marian、TC、Avid)逐步发展到了110dB
2010年底,Digidesign 与 Apogee 的旗舰接口来到了 130dB。
120dB 曾经是十年前每个录音师的梦想,这是当时“到头了”的动态范围,幸好现在5000内也陆续开始有设备能企及120dB,现在录音师与发烧友的梦想变成了130dB,在万元价位能入一台“到头了”的130dB专业接口或解码器,已经没有十年前那么困难。


动态范围压缩(Dynamic Range Compression)

一般是调整输入输出信号电平的阈值比率(threshold ratio)达到减少声音信号的增益(gain)的。

其他方法还包括:限幅(limiting)、扩展(expansion)、门(gating)等。


专家观点:

从一个工程师的角度来看,压缩操作是你的朋友.但是如果你非常轻率地随意乱用压缩,那么它就会将整个混音成果毁掉。根据Gentle的经验,你可以试着使用2:1或是3: 1的比率并设置低于你的混音峰值20到30分贝的阀值来进行压缩处理。如果你这样进行压缩,RMS(它控制着平均能量的过载时间)的处理效果要优于对全部“原材料”进行峰值模式(Peak mode)处理的效果。


如果在你的压缩器上有一个立体声的关联键(Link),那么一定要使用它。它会根据左右声道的强弱来进行压缩,使你声音的声像不会发生偏移。当设定音头时间和释放时间时,设法使它们相反。如果你设置了一个较快的音头(10到30毫秒),那么就要将释放设置得稍微慢一些(750毫秒到2秒)。较慢的音头将会带来较为瞬时的穿透性并使得你的混音富有生气。一个使用压缩器的小窍门就是先将你的原始信号分开,压缩它,然后再将它与没有经过压缩的信号进行混音.这样将会使得混音信号平滑同时又不会失去生动的特性(你如何平衡这两路信号完全取决于你想要保留多少原始的动态变化)。在进行这项操作时一定要仔细聆听,因为在将压缩信号与未压缩信号放到一起时会导致相位消弱的现象。

如果你感觉3:1的比率对于你的混音动态来说还不够大,那么可以再适当地加大比率或是降低阀值,或是考虑进行两次比率较低的压缩。进行两次比率值为2:1的压缩,会得到比进行一次4:1压缩更为平滑的声音。压缩操作并不仅仅是对混音的动态范围进行改变,它还会帮助你提高平均电平。

一个限幅器就是一个高比率的压缩器,通常的比率值在10: 1左右,但是它的用法却与压缩器有所区别。一个限幅器限制音量最大的声波尖峰,并且不允许它们超过你所设定阀值。这可以帮助你避免过载的发生。一个限幅器应该具有非常快速的音头和释放时间。一些数字式的限幅器具有实时超前观察的能力,并可以为声音采样并设置尽量快的音头和释放时间。当你设置阀值时,你应该设置成输出可以达到的最大电平值,而不要设得太低。许多的数字式限幅器允许你将阀值设置为仅差0.1分贝声音就要“破”掉的程度,这样你就可以达到很高的电平值而又不会出现失真现象。

(材料来源:神奇的母带制作 midifan.com)



数据压缩(Data Compression)

在计算机应用中,能够达到最高保真水平的就是PCM编码,近年来DSD技术在音响界得到广泛应用。

双声道的PCM编码的WAV文件,码率为 44.1K×16×2 =1411.2 Kbps,数据速率为1411 / 8 = 176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,要降低磁盘占用,只有降低采样指标或者压缩。

MP3的核心特点是,能对PCM数据进行12:1的压缩[典型压缩比],标准的44.1kHz 双声道PCM WAV,经过编码后,可以得到128kbps的MP3。这在当年,MP3的出现意味着可以节省大量的存储成本。


小练习:音乐盲测

里面有六首不同类型的音乐,分别采用原始 Wave格式、320kbps 压缩和 128kbps 压缩三种格式,并随机给出,让你选出「听起来」比特率最高的一个(也就是原始的 wav 档)。

网址在此

大家可以做做~一般来说,128和320是很容易分出来的;320和wav的话,如果设备比较一般,则有一定的难度


1.3音频文件数字资产管理

案例1:

音频文件数字资产管理

(使用软件:alienbrain)


案例2:

音频文件格式转换

(使用软件:saw/audiocoder/foobar)


案例3

PCM VS DSD 比拼



The noise created by Direct Stream Digital is tremendous, so tremendous, in fact, that Sony/Phillips have created a noise-shaping system designed solely for the purpose of disguising the inherent noise in a DSD signal. Explained briefly, the noise created by DSD’s one-bit sampling is shifted out of the lower frequencies, and shoved up into the ultrasonic range, thereby making the noise “inaudible.” We can see that the system is not quite perfect, as the 10kHz signal is still tainted by noise. But this noise is not the only fly in the ointment.



表1 常见音频文件格式


媒体格式

扩展名

相关公司或组织

主要优点

主要缺点

适用领域

WAV

wav

Microsoft

可通过增加驱动程序而支持各种各样的编码技术。

不适于传播和用作聆听。支持的编码技术大部分只能在Windows平台下使用。

音频原始素材保存。

mp3(MPEG 音频)

mp3 (包括mp2 mp1 mpa等)

Fraunhofer-IIS

在低至128kbps的比特率下提供接近CD音质的音频质量。广泛的支持。

出现得比较早,因此音质不是很好。

一般聆听和高保真聆听。

mp3PRO

mp3

Fraunhofer-IIS

CodingTechnologies

Thomson Multimedia

在低至64kbps的比特率下提供接近CD音质的音频质量。

专利费用较高,支持的软件和硬件不多。

一般聆听和高保真聆听。

RealMedia

ra, rma

RealNetworks

在极低的比特率环境下提供可听的音频质量。

不适于除网络传播之外的用途。音质不是很好。

网络音频流传输。

Windows Media

wma, asf

Microsoft

功能齐全,使用方便。同时支持无失真、有失真、语音压缩方式。

失真压缩方式下音质不高。必须在Windows平台下才能使用。

音频档案级别保存,一般聆听,网络音频流传输。

MIDI

MID

MIDI

RMI

XMI

MIDI Association

音频数据为乐器的演奏控制,通常不带有音频采样。

没有波表硬件或软件配合时播放效果不佳。

与电子乐器的数据交互,乐曲创作等。

Ogg Vorbis

OGG

Xiph Foundation

在低至64kbps的比特率下提供接近CD音质的音频质量。开放源代码,不需要支付使用许可费用。跨平台。

发展较慢。推广力度不足。

一般聆听和高保真聆听。

VQF

vqf

tvq

NTT Human Interface Laboratories

在低至96kbps的比特率下提供接近CD音质的音频质量。

相关软件太少。

一般聆听。

MOD(Module)

mod s3m it xm mtm ult 669 等

Amiga和mod社区

音频数据由乐器采样和乐谱、演奏控制信息组成。

具体的文件格式太多影响推广和使用。

一般聆听。

Monkey's Audio

ape

Matthew T. Ashland

无失真压缩。部分开放代码。

由于是个人作品,使用上存在一定风险。

高保真聆听和音频档案级别保存。

aiff

aiff

Apple

可通过增加驱动程序而支持各种各样的编码技术

一般限于苹果电脑平台使用。

苹果电脑平台下音频原始素材保存。

au

au

Sun

Unix和Java平台下的标准文件格式。

支持的压缩技术太少且音频数据格式受文件格式本身局限。

Unix和Java平台下音频原始素材保存。

voc

voc

Creative

对于目前的音频技术来讲,该格式已经没有什么优点了。

与具体的硬件相结合因此没有延续性。

淘汰。

vox

vox

Dialogic

面向语音的编码。

文件格式缺乏足够的信息,因此不适应作存档用途。技术比较早期。

淘汰。

MPC

mpc

 

中高码率下,具有有损编码中最佳的音质表现,高码率下,高频表现极佳

缺乏广泛的软件和硬件支持

目前最适合用于音乐欣赏的有损编码。

FLAC

  

无损格式

  

ALAC

 

apple

无损格式,仅用于itunes

  

Hi8

  

支持8轨数字录音带

 

广播电视领域多声道音频素材交换格式

DSD

 

索尼、飞利浦

采用1bit,2.8或5.6mhz采样,高保真

占用存储空间较大,1小时5.6m需要5G空间

录音母带

表2 音频编码



更多的 :音频编码格式比较表


下一节:Ex0306 使用Pyramix录音

返回《影视广告设计》慕课在线视频列表

影视广告设计课程列表:

Ch00 影视广告设计制作平台

-Ch000201制作平台_硬件介绍

--Ch000201制作平台_硬件介绍

-Ch000202制作平台_软件介绍

--Ch000202制作平台_软件介绍

Ch01 平面设计基础

-Ch01 平面设计基础(理论)

--Ch010101平面设计简介

--Ch010102 平面设计简介

--Ch010201 版式showreel

--Ch010202 版式设计理论

--Ch010203 版式小结

--Ch0102 版式设计

--cis

-Ex01 平面设计基础(实验)

--实验简介

--Ex010201 图片编辑(上)

--Ex010202 图片编辑(下)

--Ex010203点阵图片

--Ex010204矢量图片

--Ex01030101 ps(上)

--Ex01030102 ps(中)

--Ex01030103 ps(下)

--Ex01030201 通道概念

--Ex01030202 通道与Houdini三维贴图

--Ex01030203 通道与Houdini后期合成

--实验1 使用Photoshop进行标志设计

--实验2 使用Photoshop制作通道

Ch02 视频技术基础

-Ch02 视频技术基础(理论)

--Ch0201 视频技术简介

--Ch0202 视频文件基本属性

--Ch020301视频信号数字化

--Ch020302 数字视频的采样格式

--Ch020303 数字视频标准

--Ch020304 案例_Catalyst

--Ch020305 视频编码与压缩

--Ch020306 常见视频编码

--Ch020401 数字视频输入的硬件

--Ch020402 视频存储方案

--Ch020403 视频摄像检测

--Ch020404 视频文件传输与交换

--Ch0201 视频技术简介

--视频文件基本属性

--Ch0203 视频文件数字化

--Ch0203 视频编码解码

--Ch0204 视频文件存储与交换

-Ex02 视频技术基础(实验)

--Ex0201 实验简介

--Ex0203 实验3 使用DIT进行素材管理

--Ex0204 编码转码

-ch02 单元讨论

Ch03 音频基础

-Ch03 音频基础(理论)

--Ch0301 音频技术简介

--Ch030201 人声

--Ch030202 音效

--Ch030203 音乐(上)

--Ch030204 音乐(下)

--Ch030205 剪辑师素养

--Ch0302 章节介绍

-Ex03 音频基础(实验)

--EX030101 实验简介

--Ex030201 录音与混音基本流程

--Ex030301 音频文件属性

--Ex030302 音频信号数字化

--Ex030303 音频信号均衡

--Ex030304 音频信号压缩

--Ex030401 音频硬件平台

--Ex030401 音频硬件平台

--Ex030402 录音与混音系统

--Ex030403 专业声卡

--Ex030405 软件扫描

--Ex030404 音频接口

--Ex030501 Protools软件介绍

--Ex030502 Protools录音

--Ex03050301 Protools混音

--Ex03050302 Protools混音

--Ex03050303 Protools混音

--Ex03050304 Protools混音

--Ex030601 Pyramix软件介绍

--Ex030602 Pyramix流程

--Ex030603 Pyramix录音

--Ex030604 Pyramix混音

--Ex0303 音频文件数字资产管理

--Ex0306 使用Pyramix录音

-Ch03 单元讨论

Ch04 非线性剪辑基础

-Ch04 非线性编辑(理论)

--Ch0401 非线性编辑简介

--Ch040202 发展历史

--Ch040203 案例分析

--Ch040204 框架 核心技术_TC

--Ch040205 框架 核心技术_色保护、DI

--Ch040206 剪辑师的素质

--Ch0403 本章小结

-Ex04 非线性编辑(实验)

--Ex040101 实验介绍

--Ex0402 平台介绍

--Ex040201 NLE软件扫描

--Ex040202 NLE系统构成

--Ex040203 主要厂商与产品

--Ex0403 使用Avid系统剪辑视频(实验7)

--Ex040301 AMC项目

--Ex040302 AMC 界面

--Ex040303 AMC图片导入

--Ex040304 AMC声音导入

--Ex040305 AMC视频导入

--Ex040306 AMC文件导出

--Ex040307 AMC剪辑(上)

--Ex040307 AMC剪辑(下)

--Ex040308 AMC效果

--Ex040309 AMC字幕

--Ex0403010 AMC导出到DS

--Ex0403011 AMC导出到Protools

--Ex0403012 Protools编辑AAF音频

--Ex0403013 AAF与流程

--Ex040401 本章小结

--Ex0401 本章小结

-Ch04 单元讨论

Ex0303 音频文件数字资产管理笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。