音乐制作最难理解的概念之一:
音频抖动
在混音和母带处理方面,抖动(Dither)这个话题较少被深入探讨,但它实际又很有用处。Waves下面这篇文章就帮助各位来了解一下抖动。
抖动是音乐制作词典中最不被理解的词汇之一,但它又是数字音频处理中一个必不可少的因素。如果你从事混音或母带制作,就真的应该好好研究它一番。
那么,什么是抖动呢?它其实是一种低电平形式的噪音,在渲染向更低的位深时,被刻意添加到数字音频文件中。抖动的概念可能听似“反直觉”,但却是一个很有效的处理方式。抖动噪音实际上掩盖了所谓的“量化失真”,后者会导致数字音频出现噪声和不自然感。在进入到具体细节之前,我们先快速回顾一些有关数字音频的基本概念,会有助于理解这次的话题。
采样率和位深度
当音频通过数模转换器(ADC)被数字化处理时--也就是当录音通过音频接口发送给DAW时,来自话筒或DI盒的模拟音频信号将被转换为一系列的1和0,音频被表现为数字形式。为此,ADC设备获取音频快照(也称为“样本”)时要通过特定的速率和大小--也就是采样率(Sample Rate)和位深度(Bit Depth,或称比特深度)。
采样率控制着转换器在一秒钟内捕捉到并进行数字化处理的音频采样数量,它在频率响应方面至关重要。基于奈奎斯特定理(Nyquist Theorem)的一般规则,你的采样率必须大于或等于音频最高频率的两倍。否则,被称为“混叠”(Aliasing)的失真就会损坏声音。
为了获得到高至20kHz的频率--人类听觉的频率上限,通常使用的最低采样率是44.1kHz(CD介质的速率)。但是现在,48kHz或更高的频率也很常用。采样率越高,重现频率范围的精度就越高。
位深度(也称可之为“字长”)是指每个样本的大小,即它所包含的0和1的数量。它量化了振幅的精确程度,因此动态范围(可捕获到的最大响度和底噪之间的差距)得以在数字化时得到体现。
位深越高,对振幅的描述就越精确。比较16位(Bit,比特)和24位音频时,分辨率的差异非常惊人。16位音频可以让振幅表现高至65536个等级,而24位则能达到16777216个等级。在动态范围方面,一个比特相当于6dB。16位时,你就有96dB(16x6),24位时则有144dB(24x6)。
量化失真
当你将文件从24位转换为16位时,数字音频软件将会删除(“截断”)最后8位,并且必须将数据四舍五入以适合至可用的较小位数。这个过程被称为“量化”(Quantization)。它与你在MIDI中量化音符的过程不同,但概念类似。在MIDI序列中,如果将十六分音符乐句量化为八分音符,你的DAW必须将未落在八分音符上的任何十六分音符都重新指定到最接近的音符上。这样就降低了音乐的精度。
将24位音频转换为16位(或从32位固点转换为24位等等)时,DAW或音频编辑器会进行比特量化,反映到振幅上,层级就明显更少了。结果就是,整数化可能会导致所谓的量化错误(也称为“量化失真”或“截断失真”),具体表现为低电平噪音或着失真。
你的音乐通常会掩盖掉这种错误,但是对于16位音频,这种量化错误有时还是可以在安静段落上或者音乐淡入或淡出时被听到。最重要的,它毕竟是一种失真形式,你不会希望它出现在自己的音乐作品中。一些工程师表示,即使实际上听不出量化失真,它也会让音乐整体听起来更加尖糙。
抖动救援方案
将文件保存到较低采样率时,添加抖动是一个解决方案。当抖动被添加到有量化失真的音频时,它会掩盖量化失真,使其出现得更加随机,让耳朵难以辨别。与粗糙刺耳的结果相反,抖动处理将量化失真转变为稳定的低水平的模拟感嘶声。
另一个在有抖动功能的软件和插件中常见的术语是“噪音塑形”(Noise-shaping)。这基本上是指抖动均衡处理,旨在改变抖动噪音的频率特性,使其处于人耳最难听辨的范围。
▲Waves的L系列限制器,例如L3 Multimaximizer,都配备了IDR技术,用于添加抖动。
限制器通常位于母带效果链中的抖动效果之前,处于倒数第二个,因此大多数母带级限制器都内置有抖动功能。所有具备IDR技术的Waves限制器,允许针对各种位深目标添加抖动。你可以在两种不同的抖动类型中选择其一。
Type 1:旨在消除音频中的任何量化失真。它由经过噪音塑形修饰的抖动噪声组成。Waves推荐将之用于16位和20位处理。通过添加第一种抖动,你导出的16位母带音频,听起来实际上像是19位的。换言之,得益于IDR抖动,你多得了三个比特的可感音频精度。
Type 2:会给信号增加少量噪音,但并未像第一种那样完全消除量化失真。因此,Type 1和Type 2之间的选择,取决于你是想要完全消除失真,还是想在减少噪声的同时只是去除大部分失真。
噪音的形状
Waves的IDR技术允许你在三种不同的噪音塑形选项中进行选择,以用于抖动处理:中度(Moderate),正常(Normal)和超常(Ultra)。对于大多数情况,Waves建议使用Normal项;而仅对于母带处理的最后阶段,Wave才建议选择Ultra项。你可以通过在文件的安静段落--例如只有混响尾音延音,音乐淡出或停顿时,聆听并试验不同类型的抖动和噪音塑形。
▲在Waves L3-LL Multimaximizer中,你可以看到各种IDR噪音塑形选项。
如果不方便或者没时间试听不同的选项,Waves提供给你以下快速建议:
抖动选择Type 1,噪音塑形选择Normal,用于CD母带制作。
抖动选择Type 2,噪音塑形选择Ultra,给16位或更高位文件添加最少量的噪音。
Type 2还支持“自动黑化”处理,不会将抖动添加到音频的任何静音部分。如果你的音频确实包含这样的段落,请选择Type 2。而要获得最大精度,请选择Type 1配Ultra。
抖,还是不抖?
何时添加抖动,是一个让人困惑甚至极具争议的话题。看待它的最简单方式是,在位深下降时,始终应该进行抖动。所以,如果从24位变为16位,应该抖动;如果从32位固点(非浮点)变为24位或16位,也应该抖动。
但是,如果你将混音并轨到MP3或AAC等数据压缩编译码文件上,抖动则不是必要之举。这类格式都会将修饰感加入到信号中,抖动是无法弥补的。
在给如MP3和AAC这些有损编解码器编码时,你能做的最好的努力是使用最高的比特率,同时确保文件大小可以达到流媒体平台的限制要求。不要将比特率与位深混淆。比特率测量的是信号流的传输速度,最常见的是以kbps(千比特/秒)或mbps(兆比特/秒)表示。比特率越高,质量越好,文件也就越大。
抖动实操终极提示
希望Waves这篇文章能帮助你拨开一点迷雾。如果它仍然有点令你望而却步,下面这些简单指导,可以提示你何时如何使用抖动:
只在将音频降到较低位深时才用抖动。
在转换为MP3或AAC之前不用抖动。
如果要从24位或32位混音创建CD所需的16位文件,请始终选择抖动。
从32位浮点到24位(因为32位浮点没有更高位深)时,不需要抖动;但是从32位固点降到任何较低位深时,都要抖动。
如果你正在为母带制作工程师准备24位或32位数据,请不要抖动,留给母带工程师进行专业处理。
确保抖动是处理链的最后一步。在DAW或音频编辑器中,切勿在抖动后面再插入其他效果处理器。
尽量避免二次抖动,因为抖动效果会为音频添加更多噪音。也就是说,如果你在工程项目中要两次下降位深(除非你从32位固定点开始,否则不太可能),则应该在每次转换过程中抖动。
如果你对各种抖动选项感到困惑,请使用抖动软件提供的默认参数。如果你足够有信心,请选择不同的抖动和噪音塑形选项进行比较,以决定哪种抖动选项最适合某支特定歌曲。