音响论坛 门户 查看内容

数字音频音质剖析(1)

2009-8-11 09:40| 发布者: | 查看: 10972| 评论: 0

许多年前,就有人开始议论关于16-bit,44.1 kHz的数字音频系统无法满足人耳的听音需要,无法真实地再现原有的声音。从理论上来讲,这种数字音频格式可以为我们提供0 Hz到22.05 kHz的带宽 和96 dB的动态范围。

(带宽 即指频率带的范围。通常,人类听觉的带宽为20到20,000 Hz。动态范围 则是指音频系统所能够提供的音量最大的声音与音量最小的声音之间差距。要注意有些设备制造厂商在宣传中的措辞。动态范围与信噪比不是一码事。信噪比 是指通常的工作电平或是名义上的工作电平与噪声电平之比。这个指标通常都要小于动态范围的值。)

那么,我们为什么经常会听到说这种数字音频格式无法满足"金耳朵"的需要呢?他们这些人究竟感觉到了什么与众不同的东西呢?为了搞清楚这个问题,我们首先要回过头来温习一下数字音频的工作原理。好,拿出你的二进制计算器,喝点儿富含咖啡因的饮料提提神儿,然后我们要回到数字音频学校中去了!

— 基础知识

数字音频系统是通过将声波波形转换成一串数据来再现原始声音的。实现这个步骤使用的设备是模/数转换器(A/D),它给声波拍下许多个"快照"(即进行采样),每一张快照都记录下了原始模拟声波的某一时刻的电压值,将一连串这样的快照连接起来,就形成了声波的振幅 (即音量或是音量电平)。每一秒钟所拍摄的快照数目就称为采样频率 (或称采样率),采样频率的单位是Hz(赫兹,即每秒钟多少次)。采样频率是决定频率响应方面最重要的因素,其他因素均没有它的影响大(其他的因素我们将在下面进行讨论)。

系统中量化精度 的bit数目直接决定了采用多少个"台阶"来表示声波振幅的范围(即动态范围)。每增加一个bit,表示声波振幅的台阶数就要翻一番,并且增加6 dB的动态范围。由此可以计算出,一个1-bit的数字音频系统可以为我们提供两个台阶,即6 dB的动态范围。而一个2-bit的数字音频系统可以为我们提供四个台阶,即12 dB的动态范围;3-bit提供八个台阶,即18dB的动态范围;4-bit提供十六个台阶,即24dB的动态范围;以此类推。如果我们继续增加bit数,则量化精度就将以非常快的速度提高(用数学上的话来说,这是一种指数增长关系)。我们可以计算出16-bit能够提供65,536个台阶,即96 dB;而20-bit可以提供1,048,576个台阶,对应120 dB;24-bit可以提供多达16,777,216个台阶,对应144 dB(参见图1)。

当这个二进制的数所有的位上均为1时,对
应着最大的音量值。通常我们称这种情况为"全码"。在数字音频领域,这种情况对应着最大的音量,音量不能更大了,再大就将产生喀哒声,而声波的振幅不会再增加。
— BITS与BYTES(比特和字节)

到这里,你已经阅读了一些有关数字音频的理论了,因此可以说,你已经是这方面的专家了。现在,你可以放下这本杂志,让你的朋友们对你刮目相看一番了。不过,你可能还是应该继续看下去,因为下面我们还要讨论一些实际问题,例如为什么我们当前的理论不能够很好地解释实际工作中所有的音频现象呢?

你可能不只一次地被人告知,在数字音频系统中进行录音时,要尽量录制较大的音量电平,这样才能够最大限度地提升输入电平的量化精度。较低的音量电平只使用较少的bit数,因此,它们只能得到较低的量化精度。当声音的音量变大时,量化的精度将会提高。(再次参考图1。当数字音频系统中的声音音量较小时,我们就不能只考虑整个系统的量化精度了,其实这时声波的振幅只用到了很少的几节台阶,如果我们将音量电平提高,则它将要用到的台阶数目就要增多,也就提高了实际的量化精度。)

你可以自己进行这样的试验:翻出一张最陈旧的CD唱片,然后找出其中采用淡出方式来进行结尾的歌曲。当音乐淡出时,开大监听音箱的音量电平,你一下子就会明白这一切了。你将会听到随着声音电平的降低,声音将会失真得越来越厉害。这种现象我们称之为量化误差(quantizatin error)。当数字音频系统中所采用的量化bit数目过少,造成系统无法正确地还原出原始音频信号时,就出现了这种误差。音量从大约48 dB下降到无声,声音音量的降低将会呈现出颗粒状的降低现象。

你可以这样来考虑,在纸上画一个半圆。连续的曲线对应着采用模拟录音带的情况。现在,我们要使用小孩玩的积木来搭这样一个半圆(参见图2)。所有的积木都必须具有相同的方向,并且相互紧挨着。尽管你可以搭出这样一个半圆,但是它毕竟还是有棱角的。使用较窄的积木(即采用较高的量化精度)可以使得这些棱角变得不明显,但是却无法让棱角消失。当我们采用数字音频系统来实现一个轮廓为平滑曲线的波形时,也会遇到类似的情况。声音中将会有这些棱角所带来的量化误差。

对此,我们可以采用两种解决办法:抖动处理(dithering)或是购买具有较高量化精度的设备。抖动处理是一种不使我们现有的数字音频设备过时的方法。当遇到音量电平较低且变化较平滑的声音时,使用较多的bit数来进行量化,而在其他情况下则使用较少的bit数来量化,抖动处理还可以被使用在bit数目降低的场合,例如,当你必须要将20-bit的模/数转换器的输出信号录制到16-bit的DAT录音机或是CD上时,就可以采用这种处理方式。

微信扫码关注公众号