音响论坛 门户 技术 音响 查看内容

揭开 DSD 的神秘面纱:数字音频编码之争 DSD vs. PCM(上)

2017-10-10 15:19| 发布者: camix| 查看: 2112| 评论: 0

摘要: 先前我们介绍了不同数字音频的单元格式,里面有些微提到一些脉冲编码调变(Pulse-code modulation,PCM)的基础概念,但除了PCM或更精准地说是线性脉冲编码调变(Linear pulse-code modulation,LPCM)之外,近期还 ...


先前我们介绍了不同数字音频的单元格式,里面有些微提到一些脉冲编码调变(Pulse-code modulation,PCM)的基础概念,但除了PCM或更精准地说是线性脉冲编码调变(Linear pulse-code modulation,LPCM)之外,近期还有一个非常受关注的DSD(Direct Stream Digital)编码格式。现在市面上的高阶播放器,大多打着能支持DSD译码来当作一个卖点,但是到底甚么是DSD编码格式?是否真的有如同厂商宣称提供更优良的音质?这就是本篇文章所要和大家一起探讨的,底下就让笔者来简单的介绍一下DSD历史。

Direct Stream Digital的历史

事实上DSD的起源已经非常久,早在60年代就已经有利用脉冲密度调变〈Pulse-density modulation,PDM〉编码,将音频讯号记录在数字媒体上,正确来说应该是由PDM一个特殊分支 -脉冲宽度调变(Pulse Width Modulation,PWM)来实现,这种编码方式目前已经完全被PDM格式所取代。

目前常见的DSD编码就是基于PDM规范,这个音乐编码格式的标准规范在1999年发表,是由当时领导音乐单元格式的巨头Sony和Philips合作开发,至于为何制定DSD规范的原因有些复杂。主要是因为那时候由Sony和Philips所制定的CD 〈Compact Disc〉规范专利快要过期,在即将失去由CD专利带来的大量收益情况下,Sony和Philips决定再次连手打造下一代的音乐储存规格Super Audio Compact Disc 〈SACD〉,所以DSD的出现绝大部分是因为商业考虑。

在储存编码上,SACD使用和CD常见PCM编码完全不同的音频格式,采用单位元的DSD编码。Sony花下重金聘请当时最顶尖的两位声音工程师Ed Meitner〈现任职于EMM Labs〉和Andreas Koch 〈现任职于Playback Design〉来制定SACD规范,并且在初期免费开放给大多数知名录音室使用,这成为DSD音讯单元格式第一次大规模被使用在商业活动上。

▲Direct Stream Digital标志。

超级音频光盘〈SACD〉的起源

讲到DSD自然必须介绍一下SACD,SACD取样频率高达2822.4kHz,是一般CD取样频率44.1kHz的64倍,而且理论上具有能够再生100kHz以上频率范围的能力。此外由于SACD使用DSD的脉冲编码,因此省去位转换的过程,同时降低数字滤波可能产生失真和噪声的问题。

虽然这一切都让SACD听起来非常的美好,但SACD在推广的路途上却是相当艰难,因为当Sony和Philips决定用专利屏障再次垄断音讯单元格式时,其他音乐制作公司和硬件生产商却看上了正蓬勃发展的DVD光盘,并且希望利用这个容量更大的储存媒介来发行高质量音乐光盘,就此开启了新世代音乐储存媒介规格的战火。

Super Audio CD和传统CD音乐光盘规格比较

Super Audio CDCD-DA
编码格式Direct Stream DigitalLinear PCM
盘片容量4.70GB- Single Layer [DVD-5]

8.54GB- Dual Layer [DVD-9]

Max. 780MB
读取机制650nm半导体雷射780nm半导体雷射
声道数最高支持5.1声道双声道
响应频率范围0~100kHz 〈max〉5~20kHz
动态范围在可聆听频率范围内〈0 - 20kHz〉,最高达120db96db
取样频率〈双声道〉每秒2,822,400次每秒44,100次
取样深度〈量化〉1bit16bit
最高数据流量〈双声道〉5.64Mbps1.4Mbps
規格制定公司Sony、PhilipsSony、Philips

高质量音乐储存规格之争

DVD-Audio规格很迅速地在SACD出现的隔一年后正式上路,使用和CD相同的LPCM编码,并且可以储存高达192kHz/24bit双声道的高质量音乐。DVD-Audio在音乐制作上和传统的CD音乐并没有太大区别,由于多数音乐制作公司都历经过CD格式的洗礼,因此刚开始大部分音乐制作公司,偏向选择技术上更加成熟的DVD-Audio规格,当然也有一部分理由是可以摆脱Sony和Philips的专利束缚。

想当然,Sony和Philips为了捍卫自家格式和利益自然会做出反击,Sony和Philips藉由自己在硬件制造上的优势,拉拢大多数DVD播放器制造商,让后续生产的DVD播放器无法兼容DVD-Audio。这个作法严重的打击DVD-Audio阵营,虽然DVD-Audio阵营有不少大型公司支持,但是其内部意见却是相当分歧。由于每个成员都怕被另一个规范所束缚,这为DVD-Audio推广之路种下了失败的种子。

另外更令内部成员惊恐的是,在那音乐盗版猖獗的年代,DVD加密法很快地就被黑客所破解,每个音乐制作公司都害怕DVD-Audio会重演CD的盗版局面,因而都裹足不前。第一份正式DVD-Audio音乐光盘,居然是由一个发烧友,在缺乏良好录音设备的小型研究室录制。

在DVD-Audio阵营内部互相猜忌的情况下,Sony乘胜追击的许诺SACD将永远不能被计算机所播放,这几个举动成功稳固住SACD作为新一代音乐光盘的地位,并且也解决了双方阵营长久以来惧怕盗版的疑虑。

▲SACD标志及SACD的种类。由左至右分别为 〈1〉单层SACD〈4.7 GB〉 〈2〉双层SACD〈8.5 GB〉 〈3〉混和型SACD〈4.7 GB〉 

SACD的殒落

经过上面一大串折腾和较劲之后,Sony和Philips阵营开始自信满满地宣传和推广多声道格式SACD,并且宣称未来是高质量多声道音乐的年代,而且也渐渐获得多数音乐制作公司的认同。眼看着单元格式大战就要分出胜负的时候,Apple的iPod迅雷不及掩耳上市了,尔后几年将在线数字音乐下载量,更提升到了一个惊人的程度。

面对Apple所掀起的在线数字音乐潮流,Sony选择继续维持SACD的生产和发行,并且在2003年规划出同时拥有传统CD层和SACD层的混和型SACD,期望在实体音乐光盘销售上有所突破。但是这很快地就碰上SACD播放器销售不佳的问题,因为当年的SACD播放器价格大多落在5,000元美金以上〈约新台币15万〉,非常少消费者愿意购买昂贵,而且只能播放音乐的SACD播放器,因此让SACD的销售受到直接的影响。

再加上几年后,Wavelength Audio发布了基于计算机播放的异步USB DAC,这使得利用计算机播放高质量音频档案变得更加容易。尔后又随着全世界网络速度的提升,和在线音乐的流行,出门购买音乐光盘渐渐的不再是获得高质量音乐唯一来源,SACD就此成为只有少部分音乐爱好者的选择。

▲混和型SACD结构图和读取机制,混和型SACD具有一层4.7GB容量的DSD层〈上层〉,同时还包含一个符合PCM红皮书的CD音乐层〈下层〉,这使得它能够兼容于传统的CD播放器。

2006年,在体认到SACD几乎已经不可能成功的情况下,Sony做了一个策略上的大转变,推翻之前SACD将不会被计算机播放的承诺。Sony推出以SACD为基础的DSD-Disc,这个格式的SACD将旧有物理防拷贝保护层移除,使得计算机也能够读取这类型光盘片。

但是由于已经失去市占率,DSD-Disc在完全没有推出过任何商业音乐光盘下就被抛弃,从2009年后就已经没有大型商业音乐制作商,使用SACD当做音乐储存媒介。虽然到这边,由Sony和Philips主导的SACD已经完全溃败,但也为后续的DSD格式音乐打开了另一扇大门。

DSD音乐播放原理

上面看完了DSD音乐格式的历史信息,这边笔者想先来介绍一下DSD到底和PCM有甚么不同,首先我们就从介绍DSD音频编码开始。DSD编码DSD则使用不同于以往PCM逻辑来记录音频,DSD讯号是以ΔΣ调变后的PDM编码形式储存在储存媒介上,DSD的内部记录的是一个连续时间的单一位序列,以固定的时间间隔来记录,在标准的SACD规格下每个取样间隔是1/2822400秒,取样频率为CD规格 〈44.1kHz〉 的64倍之高。

DSD每一次取样会比对本次取样和上一个样本值的变动,接下来使用0和1来记录振幅的变化,0代表比上一个讯号值来得低,1代表比上一个讯号值来格高,所以每一个取样的讯号是和前一个讯号的相对值。DSD藉由非常高的取样频率,将以往量化不精准所造成的失真,下降到一个位以内的误差。

▲DSD音频PDM编码示意图,DSD在每1/2822400秒记录下一个单位元的数据,每一次记录的数据是和前一个数据的相对值。

为了确保每一位读者,都能够轻易理解等一下的DSD和PCM比较,在这边快速地介绍一下PCM编码。PCM编码主要包含取样〈Sampling〉、量化〈Quantization〉、编码〈Coding〉三个过程,如下图上半部所示,PCM也是在一个固定的间隔时间内〈如CD是1/44100秒〉记录下原始模拟讯号的振幅。

但和DSD不同的是,PCM记录的是一个绝对值而非DSD的相对值,每一个不同的振幅强弱都有其代表的数值。然后再将记录下来的数值转换成离散时间讯号,最后再依据PCM规范给予一个编码就是常见的LPCM格式数字音频。简单来说,PCM编码就是在连续的时间〈X轴〉坐标下,记录当时的振幅〈Y轴〉大小。

▲Linear-PCM编码示意图,在固定时间间隔下〈图中为1/44100秒〉,记录当下的振幅大小的绝对值。

DSD音乐播放

DSD音乐的记录和播放流程,相较于传统PCM编码来得简化许多,由于目前市面上主流是使用基于单位元的模拟数字转换器(analog-to-digital converter,ADC),来进行音乐录制。所以如果将录下来的声音直接使用DSD格式储存的话,在播放时只需要在输出端,经过一个开关电容网络构成的低通滤波器,来还原成模拟讯号即可。

整个流程相较于传统的PCM处理,省去了在录音端单位元转多位的过程,和在播放端必须经由超取样和ΔΣ调变成PDM讯号的手续。这使得DSD具有非常好的先天优势,并且理论上能够在硬件端节省下多余的处理组件,也间接地降低处理过程所产生的失真。

SACD较早时期采用1bit转换技术造成的高频抖动〈dithering〉与谐波〈Idle Tone〉等问题,目前的DAC芯片为了因应1bit译码缺点,大多使用多位〈例如:6 bit,64阶〉的ΔΣ调变。此种调变混合1bit PDM和PCM的优点,在低电位输出时直接调整输出脉冲电压为低电压,可以让后续的低通滤波电路设计问题简化不少。在理论上看起来是如此的完美,但是人算不如天算,完美的事情永远只在理想状态下发生,笔者将在后面的章节和各位讨论DSD所需要面对的问题和优势。

▲〈上图〉PCM音频的录制和播放流程简图,总共历经两次超取样处里和两次位数转换,〈下图〉理想状态下DSD音乐录制和播放流程简图,过程中无须经过超取样和位数转换


发表评论

微信扫码关注公众号