音响论坛 门户 技术 音响 查看内容

何为:音质

2015-6-30 16:27| 发布者: camix| 查看: 915| 评论: 0

摘要: 在音响音质中它包含了三方面的内容:声音的音高,即音频的强度和幅度;声音的音调,即音频的频率或每秒变化的次数;声音的音色,即音频泛音或谐波成分。谈论某音响的音质好坏,主要是衡量声音的上述三方面是否达到一定 ...

在音响音质中它包含了三方面的内容:声音的音高,即音频的强度和幅度;声音的音调,即音频的频率或每秒变化的次数;声音的音色,即音频泛音或谐波成分。谈论某音响的音质好坏,主要是衡量声音的上述三方面是否达到一定的水准,即相对于某一频率或频段的音高是否具有一定的强度,并且在要求的频率范围内、同一音量下,各频点的幅度是否均匀、均衡、饱满,频率响应曲线是否平直,声音的音准是否准确,既忠实地呈现了音源频率或成分的原来面目,频率的畸变和相移又符合要求。声音的泛音适中,谐波较丰富,听起来音色就优美动听。 

所谓声音的质量,是指经传输、处理后音频信号的保真度。 

目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。 

对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容量越大,当然保真度就高,音质就好。 

声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。 

音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64KbpsAM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISOITU-T联合制订,CD11172-3MPEG音频标准为48kHz44.1kHz32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。 

对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以“够用,又不浪费”为原则。 

声音的确是一个很容易被人的心理和视觉因素干涉的东西,如你在音乐厅注视着某个乐手时会自然而然地觉得这位乐手的演奏声音比较大(鸡尾酒会效应)。 

首先必须说一点人们容易产生的误区——“高保真”概念。音乐上的“高保真”,应该指重放时清晰度的保证、频响保证、失真度与信噪比的保证而非“真实还原乐器本身”。实际上,越真实的声音是越难听,我们现在听到几乎全部“好听”的音乐,几乎都是“不真实”的。无论是什么音乐,混音师们都会用各种处理手段让大家觉得“好听”。混音师们并不追求真实,也并不追求虚假,他们只追求“好听”。而“好听”在大多数时候都不真实。这首每一样乐器都不真实、脏得要命,所有乐器都不在一个空间里。但因为是无损所以音质很好。  

好音质≠乐器声音真实 

1、谐波失真 

既然谈到音质,就要先谈一谈谐波失真。 

我们在听耳机、音箱时如果音量开得过大,会发现有声音“劈”了的情况出现,这时候我们听到的“劈”的声音便是谐波失真。谐波失真是由削波引起的,在设备输出为非线性时,如输出电平高于设备限定的最大电平时,峰值信号会被“削平”,变为这个样子。 

图中可以看出被硬削波以后声音会变成接近方波的形状(实际情况没有这么夸张),方波可以被认为是由一个基波加上它的无数次谐波构成。那么此时,声音便产生了大量原来并不存在的高次谐波成分。削波分两种,一种硬削波,如上图。还有一种叫做软削波,如下图: 

 

图中可以看出被硬削波以后声音会变成接近方波的形状(实际情况没有这么夸张),方波可以被认为是由一个基波加上它的无数次谐波构成。那么此时,声音便产生了大量原来并不存在的高次谐波成分。削波分两种,一种硬削波,如上图。还有一种叫做软削波,如下图:

这种削波在拐点处有一个过渡,听起来比硬削波稍柔和些。吉他的OverDrive效果器就是使用软削波失真原理制造而成。这种削波在拐点处有一个过渡,听起来比硬削波稍柔和些。

OverDrive.wav

例子:Metallicade专辑《Death Magnetic 曲目All Nightmare Long声音产生的能量会分配给音色坚硬度和响度。相对来说软的东西比较容易做响,因为可以有更多的声音能量分配在响度上。而在这张专辑中,所有的乐器都坚硬无比,混音和母带制作时又靠着变态的设备猛提响度。最终导致这张专辑产生了大量的谐波失真。尤其在1分钟起Crash之后,谐波失真极其明显。  All_Nightmare_Long 

2、耳机频响

我是做音乐的,不烧耳机。SE535GMP450 Pro听了好几年。干活的时候也用。在这里只说一些简单现象表明耳机频响对重放质量的影响。

 

这是老小白的频响曲线(图片来源于耳机吧)

低频比较“片”。但是因为大量的人开始使用itunes和苹果的小耳塞听歌。混音师在混音的时候也开始照顾小白的频响(欧美流行居多)。这样虽然音乐出来低频还是“片”,但弹性和力度能得到一定保留。手头有老小白的可以用老小白听一听欧美流行。

 

这是SE535的频响曲线(图片来源于chiphell

在中低频有较为夸张的提升,低频稍有衰减 。导致在音乐中人声会相对靠前。因为本身该款耳机的定位就是“舞台监听”。 

至于某某耳机效果......恶心的低频增益会完全将音乐的比例失调掉。低频什么也听不清(demo),还没有混音。 Find your Sorrow Normal.wav

我用耳机听了一下,bass除了高频的拨弦声,下面的东西完全糊一片。大概是这个效果:Find your Sorrow Beats.wav

如果我真的用此耳机去做这个音乐的混音监听,就要使劲下拉bass的低频增益,但这就会导致在正常设备上回放的时候低频弹性不足。仅仅三个耳机对比就有如此大的差别。 

3、有损编码与无损编码听评 

PCM线性编码格式(wavaiff等无损)在转换成感知编码格式(mp3aac等有损)时,编码器会舍弃一部分声频信息,但有损音频与原声频听起来较类似。它舍弃的部分是基于心理声学模型被认为不可闻的部分,这会导致感知编码失真,造成原音频信息的丢失以及可闻衍生物的产生 

原音频信息的丢失包括频率成分丢失以及较安静声音的丢失。 

首先对比wav192k mp3。人对高频的变化很敏感,注意歌手的声音细节。 

Perhaps Love.wav_

Perhaps Love.mp3_

差别很微小,但是在合适的回放增益和监听环境下可以分辨出,mp3中歌手的声音似乎“掉”下去了,没有wav中的那么靠上和有活力。 

这是玄学吗?将192k mp3wav放在两个轨道上完全对齐,并反向其中一个音轨。这样两个声音中相同的成分会因为相位抵消而消失,剩下的便是两个声音中不同的成分。 

Perhaps Love 相位抵消.wav_

在这个实验中不同的成分便是编码器舍弃的声频信息。包括一些极高频、极低频、瞬态信号等,这些丢失的信号大部分是可闻的。 

编码器还会检测音频中被持续大信号掩蔽的较安静小信号并加以舍弃,比如部分混响声和噪声。Reverb PCM.wav

 这是原音频的混响声,使用Mid-sid方法调整,去除音频中间的大部分信号留住两边的信号。 Reverb MP3.wav

这是192k mp3音频的混响声,可以很容易辨别出无损音频的混响声是十分完整的,而192k mp3的混响声有些地方已经被去除了。

因为编码所产生的可闻衍生物也是音频中M分量靠掩蔽效应让人无法清晰辨认的,此法也可以使可闻衍生物变得更容易被听到。  

发表评论

微信扫码关注公众号