音响论坛 门户 新品 查看内容
  • QQ空间
  • 回复
  • 收藏

音调感觉和物理分析(二)

admin 2009-8-11 09:40 2796人围观 新品

音调感觉和物理分析

1、韦伯——费克纳定律

  • 不仅在听觉上,而且一般在感觉上,存在一个重要的事实,被概括为韦伯——费克纳定律,可以举一个声学以外的例子来定性地解释这个定律。设想一个盲人,在他手掌上预先放置10克重的物体,再轻轻放10克重量物体,这时他一定能感觉到重量的增加。若预先放置1千克重物,再轻轻工业放10克重物,由于重量的相对增加很少,他就感觉不出来,一般地说,添加一个刺激所产生的心理效应会受到已经存在的刺激的影响。
  • 现在来定量地叙述一定律,设刺激量为Q,它所引起的感觉量为S。韦伯——费克纳定律认为它们之间的关系是这样的。假设在刺激Q基础上添加小刺激dQ,dQ引起感觉上的小差值为dS,则产生感觉上dS变化所必需的刺激变化dQ与已存在的刺激Q成正比。设比例系数为k,即有

(8-1)

  • 对此式积分,得
  • S=k ln Q (8-2)
  • 这就是韦伯——费克纳定律的数表述。
  • 作为应用韦伯——费克纳定律的第一例子,研究听觉系统对纯音音高的感觉(音调)。这时,刺激量Q为纯音的客观性质——频率f,相应的主观感觉量S为音高感觉p,于是韦伯——费克纳定律断言:
  • p=k log f (8-3)
  • 这里,正比系数k中已包含了自然对数向以10为底对数的转换系数。于是,两个纯音F2,F1的音高感觉和音隔为
  • (8-4)
  • 就是说,感觉到的两个纯正音音高的间隔不取决于它们的频率之差,而取决于它们的频率之比。这正是第二章中制定各种音律所依据的共同基础,可以进一步确定(8-4)式里的系数K,比如,按平均律观点,系数K可这样来确定:将F1到F2=2F的音高间隔(一个八度)等分为1200份,每份称为一音分(一森特),(8-4)式给出
  • 于是:k=1200/log2=3986 森特
  • 代入(8-4)式,即得在平均律下的音调公式:
  • P=3986 log f(森特)
  • 由于一个八度通常按时高等分为12个半音,也即每个半音所对应的频率比值为21/12 ,于是一个半音的音高间隔为:
  • 韦伯——费克纳定律的另一个例子是下面第三节中所述的纯音响度问题。
  • 应当指出,韦伯——费克纳定律是唯象的定律,并没有回答(8-3)式的物理和生理机制。下面将对此作进一步叙述。

2、听觉系统简介

  • 作为分析的基础,先来简单地谈谈人类听觉系统的结构以及人脑听觉系统是怎样感知一个乐音的音调的。
  • 假定人耳听到一个频率可变的纯音,于是引起鼓膜振动。鼓膜的振动经中耳时原三个小听骨(锤骨、砧骨和镫骨),再经椭圆窗膜进入耳蜗。耳蜗是由一条骨质的管道围绕蜗轴盘旋2.5--2 3/4圈而成,开头象蜗牛壳,长约3.5cm(在图8-1(b)中已将耳蜗"拉址"了).蜗管(由前庭阶和基底膜围成)沿着耳蜗管将耳蜗管分隔成两上管子(即前庭阶和鼓阶).基底膜上存在着感音装置----毛细胞,毛细胞与耳蜗神经末梢形成突触.蜗管为一个盲管内充以内淋巴液,在它的顶端前庭阶和鼓阶内的外淋巴液可以沟通,此处叫蜗孔,在耳蜗管中充满了两种不可压缩的液体系统----内淋巴液和外淋巴液.鼓阶用圆窗的弹性膜封闭着.椭圆窗膜的振动转换成淋巴液的振动.振动便在耳蜗管中传播开来.这时基底膜象摆动的旗帜那样波动着.沿基底膜长着大约3万个接受单元(毛细胞).这些毛细胞排成内排和外排.这些接受单元将基底膜振动的信息传给和它们相接触的神经细胞.后者再将信息传递给大脑的听觉神经中枢.概略地说,感知乐音全部特征的全过程,按时间尺度可分为三个阶段:第一阶段,从开始到0.05秒左右,感知的过程是在中内耳里完成. 这基本上是个纯力学过程,第二阶段,从0.05秒到0.1秒,是听觉神经传导过程.这时,信息经听觉神经传递给大脑的听觉神经中枢.第三阶段,0.1秒以后,这是大脑听觉神经中枢全面处理乐音信息的过程.

          
3.听觉的"位置理论"

  • 在基底膜感知音高的过程中,有一个值得注意的事实,这就是,一个纯音引起基膜振动后,基底膜上最大振幅的位置和纯音频有关.就是说,对每一个频率,基底膜上都存在一个灵敏的(共振的)小区域,低频音调对应的区域靠近顶端(那里的基底膜最柔软),高频音调对应区域耳蜗的椭圆窗(那里的基底膜最硬).于是,沿基底膜上的位置x(以及对应的毛细胞和相连的神经)决定着音调的主观感觉.纯音频的改变引起基底膜共振区域位置的移动,这种位置移动就被人脑主观解释为音调的变化.实验测量了纯音频率与基底膜上对该频率最灵敏区域(共振区域)位置之间的对应关系.对成年人平均的结果是,这种对应关系见图8-2中的实线.这条曲线是"听觉位置论"的重要依据.由图可以立刻得出两条重要结论:第一,音乐中最重要的频率区间(20-4000赫兹)对应于基底膜上的区域为(12-35mm),也就是说占基底膜的2/3长度,其余很大的区间(4000-16000赫兹)则被挤入剩下的1/3区域;第二,这条曲线十分接近对数曲线,就是说,不论起始频率值为何,只要频率增加一倍(即音调从任意音开始往上提高一个八度),相应的共振区域移动一个常数距离(约3.5-4.0mm)。换句话说,是频率之比,而不是频率之差,确定着基底膜上共振区域的移动.简单地说,人耳对音高的控测过程是一个对频率"取对数"的过程.这正是音律划分和八度泛化以及听觉韦伯----费克纳定律等规律的物理和生理学基础.

                 

4.听觉"位置理论"的补充

  • 实验上发现一些听觉处理中的二阶效应,比如"主观音调"(也称"失踪的基频"见下)、“主观节拍”(也称“二阶节拍”,见下)等,它们不能为听觉的“位置理论”所解释,然而,这并不是简单地意味着位置理论是错误的,只是说明位置理论需要扩充。现在从实验出发简略地介绍一下这个补充理论,在8.4节中将用实例予以说明。
  • 通过在耳蜗神经纤维中植入微型电极(可以做到不影响细胞的正常功能),实验发现,神经信号是一些随机发射的电压为几十毫伏的电脉冲,每个脉冲的持续时间零点几个毫秒。这些脉冲按时间顺序形成随机的神经脉冲序列。这个序列所携带的信息包括两个方面:一是平均的脉冲发射率;另一是脉冲随时间和疏密分布的方式。实验还发现,振动中每当耳膜向外运动的半周内(对应耳管中压力下降、基底膜向上运动的半周),相应位置上的神经纤维中的脉冲发射率增加,在脉冲序列里,这段时间称为“开”;每当耳膜振向内,耳管夺压力增加,基底膜向下运动,神经脉冲的发射率减少,这段时间称为“关”。于是脉冲序列呈现疏密相间的模式,这里应当强调指出,由于乐意地并不一定都是频率一定的纯音,谐波叠加的结果使鼓膜向外的时间间隔和鼓膜朝里的时间间隔不相等,甚至相邻的两段鼓膜向外的时间间隔也不相等,这不但使得脉冲序列的“开”和“关”的时间段不相等,而且相邻的两个“开”的时间段也不一定相等。总之,一个复音所对应的神经脉冲序列除有一个固定的平均发射率之外,还有着由各种长短的“开”,“关”(或脉冲“密”、“疏”)时间间隔组成的复杂的周期结构,其中,“开”序列的周期性代表重复率的信息,而结构则给出合成振动的振动方式信息。然而,对于高频声波,振动周期已是毫秒量级,以至于即使在每个“开”的时间间隔里,都未见得能有一个神经脉冲出现,上述那些基于统计平均的分析便会因涨落误差太大而失败。
  • 因此,除了“位置理论”所主张的:激活的神经纤维的空间位置(更准确些说是空间分布)记录着音高的信息之外(这一功能对整个音频范围或整个基底膜都存在),对低频音域,在基底膜的靠近耳蜗顶部,神经脉冲序列还荷载着重复率和振动方式的信息。

5.听觉系统对音高的分辨能力

  • 在控测音高变化中,也就是研究听觉系统对频率的分辨能力里,常用“觉察阈”(英文缩写为jnd)这个量,它是听觉系统则能觉察出的频率最小变化。当一个乐音的强度固定为80分贝,频率连续缓慢地改变时,平均的jnd-f曲线接近一条斜率为0.5%的直线。于是,就整个音频区间的平均而言,听觉系统对频率的相对分辨率(定义为 )大体为0.5%。例如,人耳把(2000+/-10)赫兹范围内的音都当成一个纯音。由此,再根据前面的基底膜数据,可以得到基底膜上0.5%相对分辨率对应的听觉神经细胞数目Δn,即:对于两个频率相对差值为0.5%的纯音f1和f2,它们在基底膜上共振区位置之差为Δx=x2-x1,于是(利用频率增加一倍,位置移动约3.5mm),
  • 由于在整个长为35mm的基底膜上附有约3×104个神经细胞,最后可得
  • 这就是说,听觉神经在功能上并非单个行动,而常以常∽20个为一组起作用。两个不同音高的音对应基底膜上两上不同的区域,若两区域间距内的神经细胞数目显著小于这个值,两个音的音高便不可区分。在低频音域,jnd-f曲线的相对分辨率变坏,比如在100赫兹时达到3%
  • 不幸的是,jnd不仅依赖于频率,也依赖于音强、声音持续时间以及频率改变时的突变程度(频率的变化越突然,分辨率就越好)。特别是,它还在很大程度上依赖于个人甚至依赖测量方法。因此,有的工作也引用如下两个定义:一是“神经量子”,定义为这样一个频率差值,若两个纯音的频率相差不大于这个差值,则人们的听觉系统不能感觉出这两个纯音音高的差别。另外,还有一个差值,定义为:如果频率相差不小于这个差值,相应的音高变化总是可以分辨的。这个差值大体是神经量子的两倍:若频率差值位于这两个阈值之间,可分辨的几率在0和1之间,然而,在一般的研究中,可以忽略这两个差值之间的差别。

6、纯音叠加中的叠加效应——一阶和二阶拍、监界带及“失踪”的基频

  • 这里谈谈听觉系统对几个纯音叠加的感觉,或称为叠加效应,首先要指出,叠加效应,按照它们是在听觉系统的哪一部分被处理而区分为两类:如果是在耳蜗里沿着基底膜作为力学过程被处理的,便称之为一阶叠加效应,它们容易识别也容易进行心理声学实验;如果是由听觉神经处理的,就较难于进行准确测量和描述,称之为二阶叠加效应,下面将分别举例说明。
  • 一阶拍现象和二阶拍现象。考虑两个频率分别为f1,f2初位相分别为a1,a2的纯音,为简化起见,假设它们的振幅相等。如果它们同时发音,利用三角函数的和化积公式立即可得叠加振动
  • Acos(2Лf1t+a1)+Acos(2Лf2t+a2)
  • =2Acos 0.5[2Л(f2-f1)t+(a2-a1)].
  • ·cos 0.5[2Л(f2+f1)t+(a2+a1)] (8-6)
  • 先讨论两个一度音程的纯音,当它们调音不准时所产生的一阶拍现象。设f2与f1的小偏差为Δf,则称这个差频为拍频fB
  • fB=Δf=f2-f1
  • 当Δf=0时,两个纯音完全和谐:随着Δf缓慢增加,若Δf仍小于jnd值,两个纯音在基底膜上相应的共振区域彼此靠近到约20个听觉细胞以内,人耳听到的仍是一个纯音。合成振幅强度由上式第一个因子决定,也就是由初位相差值决定:如(a2-a1)=x,相消叠加,(a2-a1)=0,相长叠加,接Δf增在到超达jnd值(但仍小于下面所说的ΔfD)。人耳听到的仍是一个纯音(只是音调略有提高:f=f1+Δf/2)。但由于振幅被明显地调制,响度出现周期性的涨落(周期为1/Δf)。这便是拍的现象,或称为一阶拍现象(见图8-3(a))。这是一度音程失谐造成振幅调制的结果,它是在中耳鼓膜上以及内耳基底膜上两个振动叠加的纯力学过程。由于一阶拍现象消失便意味着两个频率相等,一阶拍现象被广泛地用于乐器的调音。八度音程失谐所产生的二阶拍现象与一度音程失谐所产生的一阶拍现象完全不同,当f2的数值比2f1数值小几个赫兹时,人耳感到有拍现象存在,而且拍频就是这个差值。当f2增大到等于2f1时,拍的感觉消失。当f2增大到大于2f1几个赫兹,拍的感觉再度出现。这就是二阶拍现象。很难描述这时的拍是什么,因为这时合振幅并没有受到调制受到调制的只是合振动的振动方式(见图8-3(b))。
                   
  • 它表明:听觉系统不仅能检测振动的振幅和频率,而且还能够检测振动样式的周期变化。不仅如此,实验还证明:将这两个失谐的八度音程的音同时各自送入不同的耳朵里,二阶拍现象依然存在。这意味着叠加过程并不是在任何一只耳朵的基底膜上完成的力学过程,而是听觉神经系统处理的结果,它是一个二阶叠加效应(关于这类效应下面“失踪的基频”里还将谈及)。因此也称二阶拍现象为“主观节拍”。以上这些都是“位置理论”所难以解释的。实际上,这个“主观节拍”的信息正是被神经脉冲序列长长短短的“开”间隔的周期结构所荷载着。
  • 监界带ΔfCB问题,现在再返回到一度音程失谐的总是上来,当Δf∽10赫兹时,一阶拍的感觉特别明显。当Δf超达15-20赫兹之后,人耳使不再能爱个地追随这些快速的响度涨落,拍的感觉逐渐消失,代之以粗糙和不愉快的感觉。Δf继续增大,内耳基膜上的两个共振区域分隔得足够开,开始感觉到是两个固定响度的纯音。这时的频率差为频率甄别极限ΔfD(注意,ΔfD和jnd不同,后者单音的鉴别,前者是复音的鉴别。ΔfD大约是jnd的30倍!就是说,人们能够感知纯音的十分微小的频率变化,但对同时发音的两个纯音的频率差别的判断能力却差得多)。随着Δf再继续增加,达到或超过“监界带”ΔfCB,两个音相互干涉产生的粗糙和不愉快的感觉才完全消失,代之以两个平滑、偷快的纯音感觉。当然,ΔfD和ΔfCB都有一定程度的模糊,但ΔfD肯定大于半音*,在高频和低频两端,它甚至大于一个全音。至于ΔfCB,在高频范围里,它在一个全音和一个小三度之间;在低频范围里,它增加到大于一个小三度,甚至大于一个大三度音程(这就是为什么在很低的低音音域,一般不采用三度音作音调组合的缘故)。如果粗略些说,监界带宽约为1/3个八度音程。
  • “失踪的基频”问题,有两个纯音f1和f2。假定它们的振幅相等、初位相相同、频率之比为2:3,即 。两个振动叠加之后,合成图形用粗线表示。由此粗线可以看出,存在一个振动周期TO,对应的频率为:

              

  • 这个周期很容易检查出来,根据f1/f2=2,f2/f0=3,可得:
  • Acos[2Лf1(t+T0)]+Acos[2Лf2t+T0)]
  • =Acos(2Лf1t)+Acos(2Лf2t) (8-8)
  • 这个f0比f1低一个八度,对于f1和f2来说,f0是基频,然而它原先并不存在,是f1和f2“合成”出来的。这个f0常被称为“失踪的基频”或“主观的”音调。之所以这样称呼,主要还是因为:人们感觉到它的存在实在是神经系统处理的结果,并非基膜上振动叠加的物理实在。或者说,感觉f0存在是二阶叠加效应的结果。这可用以下几种实验来证实:第一,同时将f1 以及另一个f0稍有差别的f3送入同一只耳朵,如果这个“失踪的基频”f0是内耳中的一种真实的物理振动,则应和这个f3叠加,并出现拍的感觉。实验结果表明没有出现的感觉;第二,将f1 这两个纯音以及另一个适当强度的带状频谱的噪音(这个噪音的频谱在包括f0的一个区间内几乎连续分布)同时送入一只耳朵。噪音将引起基膜上对应f0的那段位置振动,使得基膜无法探测这个f0的振动。实验结果,对f0的感觉依然存在;第三,将F1用耳机送入一只耳朵,同时用耳机将f2送入另一只耳朵。这时每只耳朵的基膜都只有一种振动,都不存在振动的叠加。结果依然感觉f0的存在,显然,f0存在的信息是由两只耳朵的两组神经脉冲充序列协同荷载着并由大脑听觉中枢处理的结果。
发表评论

微信扫码关注公众号