摘要(TL;DR)
- 大脑利用三大线索来完成声音定位:双耳之间极其微小的时间差、声级差,以及由外耳形状产生的细微频谱指纹。[^^1]1
- 这些线索只有在声音具有足够的带宽——也就是包含较宽频率范围时——才工作良好。纯音”哔”声和单一音调要难以定位得多。[^^3]2
- 耳廓(可见的外耳部分)就像一个三维声学天线,会根据声音来自前后、上下的不同方向,对声音进行不同的塑形。[^^5]3
- 在回声丰富的真实环境中,大脑利用优先效应来锁定最先到达的声音,这对于判断喇叭声真正来自何处至关重要。[^^7]4
- 类似汽车喇叭的声音特别有效,因为它们既是宽带的,又能被瞬间识别为”道路危险”。模仿这种音色的自行车喇叭,调动的是同一套定位与识别机制。[^^9]5
在我们的第一篇关于声音与反应时间的文章中,我们讨论了听觉系统如何直接接入战斗或逃跑通路,并在速度上胜过视觉。这第二篇文章则追问驾驶员和骑行者真正关心的下一个问题:
一旦你听到喇叭声,你如何知道它是从哪里传来的?
要理解为什么有些喇叭比另一些好用得多,我们需要拆解大脑如何仅凭两只耳膜上的压力波重建三维空间。
1. 三个维度,三类线索
听觉定位要恢复三件事:左右、上下和远近。神经系统通过三大类线索来解决这一问题:[^^1]1
- 双耳时间差(Interaural Time Differences, ITDs)——声音到达两耳的时间存在极其微小的差异。
- 双耳声级差(Interaural Level Differences, ILDs)——主要出现在高频,由”头部阴影”造成的响度差异。
- 单耳频谱线索(monaural spectral cues)——由耳廓和头部对声音进行方向依赖的滤波,在声音频谱中刻下细微的峰谷。
三者是互补的:
这种组合有时被称为声音定位的双重理论(duplex theory):低频依赖相位/时间线索,高频依赖声级线索,再叠加耳廓频谱指纹。[^^3]
从安全信号的角度,已经可以得出一个关键结论:
如果你想要一个能让人快速、准确定位的喇叭,它必须向这三套系统——时间、声级和频谱——都提供可用的信息。
这正是宽带、类似汽车喇叭的声音所做到的。
2. 双耳时间与声级:水平“方向盘”
想象一个喇叭在你右侧鸣响。由于两耳相距约 18–20 厘米,声音会稍早、稍响地到达右耳,再到左耳。大脑能以惊人的精度检测这两种差异。[^^1]1
2.1 双耳时间差(ITDs)
- 对于一个正侧方声源,ITD 大约在600–700 微秒(百万分之一秒)量级。[^^1]
- 脑干中的特殊神经元充当同时性检测器(coincidence detectors),当来自两耳的输入同时到达时放电最强;这些神经元群体的活动模式编码了方位角(左右位置)。
ITD 在约 1.5 kHz 以下的频率表现最佳,此时声波波长相对头部尺寸较长,相位差不易产生歧义。[^^3]
2.2 双耳声级差(ILDs)
在更高频率下,你的头会形成一个声学阴影。来自右侧的声音在左耳会明显更弱:
- 在最高可听频率处,ILD 可超过20 dB。
- 当 ITD 在高频变得含糊时,听觉系统将 ILD 作为侧向位置的重要线索。[^^2]7
综合起来,ITD 和 ILD 为大多数自然声音提供了相当准确的水平“方位”。但它们也有盲点:
- 纯音(单一频率的“哔”声)在低频时几乎不提供 ILD 信息,在高频时则可能产生含糊的模式。
- 仅靠 ITD 和 ILD 无法完全消除前后(“混淆圆锥”问题)或上下的歧义。
这时,耳廓就登场了。
3. 耳廓:你头两侧的三维声学天线
可见的耳朵部分并非只是装饰性的软骨,而是一个精心进化出的定向滤波器。
来自不同方向的声音,在进入耳道前会在耳廓的褶皱和腔体上发生反射与绕射,从而产生方向依赖的频谱着色——特定频率会以特征性的方式被增强或削弱。[^^5]3
这些频谱特征,加上头部和躯干的影响,被工程师总结为所谓的头相关传递函数(Head-Related Transfer Functions, HRTFs)——本质上是一张将”方向 → 频率响应”对应起来的查找表。[^^2]
3.1 垂直与前后定位
在人类和动物模型上的研究表明:[^^5]3[^11]
- 耳廓线索对仰角(上下)和前后辨别至关重要。
- 当耳廓形状被改变(例如通过耳模、手术,或将麦克风放在耳后)时,垂直和前后定位能力会显著下降。
- 随着时间推移,大脑可以部分重新学习新的耳廓/HRTF 映射,但表现从未能完全恢复到原始”硬件”状态。
一项 2020 年针对人工耳蜗使用者的研究显示,与标准耳后麦克风相比,加入模拟耳廓的麦克风指向性可以改善声音定位,尤其是前后判断。[^^5] 对正常听力者的更近期研究发现,耳廓能增强正前方中央区域的角度分辨率——这正是与迎面而来的交通最相关的区域。[^^6]
3.2 为什么宽带对耳廓线索至关重要
基于耳廓的频谱线索主要存在于中高频范围,此处耳朵和头部对声音的塑形最为显著。如果声音不包含这些频率,大脑就无从利用这些线索。[^^2]6
- 一个宽带噪声脉冲(如汽车喇叭)会产生丰富、与方向相关的频谱模式。
- 一个纯低频音调可能携带 ITD 信息,但几乎没有用于仰角或前后判断的频谱线索。
- 一个窄带高频”哔”声只提供有限的 ITD 信息,并且在存在反射时容易产生歧义。
这就是为什么车辆的最低限度警示声——尤其是安静的电动车——在规范中被要求包含低频和高频成分,而不是只有单一音调:它们既要易被察觉,又要易被定位。[^^10]
4. 宽带声音更易定位(也更“真实”)
从安全角度看,喇叭声音最重要的属性不仅是响度,而是人们多快、多准能判断它来自哪里。
多条研究路径得出了相同结论:[^^3]2
- 随着带宽增加,定位表现会改善。宽频范围让大脑能同时利用 ITD、ILD 以及基于耳廓的频谱线索。
- 眼动和头动研究表明,人们对宽带脉冲的定向更快、更精确,尤其是在嘈杂背景中,相比窄带或纯音信号更具优势。[^^4]
- 当使用频谱内容特别差的信号(如窄带音调)时,人们会通过更多地转头来补偿,以制造人工的运动线索,这会耗费时间。[^^3]
想想你在以下两种情况下的定位体验有多不同:
- 在嘈杂办公室里,一个单一频率的手机“哔”声从某处响起,和
- 一声宽带的拍手或喊叫。
你几乎可以“感觉到”拍手的位置;而“哔”声则似乎悬在某个模糊的方向,直到你四处张望。在交通环境中,这种模糊就意味着时间损失。
理想的喇叭声就像一束声学照明弹:**宽频、突发、信息丰富。**它应当让你的神经系统在尽可能少的毫秒内就说出“声音在那边”。
5. 真实街道充满回声:优先效应
城市街道布满反射面——建筑、车辆、路面本身。每一次喇叭鸣响都会产生直达声和一整串回声。然而,我们通常感知到的是一个单一、稳定的位置,而不是一团混乱的幻象声源。
这种稳定性来自优先效应(precedence effect,也称”首波律”)。[^^7]4
当同一声音在短时间内多次到达(延迟在几十毫秒内)时:
- 听觉系统会将它们融合为一个单一知觉。
- 感知到的方向主要由最先到达的声音主导,即便后来的回声更响。
- 因此,定位主要依附于直达声路径,而非反射声,这正是你在面对危险时所需要的。
在实际情境中:
- 来自你右侧的汽车或自行车喇叭声,会首先沿直线视距路径到达你的右耳。
- 来自墙面、停放车辆或卡车的反射声稍后到达,并在定位过程中被大幅抑制。
- 结果是在停满 SUV 的”混响峡谷”中,你仍能稳定地感到”喇叭在那边”。
宽带信号在这里再次发挥作用:清晰的起始瞬间和丰富的频谱,使听觉系统更容易识别真正的首波前沿并忽略其余部分。[^^7]4
6. 可识别的喇叭音色:定位遇上学习
到目前为止,我们主要讨论的是几何和物理。但在其之上还有一层:学习特定声音如何与自己的耳朵相互作用。
每当你在现实世界中听到汽车喇叭并看到它来自何处时,你的听觉系统都在悄悄更新一张地图:**“这就是那种喇叭音色在被我的头和耳廓滤波后,从这个方向和距离听起来的样子。”**多年下来,它学会区分:
- 属于声源本身的特征(其固有频谱和双音结构),与
- 由你的解剖结构添加的特征(前面讨论的耳廓和头部相关滤波)。
对于熟悉的、类似汽车喇叭的声音,这种习得的分离会让定位更精确。双耳之间极其微小的差异——由你独特耳形造成的细微频谱波纹和声级变化——更易被解释,因为你的大脑已经“知道”当声源移动时,频谱中哪些部分应保持不变,哪些部分应随方向改变。[^^2]728
对于新奇或合成的警示声,这种先验经验是缺失的。神经系统难以判断哪些频谱特征来自声源本身,哪些是由反射或耳廓施加的。结果往往是定位更慢、更不准确,人们更多依赖转头或视觉来消除歧义——尤其是在混响或噪声较大的街道环境中。[^^3]2
我们在关于反应时间与喇叭感知的文章中更详细地探讨了“这个声音意味着什么,我该如何反应?”这一识别层面。在这里,关键点是:可识别、类似汽车喇叭的音色不仅告诉你有事不妙——它还为定位系统提供了一个训练良好的模板可供比对。
对于骑行者而言,一个在频谱形状和双音特征上高度模仿汽车喇叭的喇叭(如 Loud Bicycle 的 Loud Mini),因此同时利用了几何和学习两方面的优势:驾驶员的大脑已经多年练习定位这一类宽带信号,可以迅速锁定其方向,往往在他们意识到声音来自自行车而非汽车之前就已做出反应。[^^9]5
7. 更安全喇叭(与更安静街道)的设计启示
综合以上内容,我们可以提出若干设计原则:
- 宽带优于”哔”声。 警示声应覆盖宽频率范围,同时包含低频和高频成分,以同时为 ITD、ILD 和耳廓线索提供信息。
- 清晰起止、短促脉冲。 明确的起始和结束有助于优先效应发挥作用,使人们能快速定位直达声,而不被长尾混响干扰。
- 音色可识别但不过度。 属于人们熟悉的”危险”类别(如传统汽车喇叭音色)的声音,有助于更快理解含义,但应保留给真正紧急情况,以避免脱敏。
- 兼顾不同用户。 听力受损者往往在某些频段保留较好敏感度;宽带信号更有可能在他们仍能听到的频段上发挥作用。
- 情境重要。 在背景噪声较高的密集城市区域,宽带喇叭有助于从噪声中”脱颖而出”——但长期目标应是整体更安静的街道,让必要的紧急声音不必与持续的轰鸣对抗。
对骑行者而言:
- 一个真正的紧急喇叭,其声音类似汽车喇叭,能在你尚未进入驾驶员视野时(盲弯、后视镜盲区、A 柱遮挡等)最大化他们快速定位并反应的可能性。
- 节制而有目的地使用,可以避免它沦为又一种恼人噪声,并保留其在生理上的”冲击力”。
归根结底,声音定位不是一个附加功能——它深深嵌入我们的耳朵、头部和大脑结构之中。那些顺应这一结构(宽带、具方向性、且瞬间有意义)的喇叭,让街上的每个人都有更大机会平安回家。
参考文献
Footnotes
-
Risoud, M., et al. (2018). “Sound source localization.” European Annals of Otorhinolaryngology. ↩ ↩2 ↩3
-
Zheng, Y., et al. (2022). “Sound Localization of Listeners With Normal Hearing: Effects of Stimulus Bandwidth.” American Journal of Audiology. ↩ ↩2 ↩3 ↩4
-
“The pinna enhances angular discrimination in the frontal horizontal plane.” Journal of the Acoustical Society of America, 2022. ↩ ↩2 ↩3 ↩4
-
Shinn-Cunningham, B. (2013). “Auditory Precedence Effect.” In Encyclopedia of Computational Neuroscience. ↩ ↩2 ↩3
-
U.S. National Highway Traffic Safety Administration (NHTSA). “Minimum Sound Requirements for Hybrid and Electric Vehicles.” Federal Motor Vehicle Safety Standards, 2013. ↩ ↩2
-
Fischer, T., et al. (2020). “Pinna-imitating microphone directionality improves sound localization and speech understanding in noise in cochlear implant users.” Journal of Clinical Medicine. ↩ ↩2
-
“Sound localization.” Wikipedia (Duplex theory overview). ↩ ↩2
-
Lemaitre, G., et al. (2009). “The sound quality of car horns: designing new representative sounds.” Acta Acustica united with Acustica. ↩