在真实车辆和模拟环境中将听觉图标用作紧急警报

TL;DR;

  • 在 Graham 的经典模拟器研究中,用听觉图标(喇叭声和轮胎打滑声)替代抽象的蜂鸣音,使驾驶员平均提前约 0.1 秒踩下刹车。1
  • 代价是:这些图标也使在非碰撞情境中的”误报”制动率翻倍,反映出更激进的决策偏置。
  • 喇叭图标既反应快又在主观评价中得分很高;轮胎打滑图标反应也快,但被认为不太合适且更令人惊慌。
  • 通过精细调节声音参数(响度、音高、起始特性、持续时间),可以在保留图标带来的速度优势的同时减少不必要的制动。
  • 喇叭类警告不必局限于汽车:自行车上的”汽车级喇叭”(如 LoudBicycle.com 的 Loud Mini)可以作为同类型的过度学习安全信号,为弱势道路使用者提供保护。

为什么声音是如此优秀的紧急通道

在碰撞中,毫秒都很关键。声音有几种“超能力”,使其成为车内紧急警报的理想媒介:1

  • 它具有侵入性。 如果你的眼睛正忙,你可以忽略闪烁的灯光,但你无法对突然出现的声音“移开视线”。
  • 它不占用眼睛和双手。 即便视觉系统和双手正紧盯方向盘、后视镜和道路,你仍然可以感知到警报。
  • 反应时间通常更短。 在许多条件下,人们对听觉信号的反应比对视觉信号更快。

大多数量产系统仍然依赖相当原始的音频:单频蜂鸣、蜂音器,或者一小段语音提示。这些易于工程实现,但并不是我们平时聆听世界的方式。

Graham 1999 年的论文提出了一个看似简单的问题:如果我们不用通用音调,而是使用实际类似现实世界事件的声音会怎样?1 这一想法直接源自 William Gaver 最初提出的 听觉图标 概念,即作为界面中“对自然发生声音的漫画式夸张”。2


什么是”听觉图标”,为什么它们重要?

Gaver 的听觉图标框架区分了声音与意义之间不同的映射关系:2

  • 因果图标(Nomic icons)——事件本身的直接录音 / 漫画式夸张(例如,用哐啷声表示某物掉落)。
  • 隐喻图标(Metaphoric icons)——声音结构映射到某种属性(例如,上升的音高表示”数量增加”)。
  • 符号图标(Symbolic icons)——文化习得的联想(例如,警笛声表示”紧急服务”)。

这些与 耳标(earcons) 形成对比,后者是抽象的小型音乐动机,其意义完全依赖学习。2

在交通环境中,喇叭可以说是我们最过度学习的听觉图标:

  • 它在符号上与”现在有问题”紧密相连。
  • 它通常来自另一辆车,因此隐含一种社会意义(“我需要你注意我或改变你的行为”)。
  • 它在频谱上被设计为能穿透发动机和路噪。

汽车喇叭,或者安装在自行车上的”汽车级喇叭”——例如 LoudBicycle.com 的 Loud Mini,本质上赋予自行车与汽车相同的声学特征——完美地归入这一类别:一种”这里有一辆你绝不能忽视的车辆”的听觉图标。

Graham 的假设是:像这样的图标,作为紧急警告,应当比通用音调或短语音消息更快、更易于理解。1


实验内部:模拟碰撞并监听制动反应

Graham 搭建了一个实验室研究,使用一辆固定的 Ford Scorpio 改装成简单的驾驶模拟器。1

参与者

  • 24 名持证驾驶员,在性别和年龄上平衡:
    • 6 名 35 岁以下男性
    • 6 名 35 岁以上男性
    • 6 名 35 岁以下女性
    • 6 名 35 岁以上女性
  • 听力正常,视力正常或矫正正常。
  • 至少一年定期驾驶经验。

警告声音

比较了四种警告:1

  1. 音调(Tone)——600 Hz 合成锯齿波蜂鸣,持续 0.7 秒。
  2. 语音(Speech)——一名女性用平静而坚定的语气说 “ahead”。
  3. 喇叭(Horn)——车内真实录制的汽车喇叭声(符号型听觉图标)。
  4. 轮胎打滑(Tyre-skid)——从一款驾驶游戏中采样的风格化“轮胎打滑”声(隐喻 / 因果型听觉图标)。

四种声音均:

  • 被归一化到大致相同的持续时间(0.7 秒)。
  • 被归一化到相似的响度(在驾驶员头部位置约 59–63 dB(A),比背景发动机噪声高约 10–15 dB)。

因此响度和长度被控制,而其他特征(音高、频谱内容、包络)保持自然,以保留可辨识性。

驾驶情境

驾驶员观看投影在车前方的前视道路视频,同时背景播放恒定 30 mph 的发动机声音。1

三种类型的真实碰撞事件:

  1. 前方静止车辆——驾驶员接近同车道内一辆停着的车。
  2. 左侧驶出——一辆车从左侧支路驶出。
  3. 右侧驶出——同样情形,但从右侧驶出。

此外还有与之布局相似但不会发生碰撞的**虚假(dummy)**片段(例如,支路口可见一辆车但并不驶出)。

时间细节:1

  • 每段视频:总长 12 秒。
  • 前 7 秒:接近阶段。
  • 然后在距碰撞时间(TTC)2 秒时,将最后一帧冻结 5 秒。
  • 警告声音在冻结点前 1.4 秒 播放,因此在警告开始时的 TTC 约为 3.4 秒。
  • 驾驶员的任务:持续执行一项高负荷的低头跟踪任务,在仪表盘上的小 LCD 上用鼠标将光标移入移动的方框,只有在听到警告时才抬头 / 制动。

指令:

  • 如果判断碰撞迫在眉睫:尽快踩下刹车踏板
  • 如果不是:什么也不要做

这模拟了一种注意力不在前方道路上的情境——恰恰是前向碰撞警告系统必须发挥作用的典型场景。

测量指标

每次试验记录:1

  • 制动反应时(BRT)——从警告开始到首次踩刹车的时间。
  • 假阳性(False positives)——在没有碰撞的情况下踩刹车(虚假片段)。
  • 漏报(Misses)——在存在迫近碰撞时未踩刹车。
  • 主观排序——实验结束后,驾驶员对每种警告在各情境下的适切性进行排序并给出评论。

研究实际发现了什么

1. 听觉图标反应更快

平均而言,当警告是听觉图标(喇叭或轮胎打滑)时,驾驶员的制动速度比使用音调或语音时更快。

大致平均制动反应时:1

警告类型平均 BRT (s)SD (s)
喇叭听觉图标0.740.18
轮胎打滑听觉图标0.750.23
音调抽象非语音0.810.19
语音 “ahead”语音0.860.21

0.1–0.12 秒的优势听起来不大,但在 30 mph 时,车辆在这段时间内大约会行驶 1.3–1.8 米——足以将一次轻微追尾变成一次有惊无险的擦肩而过。

碰撞情境类型(静止车辆 vs 驶出)本身并未改变平均反应时间,但存在交互效应:语音警告在侧向驶出情境下尤其慢,这表明在复杂视觉变化下,即便解析一个单词也会耗费宝贵时间。1

年龄和性别趋势符合预期(年轻和男性驾驶员略快),但统计上不显著。

2. 图标引发更多”误报”制动

速度优势伴随着代价:在不需要制动时更多地踩刹车。

在虚假片段中的误报制动率:1

  • 喇叭: 15.6% 的虚假试次
  • 轮胎打滑: 15.6%
  • 语音: 8.3%
  • 音调: 9.4%

漏报(在真实碰撞中未制动)整体很少(1.3%),且在不同警告类型之间差异不大。1

信号检测理论分析表明,听觉图标将驾驶员推向更宽松的反应标准:他们更愿意基于”如果我听到这个声音,它很可能意味着麻烦”这一假设采取行动。实际上这意味着:

  • 图标并未让人们忽视真实危险。
  • 相反,它们使人们将模糊情境视为危险情境,从而导致更多不必要的制动。

这种权衡——更快的反应但更多误报——在其他关于喇叭类和”逼近(looming)“碰撞警告的研究中也被重复验证。34

3. 驾驶员喜欢喇叭,对轮胎打滑则看法不一

适切性主观排序(1 = 最佳,4 = 最差):1

警告车辆驶出(平均排序)静止车辆(平均排序)
喇叭1.632.29
轮胎打滑2.882.67
语音2.631.96
音调2.833.04

模式:

  • 喇叭整体上被评为最合适,尤其是在驶出情境中。
  • 对于前方静止车辆,语音在适切性上略胜一筹,喇叭紧随其后。
  • 音调始终最不受欢迎。
  • 轮胎打滑评价分化:有些人喜欢其真实感,另一些人则认为它音质差、令人困惑或过于惊吓。

评论:1

  • 喇叭:真实、易于理解,“能让我迅速反应”;有时会与其他车辆鸣笛混淆。
  • 轮胎打滑:真实但刺耳或吓人;有时不清楚究竟发生了什么。
  • 语音 “ahead”:方向清晰,但过于平静,不够紧迫。
  • 音调:声音小、乏味,且与任何特定危险的联系不明确。

为什么喇叭类图标如此有效

本研究中的喇叭很好地说明了为什么听觉图标在紧急情况下可以优于音调和语音。15

  1. 已有的语义联结

    驾驶员已经将喇叭声与他人发现危险或冲突联系在一起。碰撞预警系统利用了这种预先布线的映射,而不是重新教授一个新含义。

  2. 社会紧迫性

    喇叭传达社会压力:有人在主动要求你注意。这种紧迫感与中性的仪器音调不同,大脑对其处理方式也不同。

  3. 频谱设计

    道路和发动机噪声主要集中在低频和宽带范围。喇叭被有意设计为位于能从这种噪声“汤”中突出的频谱区域——即便在相同名义 dB 水平下也是如此。

  4. 双向意义

    同一种声音可以作为:

    • 输出:驾驶员鸣笛(或装备 Loud Mini 的骑行者鸣笛)警告他人。
    • 输入:碰撞预警系统播放喇叭类图标来警告

    这种双重角色可以强化我们将该声音快速解读为“可能需要制动或规避动作”。

轮胎打滑图标具有其中一些优势(它听起来像是紧急制动),但也存在一些问题:

  • 它可能被误读为“我的轮胎在打滑”而非“别人正在制动”。
  • 它与失控相关,可能诱使驾驶员转向或过度反应。
  • 来自电子游戏的低保真录音让人感觉不太可信。

更大的设计启示:不仅要选图标,还要调图标

Graham 展示了一个经典的速度–错误权衡

  • 图标更快更直观,但有更多不必要反应的风险。
  • 抽象音调和短语音更慢,但引发更保守的行为。1

后续工作大多证实了这一模式,并将重点放在如何调校图标,而不是放弃它们:

  • Belz 等人表明,在前后向和侧向碰撞中,听觉图标相较传统警告改善了避撞表现,但也增加了不必要的规避动作。5
  • Gray 证明,逼近声和非逼近的汽车喇叭都能加快制动,但喇叭尤其会提高误报制动率。3
  • Wu 等人系统地改变前向碰撞警报的频谱和时间特性,发现动态、更加”危险指示性”的声音支持更快制动和更好的 TTC 余量。6
  • Song 等人发现,压缩和音高动态可以让听觉图标既更快又具信息性,但动态与”危险 vs 避免”意义之间的具体映射很关键。7
  • Cabral 和 Remijn 更一般地研究了听觉图标的设计空间,展示了包络、持续时间和频谱线索如何塑造人们对底层事件的解读。8

实际结论:

  1. 控制紧迫性参数

你可以调节:

  • 响度:更响 = 更紧迫,但更烦人 / 更易惊吓。
  • 音高与频谱:更高、更复杂的频谱更能穿透噪声,但可能刺耳。
  • 起始特性(Onset):突兀的起始感觉更紧急,但有惊吓反应风险。
  • 动态:逼近(强度逐渐增强)和压缩图标可以提升紧迫感和清晰度。37
  1. 不仅要测反应时间,还要测误解

你需要了解:

  • 驾驶员听到声音时看向哪里。
  • 他们是制动、转向还是僵住。
  • 他们是否误读事件(“是我在打滑?“还是”别人有情况?”)。
  1. 考虑文化和情境

喇叭图标在喇叭使用普遍且声学标准化的环境中效果最佳。在其他情境中,例如车道偏离,路肩震动带或碎石声可能更直观。6

  1. 参数化图标以传达更丰富信息

现代研究指向参数化听觉图标:

  • 响度 = 紧迫性(TTC 越短 → 图标越响)。
  • 空间化 = 方向(左、右声道)。
  • 音色 = 对象类型(卡车 vs 小汽车 vs 弱势道路使用者)。例如,碰撞预警系统可以用特定喇叭音色指示附近有自行车——与现实交通中装备 Loud Mini 的自行车所做的非常类似。

这相当于听觉领域的良好视觉图标设计:一组直观、可区分且一致的图标家族。


超越汽车:自行车、行人和混合交通

图标而非音调的角度思考,更容易跨出不同交通方式:

  • 在车辆中:

    • 前向碰撞警告 → 喇叭类或逼近类图标。
    • 车道偏离 → 路肩震动带图标。
    • 路口通行辅助 → 横向来车的发动机或轮胎声。69
  • 对于弱势使用者:

    • 配备汽车级喇叭的骑行者——再次以 LoudBicycle.com 的 Loud Mini 为例——实际上在广播与汽车相同的听觉图标:“这里有一辆车;请按此对待”。
    • 如果驾驶辅助系统学会将这种喇叭音色视为一种语义事件,它们就可以在盲区或夜间优先检测自行车。

由于喇叭类图标已经被高度赋义为“注意,否则会出事”,将其系统性扩展到自动化警告中,可以在不强迫任何人学习全新声音语言的前提下提升道路安全。


车辆中听觉图标的相关研究

Graham 的论文位于三个研究方向的交汇处:基础听觉图标理论、应用型碰撞警告,以及现代多模态自动化研究。

一个非常简短的路线图:

  • 听觉图标的基础

  • Gaver 定义了听觉图标,并主张使用日常声音而非音调来表达系统事件。2

  • 后续综述(例如《Sonification Handbook》中)将其扩展为完整的图标家族与映射设计框架。10

  • 早期碰撞警告图标

  • Belz 等人提出了”复杂系统的一类新型听觉警告信号:听觉图标”,并表明图标在类碰撞任务中改善了表现,但必须调校以避免烦扰性警报。5

  • Graham 将这一思想直接应用于车载碰撞避免,使用喇叭和打滑声。1

  • 逼近与运动型警告

  • Gray 将逼近听觉警告与非逼近的汽车喇叭进行比较,发现逼近声和喇叭类图标都能加快制动,但逼近声在速度–错误权衡上整体更优。3

  • 后续工作探讨警告是否必须在语义上与碰撞事件绑定,结果表明动态”运动”线索有时可以优于严格语义关联的声音。4

  • 现代车辆中的前向碰撞警报

  • Wu 等人在模拟器中评估了不同听觉前向碰撞警报设计,量化了声音特性如何影响制动、TTC 和主观评价。6

  • MacDonald 等人强调了背景噪声(音乐、谈话广播等)如何调制图标、spearcon 和语音的有效性——这是实际部署中的关键因素。11

  • 近期图标设计与面向自动化的工作

  • Cabral 和 Remijn 描述了听觉图标的物理设计参数(持续时间、起始、频谱内容),提供了具体设计指导。8

  • Song 等人表明,当语义意义清晰时,压缩且高度动态的听觉图标可以显著提升驾驶表现和感知紧迫性。7

  • Li 和 Xu(ICMI 2024)比较了听觉图标、耳标、语音和 spearcon 作为自动驾驶接管请求,发现典型张力:语音在主观上更受偏爱,但更”图标化”或压缩的提示往往带来更快、更可靠的接管。12

贯穿所有这些研究的模式是:Graham 的基本观察——喇叭类听觉图标会产生快速但有时偏激的驾驶反应——在车辆逐步走向半自动化的过程中依然相当稳固。


对设计师和工程师的启示

如果你在设计紧急警告——无论是用于汽车、自行车、医院设备还是工业系统——这套研究表明:

  1. 从图标而非音调开始。 使用与事件本身已经接近的声音:喇叭、路肩震动带、撞击、打滑等。
  2. 先归一化响度和持续时间,再调校。 这正是 Graham 的做法:先平衡显而易见的参数,再在音色、动态和空间化上迭代。1
  3. 同时测量速度和错误。 更快的制动只有在不会大幅增加误报或引发不安全操作时才是好事。
  4. 考虑背景噪声和情境。 在安静实验室中有效的警告,可能会被真实车辆中的音乐或路噪掩盖。11
  5. 纳入主观反馈和接受度。 接受度研究(如卡车司机)表明,即便表现良好的图标,如果驾驶员觉得困惑或恼人,也可能失败。13
  6. 像对待任何 UI 一样迭代。 将警告声音视为界面设计的一部分,而不是硬件之后随意附加的东西。

我们的耳朵已经精通日常物理世界的“语言”。那些用这种语言——利用喇叭、打滑等图标——进行交流的紧急系统,相比只会“滴滴”作响的系统,天然就占据优势。


参考文献

Footnotes

  1. Robert Graham, “Use of auditory icons as emergency warnings: evaluation within a vehicle collision avoidance application,” Ergonomics 42(9), 1233–1248 (1999). doi:10.1080/001401399185108. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

  2. William W. Gaver, “Auditory Icons: Using Sound in Computer Interfaces,” Human–Computer Interaction 2(2), 167–177 (1986). doi:10.1207/s15327051hci0202_3. 2 3 4

  3. Rob Gray, “Looming Auditory Collision Warnings for Driving,” Human Factors 53(1), 63–74 (2011). doi:10.1177/0018720810397833. 2 3 4

  4. Rob Gray, “Does the Warning Need to Be Linked to the Collision Event?,” PLOS ONE 9(1): e87070 (2014). doi:10.1371/journal.pone.0087070. 2

  5. Steven M. Belz, Gary S. Robinson, John G. Casali, “A New Class of Auditory Warning Signals for Complex Systems: Auditory Icons,” Human Factors 41(4), 608–618 (1999). doi:10.1518/001872099779656734. 2 3

  6. Xingwei Wu, Linda Ng Boyle, Dawn Marshall, West O’Brien, “The effectiveness of auditory forward collision warning alerts,” Transportation Research Part F: Traffic Psychology and Behaviour 59, 164–178 (2018). doi:10.1016/j.trf.2018.08.015. 2 3 4

  7. Jiaqing Song et al., “Danger or avoidance indication: Dynamics interact with meaning in auditory icon design,” Accident Analysis & Prevention 170, 106675 (2022). doi:10.1016/j.aap.2022.106675. 2 3

  8. João Paulo Cabral, Gerard Bastiaan Remijn, “Auditory icons: Design and physical characteristics,” Applied Ergonomics 78, 224–239 (2019). doi:10.1016/j.apergo.2019.02.008. 2

  9. Xingwei Wu et al., “Auditory Messages for Intersection Movement Assist (IMA) Systems,” Human Factors 62(3), 354–372 (2020). Abstract/links via Human Factors journal.

  10. Thomas Hermann, Andy Hunt, John G. Neuhoff (eds.), The Sonification Handbook, Chapter 13: “Auditory Icons” (2011). https://sonification.de/handbook.

  11. Justin S. MacDonald et al., “Toward a Better Understanding of In-Vehicle Auditory Warnings and Background Noise,” Human Factors 61(5), 771–789 (2019). (Open-access via many institutional links.) 2

  12. Xuenan Li, Zhaoyang Xu, “The Impact of Auditory Warning Types and Emergency Obstacle Avoidance Takeover Scenarios on Takeover Behavior,” Proceedings of ICMI ‘24 (2024). doi:10.1145/3678957.3686252.

  13. Johan Fagerlönn, “Making Auditory Warning Signals Informative: Examining the Acceptance of Auditory Icons as Warning Signals in Trucks,” in Proceedings of the 6th International Driving Symposium on Human Factors in Driver Assessment, Training and Vehicle Design (2011 / reported 2017). doi:10.17077/drivingassessment.1383.

Related Articles

右转钩形碰撞:为什么在路口即使有保护车道仍然会致命

受保护的自行车道可以在路段中间挽救生命,但许多严重碰撞仍然发生在路口。以下是右转钩形碰撞依旧致命的原因——以及更优秀的设计加上 Loud Bicycle 喇叭等工具如何提供帮助。

阅读更多 →

不是电动自行车的问题,而是占据自行车道的电动摩托车。

为什么那些可怕的“电动自行车”事故通常其实是伪装成电动自行车的电动摩托车所致——以及如何通过执行现有的分类规则,在不禁止真正电动自行车的情况下解决这一问题。

阅读更多 →