Uso de iconos auditivos como advertencias de emergencia en automóviles reales y mundos simulados
- Jonathan Lansey
- September 19, 2025
- 17 mins
- Seguridad
- factores humanos science sólida seguridad vehicular
TL;DR;
- En el clásico estudio de simulador de Graham, sustituir pitidos abstractos por íconos auditivos (un claxon y llantas derrapando) hizo que los conductores pisaran el freno ~0.1 s más rápido en promedio.1
- La compensación: estos íconos también duplicaron la tasa de frenado por “falsa alarma” en situaciones sin colisión, reflejando un sesgo de decisión más agresivo.
- El ícono de claxon fue tanto rápido como altamente valorado subjetivamente; el ícono de llantas derrapando fue rápido pero percibido como menos apropiado y más alarmante.
- Ajustar cuidadosamente los parámetros del sonido (sonoridad, tono, ataque, duración) puede conservar el beneficio de velocidad de los íconos mientras se reduce el frenado innecesario.
- Las advertencias tipo claxon no tienen por qué limitarse a los autos: un claxon de nivel automóvil en una bicicleta (como un Loud Mini de LoudBicycle.com) puede funcionar como el mismo tipo de señal de seguridad sobreaprendida para usuarios vulnerables de la vía.
Por qué el sonido es un canal de emergencia tan bueno
En una colisión, los milisegundos importan. El sonido tiene un par de superpoderes que lo hacen ideal para alertas de emergencia dentro de vehículos:1
- Es intrusivo. Puedes ignorar una luz intermitente si tus ojos están ocupados, pero no puedes “apartarte” de un sonido repentino.
- No requiere ojos ni manos. Puedes percibir una alarma mientras tu sistema visual y tus manos están concentrados en el volante, los espejos y la carretera.
- Los tiempos de reacción suelen ser más cortos. En muchas condiciones las personas responden más rápido a señales auditivas que visuales.
La mayoría de los sistemas de producción siguen apoyándose en audio bastante primitivo: pitidos de una sola frecuencia, zumbadores o quizá un breve mensaje de voz. Son fáciles de diseñar, pero no es así como normalmente escuchamos el mundo.
El artículo de Graham de 1999 plantea una pregunta engañosamente simple: ¿qué pasaría si, en lugar de tonos genéricos, usáramos sonidos que realmente se parezcan a eventos del mundo real?1 Esa idea viene directamente de la propuesta original de William Gaver de íconos auditivos como “caricaturas de sonidos que ocurren naturalmente” para interfaces.2
¿Qué son los “íconos auditivos” y por qué importan?
El marco de íconos auditivos de Gaver distingue entre diferentes mapeos entre sonido y significado:2
- Íconos nómicos – grabaciones directas / caricaturas del propio evento (p. ej., un estrépito para representar que algo se cae).
- Íconos metafóricos – sonidos cuya estructura se mapea a alguna propiedad (p. ej., tono ascendente que significa “cantidad en aumento”).
- Íconos simbólicos – asociaciones aprendidas culturalmente (p. ej., una sirena de policía que significa “servicios de emergencia”).
Estos contrastan con los earcons, que son pequeños motivos musicales abstractos cuyo significado es completamente aprendido.2
En el tráfico, un claxon es probablemente el ícono auditivo más sobreaprendido que tenemos:
- Está simbólicamente vinculado a “algo está mal justo ahora”.
- Normalmente proviene de otro vehículo, así que conlleva un significado social implícito (“necesito que me notes o que cambies lo que estás haciendo”).
- Está diseñado espectralmente para sobresalir entre el ruido del motor y de la carretera.
Un claxon de auto, o un claxon de nivel automóvil en una bicicleta—como un Loud Mini de LoudBicycle.com, que esencialmente le da a una bicicleta el perfil acústico de un auto—encaja perfectamente en esta categoría: un ícono auditivo de “hay un vehículo aquí que no debes ignorar”.
La hipótesis de Graham: íconos como este deberían ser más rápidos y fáciles de interpretar como advertencias de emergencia que tonos genéricos o mensajes de voz breves.1
Dentro del experimento: simulando colisiones y escuchando los frenos
Graham construyó un estudio de laboratorio usando un Ford Scorpio estacionario convertido en un simulador de manejo sencillo.1
Participantes
- 24 conductores con licencia, balanceados por sexo y edad:
- 6 hombres menores de 35
- 6 hombres mayores de 35
- 6 mujeres menores de 35
- 6 mujeres mayores de 35
- Audición normal y visión normal/corregida.
- Al menos un año de experiencia regular de conducción.
Los sonidos de advertencia
Se compararon cuatro advertencias:1
- Tono – un pitido sintético de diente de sierra de 600 Hz, de 0.7 s de duración.
- Voz – una voz femenina diciendo “ahead” en un tono calmado pero firme.
- Claxon – una grabación real dentro del auto de un claxon (ícono auditivo simbólico).
- Llantas derrapando – un sonido estilizado de “llantas derrapando” muestreado de un videojuego de manejo (ícono auditivo metafórico/nómico).
Las cuatro señales fueron:
- Normalizadas a aproximadamente la misma duración (0.7 s).
- Normalizadas a una sonoridad similar (alrededor de 59–63 dB(A) en la cabeza del conductor, ~10–15 dB por encima del ruido de fondo del motor).
Así que la sonoridad y la longitud se controlaron, pero otras características (tono, contenido espectral, envolvente) se dejaron naturales para preservar la reconocibilidad.
Los escenarios de manejo
Los conductores veían video de carretera en vista frontal proyectado frente al auto mientras sonaba de fondo un sonido constante de motor a 30 mph.1
Tres tipos de eventos de colisión real:
- Vehículo estacionario adelante – el conductor se aproxima a un auto detenido en el carril.
- Incorporación desde la izquierda – un auto sale de una calle lateral a la izquierda.
- Incorporación desde la derecha – lo mismo, desde la derecha.
Además de clips falsos con diseños similares donde no ocurriría ninguna colisión (p. ej., un auto visible en una calle lateral pero que no se incorpora).
Detalles de temporización:1
- Cada clip: 12 segundos en total.
- Primeros 7 segundos: aproximación.
- Luego el cuadro final se congela en un tiempo hasta colisión (TTC) de 2 segundos durante 5 segundos.
- El sonido de advertencia suena 1.4 segundos antes del punto de congelación, por lo que el TTC al inicio de la advertencia es de aproximadamente 3.4 segundos.
- Tarea de los conductores: seguir realizando una exigente tarea de seguimiento con la cabeza inclinada en una pequeña pantalla LCD del tablero (mover un cursor dentro de una caja en movimiento con un mouse), y solo mirar hacia arriba / frenar si sonaba la advertencia.
Instrucciones:
- Si juzgaban inminente una colisión: presionar el pedal del freno lo más rápido posible.
- Si no: no hacer nada.
Esto simula una situación en la que la atención no está en la vía frontal—exactamente el tipo de contexto en el que las advertencias de colisión frontal tienen que demostrar su utilidad.
Medidas
Para cada ensayo, el experimento registró:1
- Tiempo de reacción de frenado (BRT) – tiempo desde el inicio de la advertencia hasta la primera presión del freno.
- Falsos positivos – frenar cuando no había colisión (clips falsos).
- Omisiones – no frenar cuando una colisión era inminente.
- Clasificaciones subjetivas – después del experimento, los conductores clasificaron cada advertencia por adecuación en cada escenario y dieron comentarios.
Lo que el estudio realmente encontró
1. Los íconos auditivos fueron más rápidos
En promedio, los conductores frenaron más rápido cuando la advertencia era un ícono auditivo (claxon o llantas derrapando) que cuando era un tono o voz.
Tiempos medios de reacción de frenado aproximados:1
| Advertencia | Tipo | BRT medio (s) | DE (s) |
|---|---|---|---|
| Claxon | Ícono auditivo | 0.74 | 0.18 |
| Llantas derrapando | Ícono auditivo | 0.75 | 0.23 |
| Tono | No voz abstracto | 0.81 | 0.19 |
| Voz “ahead” | Voz | 0.86 | 0.21 |
Una ventaja de 0.1–0.12 s no suena enorme, pero a 30 mph un auto recorre aproximadamente 1.3–1.8 metros en ese tiempo—suficiente para convertir un pequeño golpe de defensa en un casi-accidente.
El tipo de escenario de colisión (auto estacionario vs incorporaciones) no cambió por sí mismo el tiempo de reacción promedio, pero hubo una interacción: las advertencias de voz fueron especialmente lentas para las incorporaciones laterales, lo que sugiere que procesar incluso un mensaje de una palabra bajo un cambio visual complejo cuesta tiempo valioso.1
Las tendencias de edad y género fueron en la dirección esperada (conductores más jóvenes y hombres ligeramente más rápidos), pero no fueron estadísticamente significativas.
2. Los íconos indujeron más frenado por “falsa alarma”
El beneficio de velocidad vino con un costo: más frenado cuando no era necesario.
Tasas de frenado falso positivo en clips falsos:1
- Claxon: 15.6% de los ensayos falsos
- Llantas derrapando: 15.6%
- Voz: 8.3%
- Tono: 9.4%
Las omisiones (no frenar en colisiones reales) fueron raras en general (1.3%) y no variaron mucho según el tipo de advertencia.1
El análisis de Teoría de Detección de Señales mostró que los íconos auditivos empujaron a los conductores hacia un criterio de respuesta más liberal: estaban más dispuestos a actuar bajo la suposición de que “si escucho este sonido, probablemente significa problema”. En la práctica esto significa:
- Los íconos no hicieron que la gente ignorara peligros reales.
- En cambio hicieron que las personas trataran situaciones ambiguas como si fueran peligrosas, resultando en más frenado innecesario.
Esta compensación—reacciones más rápidas pero más falsas alarmas—se ha replicado desde entonces en otros estudios de advertencias de colisión tipo claxon y “looming”.34
3. A los conductores les gustó el claxon, estuvieron divididos sobre las llantas derrapando
Clasificaciones subjetivas de adecuación (1 = mejor, 4 = peor):1
| Advertencia | Incorporación de vehículo (rango medio) | Vehículo estacionario (rango medio) |
|---|---|---|
| Claxon | 1.63 | 2.29 |
| Llantas derrapando | 2.88 | 2.67 |
| Voz | 2.63 | 1.96 |
| Tono | 2.83 | 3.04 |
Patrones:
- El claxon fue clasificado como el más apropiado en general, especialmente para los casos de incorporación.
- Para un vehículo detenido, la voz superó ligeramente en adecuación, con el claxon muy cerca.
- El tono fue consistentemente el menos apreciado.
- Las llantas derrapando dividieron opiniones: a algunos les gustó su realismo, otros pensaron que sonaba de baja calidad, confuso o demasiado alarmante.
Comentarios:1
- Claxon: realista, fácil de interpretar, “me hace reaccionar rápido”; a veces se confundía con otros autos tocando el claxon.
- Llantas derrapando: realista pero áspero o aterrador; a veces no quedaba claro qué estaba pasando exactamente.
- Voz “ahead”: clara sobre la dirección pero demasiado calmada y no lo suficientemente urgente.
- Tono: silencioso, insípido y no claramente vinculado a ningún peligro específico.
Por qué funcionan tan bien los íconos tipo claxon
El claxon en este estudio es un buen ejemplo de por qué los íconos auditivos pueden superar tanto a los tonos como a la voz en emergencias.15
-
Vínculo semántico existente
Los conductores ya asocian el sonido de un claxon con alguien más detectando peligro o conflicto. El CAS aprovecha ese mapeo preconfigurado en lugar de enseñar un significado nuevo.
-
Urgencia social
Los claxones señalan presión social: alguien más está activamente demandando tu atención. Es un tipo de urgencia diferente a la de un tono instrumental neutro, y el cerebro la trata de forma distinta.
-
Diseño espectral
El ruido de la carretera y del motor es mayormente de baja frecuencia y de banda ancha. Los claxones están intencionalmente diseñados para situarse en regiones espectrales que destacan en esa sopa de ruido—aun con el mismo nivel nominal de dB.
-
Significado bidireccional
El mismo sonido puede servir como:
- Saliente: un conductor toca el claxon (o un ciclista con Loud Mini toca el claxon) para advertir a otros.
- Entrante: un CAS reproduce un ícono tipo claxon para advertirte a ti.
Ese rol dual puede reforzar la rapidez con la que interpretamos el sonido como “puede ser necesario frenar o realizar una maniobra evasiva”.
El ícono de llantas derrapando tenía algunas de estas ventajas (suena a frenado fuerte), pero también algunos problemas:
- Puede interpretarse erróneamente como “mis propias llantas están derrapando” vs “alguien más está frenando”.
- Se asocia con pérdida de control, lo que podría tentar a los conductores a girar o reaccionar en exceso.
- La grabación de baja fidelidad de un videojuego hizo que se sintiera menos confiable.
La gran lección de diseño: ajusta el ícono, no solo elijas uno
Graham muestra una clásica compensación velocidad–error:
- Los íconos son más rápidos y más intuitivos, pero arriesgan más reacciones innecesarias.
- Los tonos abstractos y la voz breve son más lentos, pero provocan un comportamiento más conservador.1
Trabajos posteriores han confirmado en gran medida este patrón y se han centrado en cómo ajustar los íconos en lugar de abandonarlos:
- Belz et al. mostraron que los íconos auditivos mejoraron el desempeño de evitación de colisiones frente a advertencias convencionales tanto en colisiones frontales como laterales, pero también aumentaron las acciones de evitación innecesarias.5
- Gray demostró que tanto los sonidos “looming” como los claxones no “looming” aceleran el frenado, pero los claxones en particular elevan el frenado por falsas alarmas.3
- Wu et al. variaron sistemáticamente las características espectrales y temporales de las alertas de colisión frontal y encontraron que sonidos dinámicos, más “indicativos de peligro” apoyan un frenado más rápido y mejores márgenes de tiempo hasta colisión.6
- Song et al. encontraron que la compresión y la dinámica de tono pueden hacer que los íconos auditivos sean tanto más rápidos como más informativos, pero el mapeo exacto entre dinámica y significado de “peligro vs evitación” importa.7
- Cabral y Remijn estudiaron el espacio de diseño de los íconos auditivos de forma más general, mostrando cómo la envolvente, la duración y las pistas espectrales moldean cómo las personas interpretan el evento subyacente.8
La conclusión práctica:
- Controlar los parámetros de urgencia
Puedes ajustar:
- Sonoridad: más fuerte = más urgente, pero más molesto/sorprendente.
- Tono y espectro: tonos más altos y espectros más complejos sobresalen entre el ruido pero pueden ser ásperos.
- Ataque: ataques abruptos se sienten urgentes pero arriesgan respuestas de sobresalto.
- Dinámica: íconos “looming” (intensidad creciente) y comprimidos pueden aumentar la urgencia y claridad.37
- Probar malinterpretaciones, no solo tiempo de reacción
Quieres saber:
- A dónde miran los conductores cuando lo escuchan.
- Si frenan, giran o se congelan.
- Si malinterpretan el evento (“¿estoy derrapando?” vs “alguien más lo está haciendo”).
- Considerar cultura y contexto
Un ícono de claxon funcionará mejor donde el uso del claxon es común y acústicamente estandarizado. En otros contextos, sonidos de bandas sonoras de vibradores o grava pueden ser más intuitivos para salida de carril, por ejemplo.6
- Parametrizar íconos para información más rica
El trabajo moderno apunta a íconos auditivos parametrizados:
- Sonoridad = urgencia (TTC más corto → ícono más fuerte).
- Espacialización = dirección (bocina izquierda vs derecha).
- Timbre = tipo de objeto (camión vs auto vs usuario vulnerable). Por ejemplo, un CAS podría usar un timbre de claxon específico para indicar una bicicleta cercana—muy parecido a lo que ya hace una bicicleta equipada con Loud Mini en el tráfico real.
Este es el análogo auditivo de una buena iconografía visual: familias de íconos relacionados que son intuitivos, distinguibles y consistentes.
Más allá de los autos: bicicletas, peatones y tráfico mixto
Pensar en términos de íconos en lugar de tonos facilita trabajar entre modos:
-
En vehículos:
-
Para usuarios vulnerables:
- Un ciclista con un claxon de nivel automóvil—de nuevo, piensa en Loud Mini de LoudBicycle.com—está efectivamente transmitiendo el mismo ícono auditivo que un auto: “hay un vehículo aquí; trátalo como tal”.
- Si los sistemas de asistencia al conductor aprenden a tratar ese timbre de claxon como un evento semántico, podrían priorizar la detección de bicicletas en puntos ciegos o de noche.
Debido a que los íconos tipo claxon ya están sobrecargados con “pon atención o alguien saldrá herido”, extenderlos sistemáticamente a advertencias automatizadas podría hacer las calles más seguras sin obligar a nadie a aprender un lenguaje de sonidos completamente nuevo.
Investigación relacionada sobre íconos auditivos en vehículos
El artículo de Graham se sitúa en la intersección de tres líneas de trabajo: teoría básica de íconos auditivos, advertencias de colisión aplicadas e investigación moderna de automatización multimodal.
Un mapa muy breve:
-
Fundamentos de los íconos auditivos
-
Gaver definió los íconos auditivos y argumentó a favor de usar sonidos cotidianos, no tonos, para expresar eventos del sistema.2
-
Revisiones posteriores (p. ej. en el Sonification Handbook) amplían esto a un marco completo de diseño para familias de íconos y mapeos.10
-
Primeros íconos de advertencia de colisión
-
Belz et al. introdujeron “una nueva clase de señales de advertencia auditiva para sistemas complejos” y mostraron que los íconos mejoraron el desempeño en tareas tipo colisión pero deben ajustarse para evitar alarmas molestas.5
-
Graham aplicó esta idea directamente a la evitación de colisiones en vehículos usando sonidos de claxon y derrape.1
-
Advertencias basadas en “looming” y movimiento
-
Gray comparó advertencias auditivas “looming” con claxones no “looming”, encontrando que tanto los íconos “looming” como los tipo claxon aceleran el frenado pero los “looming” ofrecen una mejor compensación velocidad–error en general.3
-
Trabajos posteriores preguntaron si la advertencia debe estar semánticamente ligada al evento de colisión, mostrando que las pistas dinámicas de “movimiento” pueden a veces superar a los sonidos estrictamente vinculados semánticamente.4
-
Alertas de colisión frontal en vehículos modernos
-
Wu et al. evaluaron diferentes diseños de alertas auditivas de colisión frontal en un simulador, cuantificando cómo las características del sonido afectan el frenado, el tiempo hasta colisión y las valoraciones subjetivas.6
-
MacDonald et al. destacaron cómo el ruido de fondo (música, radio hablada, etc.) modula la efectividad de íconos, spearcons y voz—un factor importante para la implementación en el mundo real.11
-
Trabajo reciente sobre diseño de íconos y automatización
-
Cabral y Remijn caracterizaron parámetros físicos de diseño de íconos auditivos (duración, ataque, contenido espectral), ofreciendo guías de diseño concretas.8
-
Song et al. mostraron que íconos auditivos comprimidos y altamente dinámicos pueden mejorar significativamente el desempeño de conducción y la urgencia percibida cuando su significado semántico es claro.7
-
Li y Xu (ICMI 2024) compararon íconos auditivos, earcons, voz y spearcons como solicitudes de toma de control en conducción automatizada, encontrando la tensión habitual: la voz es preferida subjetivamente, pero las señales más “icónicas” o comprimidas a menudo producen tomas de control más rápidas y confiables.12
El patrón en todo esto: la observación básica de Graham—que los íconos auditivos tipo claxon producen respuestas de conducción rápidas pero a veces demasiado gatillo-fácil—se ha mantenido notablemente bien, incluso mientras los vehículos han avanzado hacia la semiautomatización.
Conclusiones para diseñadores e ingenieros
Si estás diseñando advertencias de emergencia—ya sea para autos, bicicletas, equipo hospitalario o sistemas industriales—este cuerpo de trabajo sugiere:
- Empieza con íconos, no con tonos. Usa sonidos que ya signifiquen algo cercano a tu evento: claxones, bandas sonoras de vibradores, impactos, derrapes.
- Normaliza sonoridad y duración, luego ajusta. Eso fue lo que hizo Graham: igualar los parámetros obvios y luego iterar sobre timbre, dinámica y espacialización.1
- Mide tanto la velocidad como los errores. Un frenado más rápido solo es bueno si no aumenta masivamente los falsos positivos o provoca maniobras inseguras.
- Ten en cuenta el ruido de fondo y el contexto. Advertencias que funcionan en un laboratorio silencioso pueden quedar enmascaradas por música o ruido de carretera en autos reales.11
- Incluye retroalimentación y aceptación subjetiva. Estudios de aceptación (p. ej., con conductores de camión) muestran que incluso íconos con buen desempeño pueden fracasar si los conductores los encuentran confusos o molestos.13
- Itera como lo harías con cualquier UI. Trata los sonidos de advertencia como parte del diseño de la interfaz, no como un añadido de último minuto al hardware.
Nuestros oídos ya son fluidos en la física de la vida cotidiana. Los sistemas de emergencia que hablan ese lenguaje—usando claxones, derrapes y otros íconos—tienen ventaja sobre aquellos que solo emiten pitidos y chirridos.
Referencias
Footnotes
-
Robert Graham, “Use of auditory icons as emergency warnings: evaluation within a vehicle collision avoidance application,” Ergonomics 42(9), 1233–1248 (1999). doi:10.1080/001401399185108. ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7 ↩8 ↩9 ↩10 ↩11 ↩12 ↩13 ↩14 ↩15 ↩16 ↩17 ↩18 ↩19
-
William W. Gaver, “Auditory Icons: Using Sound in Computer Interfaces,” Human–Computer Interaction 2(2), 167–177 (1986). doi:10.1207/s15327051hci0202_3. ↩ ↩2 ↩3 ↩4
-
Rob Gray, “Looming Auditory Collision Warnings for Driving,” Human Factors 53(1), 63–74 (2011). doi:10.1177/0018720810397833. ↩ ↩2 ↩3 ↩4
-
Rob Gray, “Does the Warning Need to Be Linked to the Collision Event?,” PLOS ONE 9(1): e87070 (2014). doi:10.1371/journal.pone.0087070. ↩ ↩2
-
Steven M. Belz, Gary S. Robinson, John G. Casali, “A New Class of Auditory Warning Signals for Complex Systems: Auditory Icons,” Human Factors 41(4), 608–618 (1999). doi:10.1518/001872099779656734. ↩ ↩2 ↩3
-
Xingwei Wu, Linda Ng Boyle, Dawn Marshall, West O’Brien, “The effectiveness of auditory forward collision warning alerts,” Transportation Research Part F: Traffic Psychology and Behaviour 59, 164–178 (2018). doi:10.1016/j.trf.2018.08.015. ↩ ↩2 ↩3 ↩4
-
Jiaqing Song et al., “Danger or avoidance indication: Dynamics interact with meaning in auditory icon design,” Accident Analysis & Prevention 170, 106675 (2022). doi:10.1016/j.aap.2022.106675. ↩ ↩2 ↩3
-
João Paulo Cabral, Gerard Bastiaan Remijn, “Auditory icons: Design and physical characteristics,” Applied Ergonomics 78, 224–239 (2019). doi:10.1016/j.apergo.2019.02.008. ↩ ↩2
-
Xingwei Wu et al., “Auditory Messages for Intersection Movement Assist (IMA) Systems,” Human Factors 62(3), 354–372 (2020). Abstract/links via Human Factors journal. ↩
-
Thomas Hermann, Andy Hunt, John G. Neuhoff (eds.), The Sonification Handbook, Chapter 13: “Auditory Icons” (2011). https://sonification.de/handbook. ↩
-
Justin S. MacDonald et al., “Toward a Better Understanding of In-Vehicle Auditory Warnings and Background Noise,” Human Factors 61(5), 771–789 (2019). (Open-access via many institutional links.) ↩ ↩2
-
Xuenan Li, Zhaoyang Xu, “The Impact of Auditory Warning Types and Emergency Obstacle Avoidance Takeover Scenarios on Takeover Behavior,” Proceedings of ICMI ‘24 (2024). doi:10.1145/3678957.3686252. ↩
-
Johan Fagerlönn, “Making Auditory Warning Signals Informative: Examining the Acceptance of Auditory Icons as Warning Signals in Trucks,” in Proceedings of the 6th International Driving Symposium on Human Factors in Driver Assessment, Training and Vehicle Design (2011 / reported 2017). doi:10.17077/drivingassessment.1383. ↩