Использование аудиоиконок в качестве экстренных предупреждений в реальных автомобилях и моделируемых мирах
- Jonathan Lansey
- September 19, 2025
- 3 mins
- безопасность
- безопасность транспортных средств звукознание человеческие факторы
Если совсем коротко
- В классическом симуляторном исследовании Грэма замена абстрактных «бипов» на аудиторные иконы (сигнал клаксона и визг шин) позволила водителям нажимать на тормоз в среднем примерно на 0,1 с быстрее.1
- Обратная сторона: эти иконы также вдвое увеличили частоту «ложных тревог» — торможений в некритических ситуациях, что отражает более агрессивный критерий принятия решения.
- Иконка клаксона была и быстрой, и высоко оценённой субъективно; иконка визга шин была быстрой, но воспринималась как менее уместная и более пугающая.
- Тщательная настройка параметров звука (громкость, высота, атака, длительность) позволяет сохранить выигрыш во времени реакции от икон и при этом снизить долю ненужных торможений.
- Предупреждения, похожие на клаксон, не обязаны ограничиваться автомобилями: клаксон автомобильного уровня на велосипеде (например, Loud Mini от LoudBicycle.com) может выполнять ту же функцию сверхвыученного сигнала безопасности для уязвимых участников движения.
Почему звук — такой хороший канал для экстренных сигналов
При столкновении важны миллисекунды. У звука есть несколько «суперспособностей», которые делают его идеальным для аварийных оповещений в салоне автомобиля:1
- Он навязчив. Мигающий свет можно проигнорировать, если глаза заняты, но от внезапного звука нельзя «отвернуться».
- Он не требует ни глаз, ни рук. Сигнал можно воспринять, пока зрительная система и руки полностью заняты рулём, зеркалами и дорогой.
- Время реакции обычно короче. Во многих условиях люди реагируют на звуковые сигналы быстрее, чем на визуальные.
Большинство серийных систем до сих пор опираются на довольно примитивный звук: одночастотные «бипы», зуммеры или, в лучшем случае, короткое голосовое сообщение. Это легко реализовать технически, но так мы обычно не слушаем окружающий мир.
Статья Грэма 1999 года задаёт обманчиво простой вопрос: что, если вместо обезличенных тонов использовать звуки, которые действительно напоминают события реального мира?1 Эта идея напрямую восходит к исходному предложению Уильяма Гейвера о аудиторных иконах как «карикатурах естественных звуков» для интерфейсов.2
Что такое «аудиторные иконы» и почему они важны?
В рамках аудиторных икон Гейвер различает несколько типов соответствия между звуком и значением:2
- Номические иконы — прямые записи / карикатуры самого события (например, грохот, обозначающий падение предмета).
- Метафорические иконы — звуки, чья структура отображает некоторое свойство (например, повышающаяся высота тона как «увеличение количества»).
- Символические иконы — культурно усвоенные ассоциации (например, полицейская сирена как «службы экстренной помощи»).
Им противопоставляются ирконы (earcons) — абстрактные маленькие музыкальные мотивы, значение которых полностью нужно выучить.2
В дорожном движении клаксон — вероятно, самая сверхвыученная аудиторная икона, которая у нас есть:
- Он символически связан с «что-то прямо сейчас не в порядке».
- Обычно исходит от другого транспортного средства, поэтому несёт неявное социальное значение («мне нужно, чтобы ты меня заметил или изменил своё поведение»).
- Его спектр сконструирован так, чтобы пробиваться сквозь шум двигателя и дороги.
Автомобильный клаксон или клаксон автомобильного уровня на велосипеде — как Loud Mini от LoudBicycle.com, который по сути придаёт велосипеду акустический профиль автомобиля, — идеально вписывается в эту категорию: аудиторная икона «здесь есть транспортное средство, которое нельзя игнорировать».
Гипотеза Грэма: такие иконы должны восприниматься как аварийные предупреждения быстрее и проще, чем обезличенные тоны или короткие голосовые сообщения.1
Внутри эксперимента: моделируем столкновения и слушаем, когда жмут на тормоз
Грэм провёл лабораторное исследование, используя стационарный Ford Scorpio, превращённый в простой симулятор вождения.1
Участники
- 24 водителя с правами, сбалансированные по полу и возрасту:
- 6 мужчин младше 35 лет
- 6 мужчин старше 35 лет
- 6 женщин младше 35 лет
- 6 женщин старше 35 лет
- Нормальный слух и нормальное/скорректированное зрение.
- Не менее одного года регулярного опыта вождения.
Предупреждающие звуки
Сравнивались четыре типа предупреждений:1
- Тон — синтетический пилообразный сигнал 600 Гц, длительностью 0,7 с.
- Речь — женский голос, произносящий слово «ahead» спокойным, но твёрдым тоном.
- Клаксон — реальная внутренняя запись автомобильного сигнала (символическая аудиторная икона).
- Визг шин — стилизованный звук «скользящих шин», взятый из гоночной видеоигры (метафорическая/номическая аудиторная икона).
Все четыре сигнала были:
- Нормированы по длительности (около 0,7 с).
- Нормированы по громкости (примерно 59–63 дБ(A) на уровне головы водителя, ~10–15 дБ выше фонового шума двигателя).
То есть громкость и длительность контролировались, но другие характеристики (высота, спектральный состав, огибающая) оставались естественными, чтобы сохранить узнаваемость.
Сценарии вождения
Водители смотрели фронтальное видео дороги, проецируемое перед автомобилем, при этом на фоне постоянно звучал звук двигателя на скорости 30 миль/ч.1
Три типа реальных столкновений:
- Стоящее впереди транспортное средство — водитель приближается к остановившемуся в полосе автомобилю.
- Выезд слева — автомобиль выезжает с боковой дороги слева.
- Выезд справа — то же самое, но справа.
Плюс ложные ролики с похожей компоновкой, где столкновения не происходило (например, автомобиль виден на боковой дороге, но не выезжает).
Подробности тайминга:1
- Каждый ролик: 12 секунд.
- Первые 7 секунд: движение навстречу сцене.
- Затем последний кадр «замораживается» на моменте, когда время до столкновения (TTC) равно 2 секундам, и так показывается 5 секунд.
- Предупреждающий звук подаётся за 1,4 секунды до момента заморозки, так что TTC в момент начала сигнала составляет около 3,4 секунды.
- Задача водителей: продолжать выполнять сложную «голова вниз» задачу слежения на маленьком ЖК‑экране на панели (перемещать курсор в движущуюся рамку с помощью мыши) и поднимать взгляд / тормозить только при появлении предупреждения.
Инструкции:
- Если они считают столкновение неизбежным: как можно быстрее нажать педаль тормоза.
- Если нет: ничего не делать.
Это моделирует ситуацию, когда внимание не направлено на дорогу вперёд — именно тот контекст, в котором системы предупреждения о фронтальном столкновении должны оправдывать своё существование.
Измеряемые показатели
В каждом испытании фиксировались:1
- Время реакции торможения (BRT) — время от начала предупреждения до первого нажатия на тормоз.
- Ложные срабатывания — торможение, когда столкновения нет (ложные ролики).
- Пропуски — отсутствие торможения, когда столкновение действительно грозит.
- Субъективные оценки — после эксперимента водители ранжировали каждое предупреждение по уместности в каждом сценарии и давали комментарии.
Что на самом деле показало исследование
1. Аудиторные иконы были быстрее
В среднем водители нажимали на тормоз быстрее, когда предупреждением служила аудиторная икона (клаксон или визг шин), чем когда это был тон или речь.
Приблизительные средние времена реакции торможения:1
| Предупреждение | Тип | Среднее BRT (с) | SD (с) |
|---|---|---|---|
| Клаксон | Аудиторная икона | 0,74 | 0,18 |
| Визг шин | Аудиторная икона | 0,75 | 0,23 |
| Тон | Абстрактный не речевой | 0,81 | 0,19 |
| Речь «ahead» | Речь | 0,86 | 0,21 |
Преимущество в 0,1–0,12 с может звучать незначительно, но при 30 милях/ч автомобиль проходит за это время примерно 1,3–1,8 метра — достаточно, чтобы превратить лёгкий удар бампером в «почти столкновение».
Тип сценария столкновения (стоящее авто против выезда сбоку) сам по себе не менял среднее время реакции, но была обнаружена интеракция: речевые предупреждения были особенно медленными при выездах сбоку, что говорит о том, что даже односложное сообщение в условиях сложных визуальных изменений отнимает драгоценное время.1
Тенденции по возрасту и полу были ожидаемыми (молодые и мужчины немного быстрее), но статистически незначимыми.
2. Иконы вызывали больше «ложных тревог» при торможении
Выигрыш в скорости сопровождался ценой: более частым торможением там, где оно не требовалось.
Частота ложных торможений на «пустых» роликах:1
- Клаксон: 15,6 % ложных испытаний
- Визг шин: 15,6 %
- Речь: 8,3 %
- Тон: 9,4 %
Пропуски (отсутствие торможения при реальных столкновениях) были редки в целом (1,3 %) и мало зависели от типа предупреждения.1
Анализ в терминах теории обнаружения сигналов показал, что аудиторные иконы смещали водителей к более либеральному критерию ответа: они были более склонны действовать, исходя из предположения «если я слышу этот звук, скорее всего, что-то не так». На практике это означает:
- Иконы не заставляли людей игнорировать реальные опасности.
- Вместо этого они побуждали расценивать неоднозначные ситуации как опасные, что приводило к большему числу ненужных торможений.
Этот компромисс — более быстрые реакции, но больше ложных тревог — впоследствии был воспроизведён и в других исследованиях предупреждений, похожих на клаксон, и «надвигающихся» (looming) сигналов столкновения.34
3. Водителям нравился клаксон, а визг шин вызывал смешанные оценки
Субъективные ранги уместности (1 = лучший, 4 = худший):1
| Предупреждение | Выезд автомобиля (средний ранг) | Стоящее авто (средний ранг) |
|---|---|---|
| Клаксон | 1,63 | 2,29 |
| Визг шин | 2,88 | 2,67 |
| Речь | 2,63 | 1,96 |
| Тон | 2,83 | 3,04 |
Картина:
- Клаксон был признан наиболее уместным в целом, особенно для сценариев выезда.
- Для стоящего автомобиля речь немного опередила клаксон по уместности, клаксон был близко позади.
- Тон стабильно оказывался на последнем месте.
- Визг шин разделил мнения: некоторым нравилась реалистичность, другие считали его низкокачественным, запутанным или чрезмерно пугающим.
Комментарии:1
- Клаксон: реалистичный, легко интерпретируемый, «заставляет меня быстро реагировать»; иногда путали с сигналами других машин.
- Визг шин: реалистичный, но резкий или страшный; иногда было неясно, что именно происходит.
- Речь «ahead»: ясно указывает направление, но слишком спокойная и недостаточно срочная.
- Тон: тихий, безликий и не явно связанный с какой-то конкретной опасностью.
Почему иконы, похожие на клаксон, так хорошо работают
Клаксон в этом исследовании — хороший пример того, почему аудиторные иконы могут превосходить и тоны, и речь в аварийных ситуациях.15
-
Существующая семантическая связь
Водители уже ассоциируют звук клаксона с тем, что кто‑то другой обнаружил опасность или конфликт. Система предупреждения использует эту заранее сформированную связь, а не обучает новому значению.
-
Социальная срочность
Клаксон сигнализирует социальное давление: кто‑то активно требует вашего внимания. Это иной тип срочности, чем нейтральный инструментальный тон, и мозг обрабатывает его иначе.
-
Спектральный дизайн
Шум дороги и двигателя в основном низкочастотный и широкополосный. Клаксон специально спроектирован так, чтобы занимать спектральные области, выделяющиеся на этом фоне — даже при той же номинальной громкости в дБ.
-
Двунаправленное значение
Один и тот же звук может служить:
- Исходящим: водитель сигналит (или велосипедист с Loud Mini сигналит), чтобы предупредить других.
- Входящим: система предупреждения воспроизводит клаксоноподобную икону, чтобы предупредить вас.
Эта двойная роль усиливает скорость интерпретации звука как «может понадобиться торможение или манёвр уклонения».
Иконка визга шин обладала частью этих преимуществ (она звучит как интенсивное торможение), но имела и проблемы:
- Её можно неверно понять как «мои собственные шины скользят» против «кто‑то другой резко тормозит».
- Она ассоциируется с потерей контроля, что может побудить водителей к резким манёврам.
- Низкое качество записи из видеоигры снижало доверие к сигналу.
Более общий урок дизайна: настраивать икону, а не просто выбрать её
Грэм демонстрирует классический компромисс между скоростью и ошибками:
- Иконы быстрее и интуитивнее, но повышают риск ненужных реакций.
- Абстрактные тоны и короткая речь медленнее, но провоцируют более консервативное поведение.1
Позднейшие работы в основном подтверждают эту картину и сосредотачиваются на том, как настраивать иконы, а не отказываться от них:
- Belz и соавт. показали, что аудиторные иконы улучшают предотвращение столкновений по сравнению с традиционными предупреждениями как при фронтальных, так и при боковых столкновениях, но также увеличивают число ненужных действий уклонения.5
- Gray продемонстрировал, что и «надвигающиеся» звуки, и не-надвигающиеся автомобильные клаксонные сигналы ускоряют торможение, но именно клаксон особенно повышает частоту ложных торможений.3
- Wu и соавт. систематически варьировали спектральные и временные характеристики предупреждений о фронтальном столкновении и обнаружили, что динамичные, более «опасно-индикативные» звуки обеспечивают более быстрое торможение и лучшие запасы по времени до столкновения.6
- Song и соавт. показали, что компрессия и динамика высоты тона могут сделать аудиторные иконы одновременно быстрее и более информативными, но точное соответствие между динамикой и значением «опасность vs уклонение» критично.7
- Cabral и Remijn исследовали пространство дизайна аудиторных икон в целом, показав, как огибающая, длительность и спектральные признаки формируют интерпретацию события.8
Практические выводы:
- Управляйте параметрами срочности
Можно настраивать:
- Громкость: громче = более срочно, но более раздражающе/пугающе.
- Высоту и спектр: более высокие и спектрально сложные звуки лучше пробиваются сквозь шум, но могут быть резкими.
- Атаку (onset): резкий старт воспринимается как срочный, но повышает риск реакции испуга.
- Динамику: «надвигающиеся» (нарастающие по интенсивности) и сжатые иконы могут усиливать срочность и ясность.37
- Тестируйте не только время реакции, но и неверные интерпретации
Важно знать:
- Куда смотрят водители, услышав сигнал.
- Тормозят ли они, поворачивают или замирают.
- Путают ли они событие («это я скольжу?» против «кто-то другой?»).
- Учитывайте культуру и контекст
Икона-клаксон лучше всего работает там, где использование клаксона распространено и его звук стандартизирован. В других контекстах, например, для предупреждения о сходе с полосы, более интуитивными могут быть звуки наезда на шумовую полосу или гравий.6
- Параметризуйте иконы для передачи более богатой информации
Современные работы указывают на параметризованные аудиторные иконы:
- Громкость = срочность (меньшее TTC → более громкая икона).
- Пространственное расположение = направление (левый vs правый динамик).
- Тембр = тип объекта (грузовик vs легковой автомобиль vs уязвимый участник). Например, система предупреждения может использовать специфический тембр клаксона для обозначения близкого велосипеда — очень похоже на то, что уже делает велосипед с Loud Mini в реальном трафике.
Это аудиторный аналог хорошей визуальной иконографии: семейства родственных икон, которые интуитивны, различимы и согласованы.
За пределами автомобилей: велосипеды, пешеходы и смешанный трафик
Переход к мышлению в терминах икон, а не тонов, облегчает работу в разных видах транспорта:
-
В транспортных средствах:
-
Для уязвимых участников:
- Велосипедист с клаксоном автомобильного уровня — снова, Loud Mini от LoudBicycle.com — по сути транслирует ту же аудиторную икону, что и автомобиль: «здесь есть транспортное средство; относись к нему соответствующим образом».
- Если системы помощи водителю научатся трактовать этот тембр клаксона как семантическое событие, они смогут приоритизировать обнаружение велосипедов в мёртвых зонах или в тёмное время суток.
Поскольку иконы, похожие на клаксон, уже перегружены значением «обрати внимание, иначе кто‑то пострадает», их систематическое расширение на автоматизированные предупреждения может сделать улицы безопаснее без необходимости обучать всех совершенно новому «языку звуков».
Связанные исследования об аудиторных иконах в транспорте
Статья Грэма находится на пересечении трёх направлений: базовой теории аудиторных икон, прикладных предупреждений о столкновениях и современной мультимодальной автоматики.
Краткая карта:
-
Основы теории аудиторных икон
-
Гейвер определил аудиторные иконы и выступил за использование повседневных звуков, а не тонов, для выражения событий системы.2
-
Позднейшие обзоры (например, в Sonification Handbook) развивают это в полноценную рамку дизайна семейств икон и отображений.10
-
Ранние иконы для предупреждений о столкновениях
-
Belz и соавт. представили «новый класс звуковых предупреждающих сигналов для сложных систем» и показали, что иконы улучшают выполнение задач, похожих на предотвращение столкновений, но их нужно настраивать, чтобы избежать «раздражающих» тревог.5
-
Грэм напрямую применил эту идею к внутриавтомобильному предотвращению столкновений, используя звуки клаксона и визга шин.1
-
«Надвигающиеся» и основанные на движении предупреждения
-
Gray сравнил «надвигающиеся» аудиторные предупреждения с не-надвигающимися автомобильными клаксонными сигналами и обнаружил, что и те, и другие ускоряют торможение, но «надвигающиеся» сигналы дают лучший баланс между скоростью и ошибками.3
-
В последующей работе он задал вопрос, обязательно ли предупреждение должно быть семантически связано с событием столкновения, и показал, что динамические «движенческие» сигналы иногда превосходят строго семантически связанные звуки.4
-
Предупреждения о фронтальном столкновении в современных автомобилях
-
Wu и соавт. оценили различные варианты аудиторных предупреждений о фронтальном столкновении в симуляторе, количественно описав, как характеристики звука влияют на торможение, время до столкновения и субъективные оценки.6
-
MacDonald и соавт. показали, как фоновый шум (музыка, разговорное радио и т. п.) модифицирует эффективность икон, «spearcons» и речи — важный фактор для реального внедрения.11
-
Недавние работы по дизайну икон и автоматизации
-
Cabral и Remijn охарактеризовали физические параметры дизайна аудиторных икон (длительность, атака, спектральный состав), предложив конкретные рекомендации по проектированию.8
-
Song и соавт. показали, что сжатые и высокодинамичные аудиторные иконы могут существенно улучшать показатели вождения и воспринимаемую срочность, если их семантическое значение ясно.7
-
Li и Xu (ICMI 2024) сравнили аудиторные иконы, ирконы, речь и «spearcons» как сигналы о необходимости перехвата управления в условиях автоматизированного вождения и обнаружили привычное напряжение: речь субъективно предпочтительнее, но более «иконические» или сжатые сигналы часто обеспечивают более быстрый и надёжный перехват.12
Общая картина во всех этих работах: базовое наблюдение Грэма — что иконы, похожие на клаксон, вызывают быстрые, но иногда чрезмерно осторожные реакции водителей — удивительно хорошо сохраняется, даже по мере перехода транспорта к полуавтоматическому режиму.
Выводы для дизайнеров и инженеров
Если вы проектируете аварийные предупреждения — для автомобилей, велосипедов, медицинского оборудования или промышленных систем, — этот корпус работ подсказывает:
- Начинайте с икон, а не с тонов. Используйте звуки, которые уже означают что‑то близкое вашему событию: клаксон, шумовую полосу, удар, визг шин.
- Сначала нормируйте громкость и длительность, затем настраивайте. Так делал Грэм: выровнять очевидные параметры, затем итеративно работать с тембром, динамикой и пространственным расположением.1
- Измеряйте и скорость, и ошибки. Более быстрое торможение полезно только если оно не приводит к резкому росту ложных тревог или опасных манёвров.
- Учитывайте фоновый шум и контекст. Сигналы, которые работают в тихой лаборатории, могут маскироваться музыкой или дорожным шумом в реальных автомобилях.11
- Включайте субъективную оценку и принятие. Исследования принятия (например, с водителями грузовиков) показывают, что даже эффективно работающие иконы могут провалиться, если водители считают их запутанными или раздражающими.13
- Итерируйте, как для любого интерфейса. Относитесь к звуковым предупреждениям как к части дизайна интерфейса, а не как к довеску к аппаратуре.
Наш слух уже «свободно говорит» на языке физики повседневной жизни. Аварийные системы, которые используют этот язык — клаксон, визг шин и другие иконы, — изначально имеют преимущество перед теми, что лишь «пикают» и «чирикают».
Литература
Footnotes
-
Robert Graham, “Use of auditory icons as emergency warnings: evaluation within a vehicle collision avoidance application,” Ergonomics 42(9), 1233–1248 (1999). doi:10.1080/001401399185108. ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7 ↩8 ↩9 ↩10 ↩11 ↩12 ↩13 ↩14 ↩15 ↩16 ↩17 ↩18 ↩19
-
William W. Gaver, “Auditory Icons: Using Sound in Computer Interfaces,” Human–Computer Interaction 2(2), 167–177 (1986). doi:10.1207/s15327051hci0202_3. ↩ ↩2 ↩3 ↩4
-
Rob Gray, “Looming Auditory Collision Warnings for Driving,” Human Factors 53(1), 63–74 (2011). doi:10.1177/0018720810397833. ↩ ↩2 ↩3 ↩4
-
Rob Gray, “Does the Warning Need to Be Linked to the Collision Event?,” PLOS ONE 9(1): e87070 (2014). doi:10.1371/journal.pone.0087070. ↩ ↩2
-
Steven M. Belz, Gary S. Robinson, John G. Casali, “A New Class of Auditory Warning Signals for Complex Systems: Auditory Icons,” Human Factors 41(4), 608–618 (1999). doi:10.1518/001872099779656734. ↩ ↩2 ↩3
-
Xingwei Wu, Linda Ng Boyle, Dawn Marshall, West O’Brien, “The effectiveness of auditory forward collision warning alerts,” Transportation Research Part F: Traffic Psychology and Behaviour 59, 164–178 (2018). doi:10.1016/j.trf.2018.08.015. ↩ ↩2 ↩3 ↩4
-
Jiaqing Song et al., “Danger or avoidance indication: Dynamics interact with meaning in auditory icon design,” Accident Analysis & Prevention 170, 106675 (2022). doi:10.1016/j.aap.2022.106675. ↩ ↩2 ↩3
-
João Paulo Cabral, Gerard Bastiaan Remijn, “Auditory icons: Design and physical characteristics,” Applied Ergonomics 78, 224–239 (2019). doi:10.1016/j.apergo.2019.02.008. ↩ ↩2
-
Xingwei Wu et al., “Auditory Messages for Intersection Movement Assist (IMA) Systems,” Human Factors 62(3), 354–372 (2020). Abstract/links via Human Factors journal. ↩
-
Thomas Hermann, Andy Hunt, John G. Neuhoff (eds.), The Sonification Handbook, Chapter 13: “Auditory Icons” (2011). https://sonification.de/handbook. ↩
-
Justin S. MacDonald et al., “Toward a Better Understanding of In-Vehicle Auditory Warnings and Background Noise,” Human Factors 61(5), 771–789 (2019). (Open-access via many institutional links.) ↩ ↩2
-
Xuenan Li, Zhaoyang Xu, “The Impact of Auditory Warning Types and Emergency Obstacle Avoidance Takeover Scenarios on Takeover Behavior,” Proceedings of ICMI ‘24 (2024). doi:10.1145/3678957.3686252. ↩
-
Johan Fagerlönn, “Making Auditory Warning Signals Informative: Examining the Acceptance of Auditory Icons as Warning Signals in Trucks,” in Proceedings of the 6th International Driving Symposium on Human Factors in Driver Assessment, Training and Vehicle Design (2011 / reported 2017). doi:10.17077/drivingassessment.1383. ↩