Пространственное восприятие звука
Восприятие направления источника звука, т.е. его положение в пространстве, определяется двумя физическими параметрами стимуляции или бинауральными признаками, определяемыми положением головы наблюдателя относительно источника звука. Во-первых, это разница во времени поступления звуковых сигналов в оба уха, создающая определенный фазовый сдвиг между сигналами, она называется интеруральной задержкой. Во-вторых, это различие интенсивности сигналов, поступающих в каждое ухо. Кроме того, важное значение для точной локализации звука имеют движения головы и форма ушной раковины. Имеются данные о том, что неподвижность головы и изменение акустических свойств ушной раковины снижают точность локализации звуков.
Механизм бинауралъного слуха, основанный на оценке интеруральной задержки (рис. 61), хорошо работает для низко- и средне-частотных сигналов, длительность периода которых превышает максимальную величину интеруральной задержки (180°).
Например, для тонального сигнала 1 000 Гц период колебания равен 1 мс, и если этот источник звука сдвинут в горизонтальной плоскости вправо на 62°, то интеруральная задержка составит 0,5 мс. Это означает, что звуковое колебание, поступающее в левое ухо, придет на половину периода позже, чем в правое. Такие фазовые различия в пределах одного периода могут надежно кодировать положение источника звука в пространстве.
Однако для высокочастотных звуков
такая система оценки направления ис
точника звуковых колебаний дает сбой.
Дело в том, что при предъявлении тона
10 000 кГц период этого колебания ра-
Рис. 61. Влияние интеру- вен всего 0,1 мс, и наша слуховая сис-
ральной задержки на про- тема не имеет достаточной разрешаю-
странственную локализа- щей способности для однозначной
цию звука: оценки несинфазности таких частых
А и Б — два различных звука колебаний. Например, если источник
звука сдвинут также вправо на 62°, то фазовые различия составят 0,5/0,1 = 5 периодов. Таким образом, создается неопределенная картина: наша слуховая система не может в пределах одного периода однозначно определить величину фазового сдвига между сигналами, пришедшими в оба уха. В силу такого ограничения при воздействии высокочастотных звуков мы не можем с достаточной точностью локализовать их в пространстве только на основании одной лишь детекции величины разности времени поступления звуковых колебаний в разные уши. Для высокочастотных звуков более надежен другой механизм — фиксация разницы в интенсив-ностях поступающих сигналов (рис. 62).
Это становится возможным благодаря так называемой акустической тени, возникающей в нашей голове: высокочастотные колебания, поступающие справа или слева от человека по-разному отражаются от головы, и поэтому интенсивности звуков, поступающих в левое и правое ухо, заметно отличаются. Например, для звука 10000 Гц, расположенного на 15° справа от наблюдателя эта разница составляет 6 дБ. Для низкочастотных звуков, например 400 — 500 Гц, наоборот, различие по интенсивности сигналов, приходящих в левое и правое ухо очень незначительны и не могут быть надежным признаком для установления локализации звука в пространстве. Таким образом, для звуков до 1 300 Гц надежно работает система оценки различия по времени, а начиная с 3 000 Гц — различия по интенсивности.
Точность локализации звуков в пространстве зависит от положения источника звука. Максимальная точность локализации достигается во фронтальной плоскости, когда источник звука находится прямо перед наблюдателем, здесь ошибка локализации не превышает 2 — 3°. Точность локализации звуков снижается, когда их источник оказывается сбоку или сзади наблюдателя, в этих случаях ошибка может достигать 20°.
Практическое использование этих двух бинауральных признаков ВОПЛОТИЛОСЬ при СОЗдаНИИ современной компьютерной СИ-Акустическая тень
С |
ук / / 200Ги КлШ /////// 16(Ю0П*
Рис. 62. Влияние интеруральной разницы по интенсивности на пространственную локализацию звука: а — воздействие звука 200 Гц; б — воздействие звука 6 000 Гц
стемы индивидуальной навигации для слепых [177, 178]. Слепой человек обеспечивается системой спутниковой навигации (так называемая СР8-система) и карманным компьютером с подробной картой. На основании полученной информации о положении различных объектов (например, автобусная остановка, телефонная будка, магазин) компьютерный синтезатор сообщает об этом голосом. Эти сообщения предъявляются через наушники таким образом, что учитываются оба бинауральных признака — задержка во времени и разность по интенсивности, поэтому человек получает не только информацию о том, что расположено около него, но и может определять свое точное положение относительно какого-либо объекта.
При перемещении звука, находящегося во фронтальной плоскости, вверх-вниз ни величина интеруральной задержки, ни разница в интенсивности звука не могут нести информацию о положении объекта, поскольку звуковой сигнал доходит до обоих ушей одновременно и с одинаковой интенсивностью. В таких условиях работают другие сенсорные признаки. Специальные исследования показали, что до того, как звук попадает в слуховой канал, он многократно отражается от поверхности головы и ушной раковины. В силу своих акустических свойств поверхность головы и ушной раковины действуют для разных частот как своего рода усилители или аттенюаторы, т.е. по-разному усиливают или ослабляют различные звуковые частоты. Поэтому частотный состав действующего звука и того звука, который в итоге попадает на барабанную перепонку, отличаются в зависимости от того, сверху или снизу пришел этот звук. Следовательно, такие частотные различия могут служить признаками смещения источника звука вверх-вниз во фронтальной плоскости. Эти различия получили название дирекциональной переходной функции (рис. 63).
Например, для звуков, пришедших снизу, ДПФ показывает ослабление частот 6, 11 и 14 кГц; для звуков, расположенных прямо перед наблюдателем, имеет место ослабление на частоте 10 кГц и усиление частоты 13 кГц; для звуков, пришедших сверху, имеет место существенное ослабление в диапазоне 8—10 кГц. Таким образом, исследования последних лет [184; 225] показали, что звуковые частотные паттерны могут кодировать локализацию звуков, смещенных в пространстве вверх или вниз от наблюдателя. Насколько данный механизм эффективен для локализации низкочастотных звуков пока остается неясно, данные исследования связаны с рядом проблем технического характера [184; 225].
Интересно, что в естественных условиях (в отличие от специальных экспериментальных помещений) звуковые волны, действующие на человека, многократно отражаются от различных поверхностей, тем самым создавая многочисленные эхо. Казалось бы, эти отраженные звуки должны затруднять локализацию ис-
+ 40' |
О)
-40 |
_]_______ I_______ I_______ I_______ 1_
0 2 4 6 8 10 12 14 16 Частота, кГц
Рис. 63. Влияние частотных различий на локализацию звука в пространстве — дирекциональная переходная функция:
ось ординат — различие в уровне звукового давления; ось абсцисс — частота действующего звука, кГц [158]
точника звука в пространстве. Тем не менее мы слышим только один звук и не воспринимаем звуки, отраженные от окружающих нас объектов. Особенность нашего бинаурального слуха такова, что слуховая система игнорирует (или подавляет) поступление вторичных или отраженных звуков и ориентируется лишь на первый пришедший звук. Этот замечательный эффект получил название эффекта предшествования, без него пространственная локализация источников звука была бы затруднительна. Этот феномен восприятия только того источника звука, который первым достиг нашего уха, был впервые описан в работе известного американского психолога Г.Уоллаха и его сотрудников (1949). В современных исследованиях Р. Литовски и ее соавторов (1997—1999) установлено, что при восприятии щелчков, поступающих из двух громкоговорителей, между которыми вводится временная задержка, возникают интересные перцептивные эффекты [158].
Когда звуки подавались одновременно (нулевая задержка), испытуемые слышали звук, локализованный посредине между двумя громкоговорителями, т.е. происходило перцептивное слияние двух звуков (рис. 64). Когда звук первым предъявлялся из правого источника, и задержка была небольшой (задержка от 0,1 до 1 мс), испытуемые слышали также один звук, смещенный в сторону правого источника. При увеличении величины задержки от 1 до 5 мс звук слышался поступающим из правого источника, т.е. возникал типичный эффект предшествования. При возрастании временной
Левый
Восприятие
о
Перцептивное
слияние
звуков
Правый
Задержка
Восприятие
О
Восприятие
Воспринимается вторым
Воспринимается первым
Задержка
Эффект предшествования
Задержка более 5 мс
Рис. 64. Эффект предшествования:
а — звуки из правого и левого громкоговорителей приходят одновременно; б задержка между правым и левым от 0,1 до 1 мс; в — задержка от 1 до 5 мс; г
задержка более 5 мс [158]
задержки свыше 5 мс слияния двух звуков не возникало и испытуемые слышали последовательность из двух звуков. В психоакустике эта критическая величина в 5 мс получила название порог временного слияния двух звуков или эхо-порог. В некотором роде он аналогичен порогу стереозрения. Для более длительных звуков по сравнению со щелчками, таких как речь или музыка, порог временного слияния имеет большую величину. То же самое происходит в том случае, когда второй звук тише, чем первый. Например, мы не слышим отраженные от стен звуки в небольшой комнате или в большом концертном зале, хотя ослабленные звуковые волны достигают наших ушей с задержками, превышающими 5 или даже 10 мс. Из изучения эффекта предшествования следует один важный практический вывод: помещение с так называемой «хорошей акустикой» — это такое помещение, в котором эффекты множественного отражения звуков или их реверберация минимальны, и у слушателей не возникает перцептивных эффектов, вы-
званных сложным наложением друг на друга прямых и отраженных звуков. В таких помещениях музыка звучит «чисто», а речь — разборчиво.
Возможность пространственной локализации звука имеет большое значение для повышения разборчивости речи в условиях внешнего шума: мы избирательно прислушиваемся к интересующим нас звукам, точно выбирая их локализацию в пространстве. Этот эффект особенно заметен при сравнении нашей способности распознать речь другого человека в естественной обстановке и воспроизводимую через диктофон. Диктофонная запись в условиях посторонних шумов плохо разборчива, а в естественных условиях мы очень эффективно отстраиваемся от этих помех, успешно локализуя интересующий нас источник звука в пространстве. Как следствие этого факта, разборчивость речи заметно повышается при прослушивании стереофонической записи, даже если она зашумлена.
Еще один интересный бинауральный эффект, обеспечивающий повышение ясности слухового восприятия, называется разностью уровней маскировки. Специальные исследования показали, что, когда мы прислушиваемся к тихому голосу на фоне достаточно интенсивного шума, ясность восприятия речевого сигнала может быть достаточно низкой, добавление такого же шума в другое ухо повышает разборчивость речи. Таким образом, включение бинаурально-го механизма детекции разницы пространственного положения звуков может приводить в увеличению четкости восприятия.
Из описания данного феномена следует весьма полезная рекомендация для любителей говорить по сотовому телефону в любом, даже весьма шумном, месте: к источнику сильного шума следует повернуться другим («нерабочим») ухом, прикрыв его ладонью для уравнивания уровней шума в обоих ушах.
Эффект бинауральной маскировки следует учитывать также и находясь в концертном зале. Для того чтобы четко воспринять звучание разных инструментов, например дифференцировать низкочастотные звуки кларнета и барабана, следует так повернуть голову, чтобы звуки одного инструмента попадали преимущественно в одно ухо, а другого — в другое. В этом случае звуки обоих инструментов будут в меньшей степени маскировать друг друга, не создавая сходные зоны возбуждения на бази-лярной мембране одного уха, а распределяясь на оба уха.
Наблюдения и результаты специальных исследований показывают, что у некоторых слепых людей обнаруживается высокая способность к локализации в пространстве невидимых ими предметов посредством слухового восприятия. Используя весьма эври-стичный термин Дж. Гибсона, слепые люди научаются извлекать информацию об отраженных звуках с точностью, достаточной, чтобы надежно локализовать расположенный перед ними объект. В известной статье «Система звуковой локации у слепых» американ-
ский психолог У. Келлог сообщил о способности слепых людей использовать слуховые ощущения, полученные в результате отраженных от внешних объектов звуков, не только для того, чтобы получить информацию об удаленности этих объектов, но и об их размере и материале, из которого они изготовлены (металл, ткань, дерево, стекло) [173]. Примечательно, что звуки, отражаемые от внешних объектов, создавали сами испытуемые, многократно повторяя одно и то же слово. Имеются весьма надежные данные о том, что не только слепые, но и зрячие люди научаются воспринимать пространственные соотношения и свойства предметов, пользуясь только слухом.