Пространственное восприятие звука

Восприятие направления источника звука, т.е. его положение в пространстве, определяется двумя физическими параметрами стимуляции или бинауральными признаками, определяемыми по­ложением головы наблюдателя относительно источника звука. Во-первых, это разница во времени поступления звуковых сигналов в оба уха, создающая определенный фазовый сдвиг между сигнала­ми, она называется интеруральной задержкой. Во-вторых, это раз­личие интенсивности сигналов, поступающих в каждое ухо. Кроме того, важное значение для точной локализации звука имеют дви­жения головы и форма ушной раковины. Имеются данные о том, что неподвижность головы и изменение акустических свойств ушной раковины снижают точность локализации звуков.

Механизм бинауралъного слуха, основанный на оценке интеру­ральной задержки (рис. 61), хорошо работает для низко- и средне-частотных сигналов, длительность периода которых превышает максимальную величину интеруральной задержки (180°).

Например, для тонального сигнала 1 000 Гц период колебания равен 1 мс, и если этот источник звука сдвинут в горизонталь­ной плоскости вправо на 62°, то интеруральная задержка соста­вит 0,5 мс. Это означает, что звуковое колебание, поступающее в левое ухо, придет на половину периода позже, чем в правое. Такие фазовые различия в пре­делах одного периода могут надежно ко­дировать положение источника звука в пространстве.

Пространственное восприятие звука - student2.ru Однако для высокочастотных звуков
такая система оценки направления ис­
точника звуковых колебаний дает сбой.
Дело в том, что при предъявлении тона
10 000 кГц период этого колебания ра-
Рис. 61. Влияние интеру- вен всего 0,1 мс, и наша слуховая сис-
ральной задержки на про- тема не имеет достаточной разрешаю-
странственную локализа- щей способности для однозначной
цию звука: оценки несинфазности таких частых

А и Б — два различных звука колебаний. Например, если источник

звука сдвинут также вправо на 62°, то фазовые различия соста­вят 0,5/0,1 = 5 периодов. Таким образом, создается неопределен­ная картина: наша слуховая система не может в пределах одного периода однозначно определить величину фазового сдвига между сигналами, пришедшими в оба уха. В силу такого ограничения при воздействии высокочастотных звуков мы не можем с достаточной точностью локализовать их в пространстве только на основании одной лишь детекции величины разности времени поступления звуковых колебаний в разные уши. Для высокочастотных звуков более надежен другой механизм — фиксация разницы в интенсив-ностях поступающих сигналов (рис. 62).

Это становится возможным благодаря так называемой акусти­ческой тени, возникающей в нашей голове: высокочастотные ко­лебания, поступающие справа или слева от человека по-разному отражаются от головы, и поэтому интенсивности звуков, посту­пающих в левое и правое ухо, заметно отличаются. Например, для звука 10000 Гц, расположенного на 15° справа от наблюдателя эта разница составляет 6 дБ. Для низкочастотных звуков, например 400 — 500 Гц, наоборот, различие по интенсивности сигналов, приходящих в левое и правое ухо очень незначительны и не могут быть надежным признаком для установления локализации звука в пространстве. Таким образом, для звуков до 1 300 Гц надежно ра­ботает система оценки различия по времени, а начиная с 3 000 Гц — различия по интенсивности.

Точность локализации звуков в пространстве зависит от поло­жения источника звука. Максимальная точность локализации дос­тигается во фронтальной плоскости, когда источник звука нахо­дится прямо перед наблюдателем, здесь ошибка локализации не превышает 2 — 3°. Точность локализации звуков снижается, когда их источник оказывается сбоку или сзади наблюдателя, в этих случаях ошибка может достигать 20°.

Практическое использование этих двух бинауральных призна­ков ВОПЛОТИЛОСЬ при СОЗдаНИИ современной компьютерной СИ-Акустическая тень

С

ук / / 200Ги КлШ /////// 16(Ю0П*

Рис. 62. Влияние интеруральной разницы по интенсивности на простран­ственную локализацию звука: а — воздействие звука 200 Гц; б — воздействие звука 6 000 Гц

стемы индивидуальной навигации для слепых [177, 178]. Слепой че­ловек обеспечивается системой спутниковой навигации (так на­зываемая СР8-система) и карманным компьютером с подробной картой. На основании полученной информации о положении раз­личных объектов (например, автобусная остановка, телефонная будка, магазин) компьютерный синтезатор сообщает об этом го­лосом. Эти сообщения предъявляются через наушники таким об­разом, что учитываются оба бинауральных признака — задержка во времени и разность по интенсивности, поэтому человек полу­чает не только информацию о том, что расположено около него, но и может определять свое точное положение относительно како­го-либо объекта.

При перемещении звука, находящегося во фронтальной плос­кости, вверх-вниз ни величина интеруральной задержки, ни раз­ница в интенсивности звука не могут нести информацию о поло­жении объекта, поскольку звуковой сигнал доходит до обоих ушей одновременно и с одинаковой интенсивностью. В таких условиях работают другие сенсорные признаки. Специальные исследования показали, что до того, как звук попадает в слуховой канал, он многократно отражается от поверхности головы и ушной ракови­ны. В силу своих акустических свойств поверхность головы и уш­ной раковины действуют для разных частот как своего рода уси­лители или аттенюаторы, т.е. по-разному усиливают или ослабля­ют различные звуковые частоты. Поэтому частотный состав дей­ствующего звука и того звука, который в итоге попадает на бара­банную перепонку, отличаются в зависимости от того, сверху или снизу пришел этот звук. Следовательно, такие частотные разли­чия могут служить признаками смещения источника звука вверх-вниз во фронтальной плоскости. Эти различия получили название дирекциональной переходной функции (рис. 63).

Например, для звуков, пришедших снизу, ДПФ показывает ос­лабление частот 6, 11 и 14 кГц; для звуков, расположенных прямо перед наблюдателем, имеет место ослабление на частоте 10 кГц и усиление частоты 13 кГц; для звуков, пришедших сверху, имеет место существенное ослабление в диапазоне 8—10 кГц. Таким образом, исследования последних лет [184; 225] показали, что звуковые частотные паттерны могут кодировать локализацию зву­ков, смещенных в пространстве вверх или вниз от наблюдателя. Насколько данный механизм эффективен для локализации низ­кочастотных звуков пока остается неясно, данные исследования связаны с рядом проблем технического характера [184; 225].

Интересно, что в естественных условиях (в отличие от специ­альных экспериментальных помещений) звуковые волны, дей­ствующие на человека, многократно отражаются от различных поверхностей, тем самым создавая многочисленные эхо. Казалось бы, эти отраженные звуки должны затруднять локализацию ис-


+ 40'

Пространственное восприятие звука - student2.ru О)


Пространственное восприятие звука - student2.ru

-40


_]_______ I_______ I_______ I_______ 1_

0 2 4 6 8 10 12 14 16 Частота, кГц

Рис. 63. Влияние частотных различий на локализацию звука в простран­стве — дирекциональная переходная функция:

ось ординат — различие в уровне звукового давления; ось абсцисс — частота действующего звука, кГц [158]

точника звука в пространстве. Тем не менее мы слышим только один звук и не воспринимаем звуки, отраженные от окружающих нас объектов. Особенность нашего бинаурального слуха такова, что слуховая система игнорирует (или подавляет) поступление вторичных или отраженных звуков и ориентируется лишь на пер­вый пришедший звук. Этот замечательный эффект получил назва­ние эффекта предшествования, без него пространственная лока­лизация источников звука была бы затруднительна. Этот феномен восприятия только того источника звука, который первым достиг нашего уха, был впервые описан в работе известного американс­кого психолога Г.Уоллаха и его сотрудников (1949). В современ­ных исследованиях Р. Литовски и ее соавторов (1997—1999) уста­новлено, что при восприятии щелчков, поступающих из двух гром­коговорителей, между которыми вводится временная задержка, возникают интересные перцептивные эффекты [158].

Когда звуки подавались одновременно (нулевая задержка), ис­пытуемые слышали звук, локализованный посредине между дву­мя громкоговорителями, т.е. происходило перцептивное слияние двух звуков (рис. 64). Когда звук первым предъявлялся из правого источника, и задержка была небольшой (задержка от 0,1 до 1 мс), испытуемые слышали также один звук, смещенный в сторону правого источника. При увеличении величины задержки от 1 до 5 мс звук слышался поступающим из правого источника, т.е. возникал типичный эффект предшествования. При возрастании временной


Пространственное восприятие звука - student2.ru

Пространственное восприятие звука - student2.ru

Левый

Пространственное восприятие звука - student2.ru

Восприятие

о

Перцептивное

слияние

звуков

Правый

Пространственное восприятие звука - student2.ru

Задержка

Восприятие

О



Пространственное восприятие звука - student2.ru

Пространственное восприятие звука - student2.ru



Пространственное восприятие звука - student2.ru

Пространственное восприятие звука - student2.ru

Восприятие

Пространственное восприятие звука - student2.ru

Воспринимается вторым

Пространственное восприятие звука - student2.ru

Воспринимается первым

Пространственное восприятие звука - student2.ru



Задержка

Эффект предшествования

Задержка более 5 мс



Пространственное восприятие звука - student2.ru

Пространственное восприятие звука - student2.ru


Рис. 64. Эффект предшествования:

а — звуки из правого и левого громкоговорителей приходят одновременно; б задержка между правым и левым от 0,1 до 1 мс; в — задержка от 1 до 5 мс; г

задержка более 5 мс [158]

задержки свыше 5 мс слияния двух звуков не возникало и испыту­емые слышали последовательность из двух звуков. В психоакустике эта критическая величина в 5 мс получила название порог вре­менного слияния двух звуков или эхо-порог. В некотором роде он аналогичен порогу стереозрения. Для более длительных звуков по сравнению со щелчками, таких как речь или музыка, порог вре­менного слияния имеет большую величину. То же самое происхо­дит в том случае, когда второй звук тише, чем первый. Например, мы не слышим отраженные от стен звуки в небольшой комнате или в большом концертном зале, хотя ослабленные звуковые вол­ны достигают наших ушей с задержками, превышающими 5 или даже 10 мс. Из изучения эффекта предшествования следует один важный практический вывод: помещение с так называемой «хо­рошей акустикой» — это такое помещение, в котором эффекты множественного отражения звуков или их реверберация минималь­ны, и у слушателей не возникает перцептивных эффектов, вы-

званных сложным наложением друг на друга прямых и отражен­ных звуков. В таких помещениях музыка звучит «чисто», а речь — разборчиво.

Возможность пространственной локализации звука имеет боль­шое значение для повышения разборчивости речи в условиях внеш­него шума: мы избирательно прислушиваемся к интересующим нас звукам, точно выбирая их локализацию в пространстве. Этот эффект особенно заметен при сравнении нашей способности распознать речь другого человека в естественной обстановке и воспроизводимую че­рез диктофон. Диктофонная запись в условиях посторонних шумов плохо разборчива, а в естественных условиях мы очень эффективно отстраиваемся от этих помех, успешно локализуя интересующий нас источник звука в пространстве. Как следствие этого факта, разбор­чивость речи заметно повышается при прослушивании стереофони­ческой записи, даже если она зашумлена.

Еще один интересный бинауральный эффект, обеспечивающий повышение ясности слухового восприятия, называется разностью уровней маскировки. Специальные исследования показали, что, когда мы прислушиваемся к тихому голосу на фоне достаточно интен­сивного шума, ясность восприятия речевого сигнала может быть достаточно низкой, добавление такого же шума в другое ухо повы­шает разборчивость речи. Таким образом, включение бинаурально-го механизма детекции разницы пространственного положения зву­ков может приводить в увеличению четкости восприятия.

Из описания данного феномена следует весьма полезная рекоменда­ция для любителей говорить по сотовому телефону в любом, даже весьма шумном, месте: к источнику сильного шума следует повернуться другим («нерабочим») ухом, прикрыв его ладонью для уравнивания уровней шума в обоих ушах.

Эффект бинауральной маскировки следует учитывать также и нахо­дясь в концертном зале. Для того чтобы четко воспринять звучание раз­ных инструментов, например дифференцировать низкочастотные звуки кларнета и барабана, следует так повернуть голову, чтобы звуки одного инструмента попадали преимущественно в одно ухо, а другого — в дру­гое. В этом случае звуки обоих инструментов будут в меньшей степени маскировать друг друга, не создавая сходные зоны возбуждения на бази-лярной мембране одного уха, а распределяясь на оба уха.

Наблюдения и результаты специальных исследований показы­вают, что у некоторых слепых людей обнаруживается высокая спо­собность к локализации в пространстве невидимых ими предме­тов посредством слухового восприятия. Используя весьма эври-стичный термин Дж. Гибсона, слепые люди научаются извлекать информацию об отраженных звуках с точностью, достаточной, что­бы надежно локализовать расположенный перед ними объект. В из­вестной статье «Система звуковой локации у слепых» американ-

ский психолог У. Келлог сообщил о способности слепых людей использовать слуховые ощущения, полученные в результате отра­женных от внешних объектов звуков, не только для того, чтобы получить информацию об удаленности этих объектов, но и об их размере и материале, из которого они изготовлены (металл, ткань, дерево, стекло) [173]. Примечательно, что звуки, отражаемые от внешних объектов, создавали сами испытуемые, многократно повторяя одно и то же слово. Имеются весьма надежные данные о том, что не только слепые, но и зрячие люди научаются воспри­нимать пространственные соотношения и свойства предметов, пользуясь только слухом.

Наши рекомендации