Слуховое восприятие звуковых сигналов
Восприятием называют познавательный процесс, обусловленный внешними воздействиями, в котором предметы и явления отражаются в виде образов или символов. От воздействия раздражителей на органы чувств субъект испытывает слуховые, зрительные, осязательные, обонятельные, тепловые и другие ощущения [11].
Чистое ощущение восприятия выступает как абстрактное, отвлечённое от конкретных образов, но присущее многим из них общее свойство. Например, высота тона – абстрактное понятие, извлечённое из множества звуковых образов свойство звуков представляться высоким или низким.
Исследование соотношений между результатами чувственных ощущений и физическими параметрами раздражителей – задача психофизики и психоакустики. Прохождение сигналов в процессе восприятия может быть представлено схемой на рис. 3.1.
Со стороны входа на субъект действуют раздражители (стимулы), имеющие физическую природу. Раздражителям или стимулами называют только те физические воздействия, которые могут быть восприняты органами чувств и вызвать ощущения. Слабый, ниже порога слышимости звук частоты 1кГц, считают слуховым стимулом, так как при увеличении его интенсивности субъект воспримет его как звук, а ультразвуковое колебание, какой бы интенсивности оно ни было, стимулом не считают. В формировании воспринимаемого образа и ответного поведения заняты память и внимание. В памяти хранятся образы и реакции, накопленные в результате жизненного опыта. Поэтому память участвует в распознавании образов и выработке модели поведения.
Внимание – создаваемое субъектом ограничение поля восприятия на его определённой части. Благодаря вниманию субъект способен выделить голос собеседника из шума толпы или звучание одного из инструментов оркестра из общего ансамблевого звучания [11, 12].
Различают передачу информации в прямом и обратном направлениях. Прямыми являются пути передачи сигналов от рецепторов и из памяти на входы блока обработки, а также канал передачи управляющих сигналов внимания. Обратные связи обеспечивают корректирование сигналов рецепторов, перебор извлеченных из памяти вариантов реакций и управление вниманием. Содержание образов и, следовательно, поведение зависит не только от стимулов, но и от исходного психического состояния субъекта.
Никакой стимул не вызывает реакции, пока его интенсивность не достигнет определенного порога восприятия. Существует порог яркости, слышимости, концентрации вкусовых или пахучих веществ. Значения порогов не постоянны. Порог заметности стимула данной физической природы не зависит от воздействия на субъект других стимулов той же или иной физической природы. Один стимул может влиять на порог заметности другого.
Основным источником формирования звуковых образов является слух. Понятие «слуховой объект» относится к области ощущений, к восприятию, понятие звуковой объект – к источнику звука [11].
Каждый слуховой образ содержит информацию о направлении на источник звука, объект и его удаленности (т. е. в совокупности о местонахождении источника), о громкости звука, высоте тона, если таковая поддается определению, и тембре звука [11].
Громкость– отображение интенсивности акустического колебания, зависит от значения звукового давления или интенсивности звука.
Высота тона определяется частотой колебаний. Принимают, что между высотой тона и частотой синусоидального акустического сигнала существует взаимно однозначное соответствие: каждому значению частоты в герцах соответствует единственное значение высоты тона по той или иной психоакустической шкале. Сигналы, которым можно приписать определенное значение высоты тона, называют тональными.
В спектре тонального сигнала может не быть составляющей с частотой, эквивалентной по высоте тона синусоидальному сигналу (хаотические или импульсные сигналы).
Тембр – нечетко очерченное понятие, которое включает в себя все признаки звукового образа, кроме громкости, длительности и высоты тона. Качество звуковой аппаратуры и звукового вещания определяется тем, насколько точно передаются и воспроизводятся характеристики тембра звуков: не появляются ли посторонние призвуки и хрипы, сохраняется ли звонкость, объемность и полнота звучания. От такого описания тембра переходят к искажениям сигналов – частотным, фазовым, нелинейным и к техническим показателям (параметрам качества) звуковой аппаратуры.
В музыкальной акустике тембр звучания певческих голосов и музыкальных инструментов описывают иначе; говорят о составе обертонов, атаке и затухании звука, модуляции. От такого описания удобно переходить к особенностям возбуждения звука голосом, особенностям музыкальных инструментов, приемам извлечения звука.
Строение органов слуха.Различают три крупные структуры: наружное, среднее и внутреннее ухо. Звуковые волны от источника звука поступают в ушную раковину. Она является своеобразным рупором, концентрирующим звуковую энергию [11, 12].
Из-за асимметрии ушной раковины диаграммы направленности не одинаковы в разных плоскостях, и это играет роль при определении направления на источник звука в вертикальной плоскости.
Большая часть информации, поступающей от левого уха, передается в правое полушарие мозга и, наоборот, большая часть информации, поступающей от правого уха, передается в левое полушарие. В слуховых отделах ствола головного мозга определяются высота тона, интенсивность звука и некоторые признаки тембра – производится первичная обработка сигналов.
Через слуховой проход, представляющий собой акустический волновод, звуковые колебания подводятся к барабанной перепонке. Наружное и среднее ухо в совокупности являются преобразователем акустических колебаний окружающей среды в механические колебания стремечка, причем амплитуда колебаний увеличивается в десятки раз.
Во внутреннем ухе находятся орган равновесия – вестибулярный аппарат – с тремя полукружными каналами, расположенными в трех взаимно перпендикулярных плоскостях, и орган слуха – спиралеобразная улитка.
Специфическая частотная характеристика чувствительности слуха со спадами чувствительности по краям звукового диапазона определяется резонансными свойствами наружного и внутреннего уха. Резонансная частота барабанной перепонки лежит в области частот от 1,2 до 1,4 кГц, слухового прохода – от 3 до 4 кГц, комбинация слуховых косточек – в области частот 2,5...3,0 кГц. Рычажное устройство среднего уха превращает акустическое колебание с большой колебательной скоростью и небольшим звуковым давлением в колебания лимфы с небольшой скоростью и большим давлением [11, 12].
Преобразования звука слуховой системы в нервные раздражения объясняют гидродинамической теорией слуха [11].
Физиологические свойства слуха определяются многими понятиями, численными параметрами и характеристиками.
К ним относятся динамический и частотный диапазоны, чувствительность слуха и ее АЧХ, абсолютные и дифференциальные пороги восприятия, явление маскировки, нелинейные, временные и пространственные свойства и т. п. [11].
Динамический диапазон слуха ограничен со стороны малых уровней порогом слышимости (Р0 = 2·10–5 Па, I0 = 10–12 Вт/м2, N0 = 0 дБ), сверху – болевым порогом (Рmax = 20 Па, Imax = 1 Вт/м2, Nmax = 120 дБ). Разумный порог слышимости установился в процессе эволюции. Значение звукового давления на пороге слышимости всего лишь на порядок более давления, соответствующего тепловому движению молекул воздуха. Если бы слух был более чувствительным, люди непрерывно бы слышали шум, обусловленный этим хаотическим движением молекул. Превышение болевого порога приводит к разрушению органа слуха.
Амплитудно-частотная характеристика слуха сильно изменяется с изменением интенсивности сигнала и лишь при интенсивностях 90... 110 дБ приближается к горизонтали. Уменьшение чувствительности на крайних частотах при небольших интенсивностях звука приводит к тому, что при слушании звучания с небольшой громкостью происходит сужение частотного диапазона слышимых звуков.
Нижней границей диапазона слышимых звуков называют 16...20 Гц, верхней – 16... 20 кГц. Нижняя граница довольно устойчива, верхняя заметно снижается с возрастом. Многие люди в возрасте старше 50 лет не слышат звуков с частотами более 10... 12 кГц.
Механические (акустические) колебания с частотой менее 16... 20 Гц (инфразвуки) и более 20 кГц (ультразвуки) не воспринимаются слухом, но при большой интенсивности оказывают на человека вредное физиологическое воздействие. В области нижних частот находятся резонансные частоты некоторых внутренних органов: желудка – 27 Гц, сердца – 17 и 23 Гц, корпуса человека – примерно 10 Гц. При частотах 6... 7 Гц у человека возникает чувство страха, тревоги.
Логарифмическая зависимость ощущения от раздражения привела к введению логарифмических величин интенсивности – уровней, единиц их выражения – децибелов (дБ) и неперов – и логарифмического масштаба частот. Каждое удвоение частоты звука вызывает одинаковое изменение высоты тона, называемое октавой.
Слуху, как и другим органам чувств, свойственно квантование ощущений. Для слуха дифференциальные пороги ощущения относятся к изменению раздражителя по интенсивности и частоте. Большинство людей замечают изменения громкости при изменении звукового давления на 6... 12 %, т.е. при изменении уровня на 0,5... 1,0 дБ. На частоте 1000 Гц человек различает около 300 градаций громкости. К краям частотного диапазона слуха число различаемых градаций уменьшается: до 34 на частоте 62 Гц и 119 на частоте 8000 Гц [11].
Нелинейные свойства объясняют несимметричной формой колебаний барабанной перепонки и других частей органов слуха. На чистых тонах нелинейность проявляется в появлении гармоник, на колебаниях со сложным спектром – в появлении комбинационных частот. Нелинейные искажения слуха особенно заметны на сложных звуках со многими частотными составляющими. Маскирующее действие помех проявляется в ухудшении художественного впечатления от музыки, а на речи – в снижении разборчивости. Действие помех с максимумом уровней на нижних и верхних частотах различны. Помеха нижних частот маскирует полезное звучание верхних частот, верхняя частотная помеха не маскирует звучание нижних частот. Если помеха широкополосная, то даже при большом превышении ее общего уровня над уровнем прослушиваемого тона последний будет услышан, т.к. уровень помех, находящихся в пределах критической полоски, в которой содержится и прослушиваемый тон, может быть сравнительно небольшим. При помехе с равномерным спектром с составляющими от 100 до 5000 Гц, тон будет услышан, даже если уровень помехи превышает уровень тона на 15 дБ.
Восприятие музыкальных сигналов.Чистые тоны, т.е. синусоидальные акустические сигналы, лишены тембральных признаков, поэтому слуховой анализатор уподобляют преобразователю. Параметрами сигнала со стороны входа служат значение звукового давления и частота. Параметрами выходного сигнала являются громкость и высота тона.
Широко используется музыкальная шкала высот тона. В ее основе лежит высотный интервал октава, соответствующий изменению частоты в два раза. Октавный интервал делится в так называемой хроматической гамме на 12 полутонов. Каждый полутон соответствует изменению частоты в , т.е. на 6 %. Частотный диапазон от 20 до 20000 Гц занимает примерно 10 октав.
В терминах музыкальной шкалы описывают некоторые характеристики звукотехнической аппаратуры. Так, крутизну спада или подъема АЧХ выражают в децибелах на октаву (дБ/окт), пользуются понятиями: октавные, полуоктавные, третьоктавные фильтры.
Чувствительность слуха к звукам различных частот различна. Эта зависимость выражается кривыми равной громкости (изофонами).
Семейство кривых равной громкости (изофонов) можно рассматривать как совокупность частотных характеристик слуховой системы, измеренных на ее выходе. При подобных измерениях значение выходного сигнала (в данном случае громкость) поддерживают постоянным и регистрируют зависимость выходного сигнала от частоты.
Восприятие высоты музыкальных звуков.Из всего диапазона слышимых звуков от 20 до 20000 Гц для построения музыкальных звучаний используют сравнительно небольшой участок – от 100 до 3400 Гц. Эти звуки воспринимаются слухом как имеющие определенную высоту. Основные частоты большинства музыкальных инструментов занимают область частот 100... 3400 Гц. Гармоники основных частот находятся выше. Лишь у немногих музыкальных инструментов основные частоты лежат ниже 100 Гц (например, у контрабаса, басовой трубы, органа) или выше 4 кГц. Звуки с частотами выше 4 кГц не поддаются в отдельности точной высотной оценке. При возбуждении в этой области звуков двух частот человек не может определить, какой из них выше [11].
Гармоники (обертоны) основных частот, попавшие в область 10...20 кГц, имеют малый уровень и воспринимаются многими людьми как призвук, "скрипение". Колебания с частотами 10... 20 кГц, будучи искусственно значительно усилены, оказывают на некоторых людей отрицательное психическое влияние и вызывают у них состояние депрессии. Отрицательное воздействие могут оказать на человека и колебания инфразвуковых (сверхнизких) частот, поскольку в области ниже 20 Гц находятся резонансные частоты некоторых физиологических процессов в органах человека.
Звуки разных частот неравноценны в музыкальном отношении. Это объясняется особенностями слуха, выраженными явлением маскировки и кривыми равной громкости. Низкий тон большой интенсивности может полностью замаскировать тон более высокой частоты, но даже слабый звук нижних частот остается хорошо различимым в сопровождении интенсивного звука более высокой частоты [11].
Степень полноты, детальности слухового ощущения в диапазоне частот неодинакова. Наиболее информативна область средних частот примерно от 300 до 3000 Гц. Она наиболее благоприятна для различения сложных гармонических сочетаний звуков – аккордов. По мере повышения частоты количество слышимых гармоник уменьшается ввиду снижения чувствительности слуха и усиления маскировки высших гармоник более интенсивными нижележащими. В высоком регистре возрастает роль основной частоты. Звуки частот выше 4 кГц быстро теряют музыкальную значимость.
Пространственные свойства слуха. Важное свойство слуха – бинауральный эффект – восприятие звуков двумя ушами. Он основан на тонком анализе поступающей в мозг информации. Естественно, он возможен с помощью тех отделов мозга, в которые поступает информация и от левого, и от правого уха.
На частотах менее 150 Гц локализация невозможна, и этот эффект используется в современных звуковых системах. Минимальная погрешность локализации слуха в горизонтальной плоскости составляет на частотах 0,05... 0,5 кГц 3,8°, в области частот 0,5... 7 кГц – 0,5°, в полосе частот 0,05... 7 кГц в среднем – 0,7°. Погрешность локализации в вертикальной плоскости гораздо больше и составляет примерно 10...150.
Пеленгационные свойства слуха проявляются не всегда. Иногда, особенно при узкополосных сигналах, возникает грубая ошибка: кажущийся источник звука находится в противоположном направлении от реального. При широкополосных сигналах эта ошибка уменьшается, но угловые ошибки иногда доходят до 10º. У людей ведущая роль в ориентировке принадлежит зрению. Когда звук услышан и направление его прихода грубо определено, срабатывает безусловный зрительно-слуховой рефлекс: человек непроизвольно поворачивает голову и определяет направление на источник звука с помощью зрения.
Определение направления на звучащий источник в вертикальной плоскости первоначально вырабатывается также в результате взаимодействия слуха и зрения. В силу несимметричной формы ушных раковин при приходе звука с разных направлений в вертикальной плоскости происходит изменение спектра звука вследствие фильтрующих свойств ушных раковин. Пространственный слух человека развивается и совершенствуется по мере взросления человека.
Для специалиста звукового и телевизионного вещания наибольший интерес представляет тот случай, когда положение слухового объекта и источника звука не совпадают, как это имеет место при стереофонии. Важная задача: в помещении слушателя добиться расположения слуховых объектов и в тех местах, где нет громкоговорителей. Понимание закономерностей пространственного слуха позволило правильно подойти к разработке систем и устройств стереофонии.
Список рекомендуемой литературы:[3, c. 47–50, 233–234; 8, c. 46–50, 161–168; 10, c. 17–28, 46–60; 11, 12, 24 – 27, 30].
Контрольные вопросы
1. Охарактеризуйте график АЧХ слуха.
2. Опишите слуховой тракт человека.
3. Перечислите основные свойства слухового анализатора человека.
4. Что понимают под порогом слышимости?
5. Что понимают частотной маскировкой слуха?
6. Какой частотный диапазон шире: речевого сигнала или слухового восприятия? Дайте раздернутый ответ.