Маскировка звуковых сигналов
В реальной жизни нам довольно редко приходится иметь дело со звуками, которые возникают и существуют в полной тишине, т.е. при отсутствии других звуков. Чаще всего приходится прослушивать сразу несколько одновременно существующих звуковых сигналов, из которых интересен для нас может оказаться всего один – остальные будут только мешать восприятию желаемого. А если посторонние звуки являются достаточно громкими, то нужный звук можно и не расслышать вовсе. Явление, когда при воздействии на органы слуха двух звуков один из них может не прослушиваться на фоне другого, называется маскировкой.
Маскировка возникает в результате взаимодействия звуковых сигналов, следствием которого является изменение порога слышимости одного из них (маскируемого) в присутствии другого (маскирующего или маскера).
Существует несколько видов маскировки, которые проявляются в зависимости от способа взаимодействия маскера и маскируемого сигнала и от характера каждого из них:
- одновременная или моноауральная маскировка, проявляющаяся в тех случаях, когда оба сигнала существуют в одно и то же время;
- временнáя маскировка, которая проявляется при неодновременном существовании маскера и маскируемого сигнала либо когда маскер кратковременно накладывается на маскируемый звук;
- центральная или бинауральная маскировка, проявляющаяся, когда маскер и маскируемый сигнал воздействуют на разные уши слушателя;
- бинауральная демаскировка, позволяющая на фоне общего маскирующего шума расслышать интересующий слушателя источник звука.
Одновременная маскировка
При одновременной маскировке маскирующее действие звуков различного характера определяется путем вычисления разницы между порогом слышимости исследуемого звука в полной тишине (абсолютным порогом слышимости данного звука) и порогом слышимости того же звука при воздействии маскера (испытательного тона или узкополосного шума). Эта разница называется степенью маскировки.
Степень (или уровень) маскировки dN– это разница в децибелах между уровнем NМ порога слышимости тона заданной частоты в присутствии маскераи уровнем N0 порога слышимости этого же тона в полной тишине:
dN = NМ – N0.
Значения порогов слышимости в присутствии маскера определяются путем добавления к основному (испытательному) тону дополнительного тона заданной частоты и интенсивности или узкополосного шума с известными параметрами.
Маскировка тонов шумовыми сигналами
Для того чтобы получить наиболее достоверную информацию о свойствах маскировки было бы естественным использовать в качестве маскируемого сигнала и маскера тональные сигналы. Однако при этом возникает ряд сложностей. Прежде всего, это биения, которые возникают когда маскер и маскируемый сигнал близки по частоте (разница между ними менее 15 Гц) и мешают правильно оценивать эффект маскировки. Кроме того, известно, что человеческий слух обладает существенной нелинейностью (подробнее об этом будет сказано ниже). Поэтому при воздействии на орган слуха достаточно громкого синусоидального звукового сигнала с частотой f0 в процессе его обработки в слуховом аппарате возникают гармоники с частотами 2f0, 3f0 и т.д. Например, если прослушивать звуковой сигнал с частотой 500 Гц, то вместе с ним можно услышать и призвуки с частотой 1000 Гц, 1500 Гц и т.д. Поскольку путем объективных измерений параметров подводимого к акустическому излучателю сигнала можно легко убедиться, что в спектре воздействующего тона никаких посторонних гармоник нет, то они получили название «субъективных», т.е. возникающих в результате исключительно субъективного восприятия звуковых сигналов.
Подобные явления затрудняют точную количественную оценку эффектов маскировки. Поэтому во время проведения экспериментов по исследованию явлений маскировки в качестве маскера чаще всего используют шумовые сигналы. При этом узкополосный шум используют вместо тональных сигналов, в других не менее содержательных исследованиях - широкополосный белый шум.
Эксперименты, проведенные с использованием в качестве маскера узкополосного шума, в целом подтвердили результаты, которые были получены ранее в ходе исследований с применением чистых тонов.
Наиболее интересным для практики является случай, когда в качестве маскирующего сигнала используется широкополосный белый шум. На рис. 6 приведены результаты исследований эффектов маскировки для этого случая. Сплошные кривые на графике соответствуют порогам слышимости при воздействии маскирующего шума различной интенсивности. Видно, что степень маскировки зависит здесь от интенсивности маскирующего шума почти прямо пропорционально: при увеличении интенсивности шума на 10 дБ порог слышимости также возрастает на 10 дБ.
Из рис. 6 также видно, что до частоты примерно 500 Гц кривые маскирования практически параллельны оси абсцисс, т.е. почти горизонтальны. На более высоких частотах пороги слышимости маскируемого сигнала начинают возрастать, причем с одной и той же крутизной. Измерения показали, что при увеличении частоты на октаву пороги слышимости во всех случаях возрастают примерно на 3 дБ.
500 Гц |
fТ,кГц |
-20 |
N, дБ |
Рис. 6. Зависимость уровня маскировки от уровня интенсивности белого шума |
60 дБ |
-10 |
Объяснить этот феномен несложно, если вспомнить о существовании критических полос слуха. Известно, что слух оценивает не общую мощность шума во всей полосе слышимых частот, а его мощность в критических полосах. Следовательно, каждый отдельно взятый тон маскируется шумом той критической полосы, в которой он находится. До частоты 500 Гц ширина критических полос слуха примерно одинакова и равна 100 Гц. Значит, общая мощность шума в этих полосах также примерно одинакова, поскольку спектральная плотность мощности белого шума, как известно, постоянна во всей полосе частот. Поэтому одинаковым будет и его маскирующее действие. Выше 500 Гц критические полосы слуха начинают увеличиваться в размерах. Значит, интегральная мощность шума в них будет возрастать, а, следовательно, будет возрастать и его маскирующее действие.
Свойство широкополосных шумов оказывать максимальное маскирующее действие на тональные сигналы только в пределах критических полос лежит в основе алгоритмов сжатия звуковых сигналов по стандартам MPEG, Dolby, DTS и пр. Вся полоса слышимых частот здесь, прежде всего, разбивается на ряд субполос, примерно соответствующих критическим полосам слуха. После чего внутри каждой субполосы производится анализ присутствующих в ней спектральных компонент и на основе этого анализа рассчитывается степень маскировки частотных составляющих кодируемого звукового сигнала.
В исследовательской практике иногда необходим шум с таким распределением спектральной плотности мощности, чтобы он равномерно маскировал все частотные составляющие звукового сигнала. Для формирования такого шума требуется, чтобы до частоты 500 Гц его спектральная плотность мощности была одинакова и совпадала со спектральной плотностью мощности белого шума, а на частотах выше 500 Гц уменьшалась с крутизной 3 дБ на октаву – как у розового шума. Такой шум называется равномерно маскирующим.
Контрольные вопросы
1. Что такое шумовой сигнал, и какими характерными особенностями он обладает?
2. Что такое белый (розовый, равномерно маскирующий, броуновский, синий, фиолетовый, серый) шум и какими характерными особенностями он обладает?
3. Какими бывают шумы в зависимости от ширины спектра?
4. Какое явление называется маскировкой?
5. Какие виды маскировки вы знаете?
6. Что такое степень маскировки?
7. Почему во время проведения экспериментов по исследованию явлений маскировки в качестве маскера вместо тонального сигнала чаще всего используют узкополосный шумовой сигнал?
8. Почему броуновский шум эффективнее белого маскирует высокочастотные тональные сигналы?
Литература
1. В.А. Никамин. Зрительно-слуховое восприятие аудиовизуальных программ.: Учебник / ГОУВПО СПбГУТ. – СПб, 2014.
2. Акустика: Учебник для вузов / Ш.Я. Вахитов, Ю.А. Ковалгин, А.А. Фадеев, Ю.П. Щевьев; под ред. Ю.А. Ковалгина. – М.: Горячая линия-Телеком, 2009.
3. И.А. Алдошина, Р. Приттс. Музыкальная акустика. Учебник. – СПб.: Композитор. – СПб, 2006.
Порядок выполнения работы
Открыть программу AdobeAudition, щелкнув дважды по ее ярлыку.
1. Задать параметры шумового файла. Для этого в режиме «Правка» (рис. 7):
Рис. 7. Окно программы AdobeAuditionв режиме «Правка» (когда нажата кнопка «Правка» в левом верхнем углу под надписью Файл) |
- В меню Файл (File) щелкнуть Новый (New) и в открывшемся окне установить:
- Частоту дискретизации (SampleRate) – 48кГц;
- Каналы (Channels) – Моно;
- Разрешение (Resolution) – 32 бит.
Нажать кнопку ОК.
- В меню Создать (Generate) щелкнуть Шум (Noise) и в открывшемся окне установить:
- Тип шума (Color) – Белый (White)
- Тип сигнала (Style) – Моно (Mono)
- Интенсивность (Intensity) – 40 дБ (крайнее правое положение движка)
- Длительность (Duration) – 30 сек (seconds)
Нажать кнопку ОК.
- Щелкнуть по названию созданного файла (или по самой сигналограмме) правой кнопкой мыши и в выпадающем меню нажать «Вставить в мультитрек» (рис. 8).
Рис. 8. Окно программы AdobeAuditioncвыпадающим меню, где нужно щелкнуть «Вставить в мультитрек» |
2. Задать параметры звукового файла. Для этого в режиме «Правка» (рис. 7):
- В меню Файл (File) щелкнуть Новый (New) и в открывшемся окне установить:
- Частоту дискретизации (SampleRate) – 48кГц;
- Каналы (Channels) – Моно;
- Разрешение (Resolution) – 32 бит.
Нажать кнопку ОК.
- В меню Создать (Generate) щелкнуть Тоны (Tones) и в открывшемся окне установить:
- Основнуючастоту (Base Frequency) – f = 2000 Гц;
- Форму сигнала (Flavor) – синус (Sine);
- Длительность(Duration) – 30 секунд.
Определить порог слышимости на этой частоте. Для этого, нажав кнопку предварительного прослушивания Preview и перемещая ручку регулятора громкостиdBVolumeдобиться того, что звук перестанет быть слышимым. Для более точного определения границы слышимости следует периодически включать и выключать звук кнопкой Preview. Если звук будет слышен даже в крайнем нижнем положении ручки регулятора громкостиdBVolume(-80 дБ), то убавить громкость либо регулятором громкости головных телефонов, либо регулятором громкости самого компьютера и больше этот регулятор не трогать. Занести значение порога слышимости в графу N0 табл. 1.
После этого установить регулятор громкости (dBVolume) в самое верхнее положение 0 дБ и нажать кнопку ОК.
Щелкнуть по названию созданного файла (или по самой сигналограмме) правой кнопкой мыши и в выпадающем меню нажать «Вставить в мультитрек» (рис. 8).
3. Перейти в режим Мультитрек, щелкнув надпись «Мультитрек» рядом (правее) надписи «Правка». Откроется окно, показанное на рис. 9, где будут видны два созданных файла – шумовой и звуковой. Прослушать эти два файла вместе, нажав кнопку «Воспроизведение» («►») в левом нижнем углу окна. Каждый из файлов можно прослушать отдельно, нажимая кнопки слева от сигналограммы – на панели регулировок прослушиваемой дорожки - «С» (режим «Соло» - будет звучать только та дорожка, где эта кнопка нажата) или «Г» (режим «Глушение» - данная дорожка будет заглушена и будет звучать другая дорожка (или дорожки)). Для остановки прослушивания нужно нажать кнопку «▐ ▌». Для возврата курсора в исходное положение – кнопку «■».
Рис. 9. Окно программы AdobeAudition в режиме «Мультитрек» с двумя созданными файлами на дорожках |
4. Нажать кнопку «Воспроизведение» («►») и, вращая ручку регулировки уровня синусоидального сигнала (на рис. 3 эта ручка находится на панели регулировок дорожки 1 под надписью «Трек 1») влево (в сторону уменьшения) добиться, чтобы сигнал перестал различаться на фоне шума. Отметить в графе Nc Табл. 1 отчета значение уровня сигнала, которое будет при этом присутствовать рядом с ручкой регулировки (например, –20 дБ).
5. Удалить файл с синусоидальным сигналом. Для этого щелкнуть его название на вкладке Файлы (с левой стороны окнаAdobeAudition) правой кнопкой, на выпадающем меню щелкнуть Закрыть файл, и в появившемся окне нажать Да.
6. Повторить пп.2-5 для всех частот, указанных в таблице 1 отчета.
7. Рассчитать уровни маскирования dN (нижняя строка табл. 1 отчета) для этих частот по формуле dN=Nс–N0 и построить график зависимости этой величины от частоты.
8. Повторить пп. 1-7 для розового шума и для броуновского (коричневого) шума.
9. Сделать анализ полученных данных и изложить его результаты в Выводах.