Методы, используемые для обработки звука

Введение

Одной из важных составных частей современной вычислительной системы являются мультимедийные средства.

Дословный перевод слова «мультимедиа» означает «многие среды» («multi» – «много», «media» – «среда»). Под этим термином понимается одновременное воздействие на пользователя по нескольким информационным каналам. При этом пользователю, как правило, отводится активная роль.

Мультимедиа – это интерактивные (диалоговые) системы, обеспечивающие одновременную работу со звуком, анимированной компьютерной графикой, видеокадрами, статическими изображениями и текстами.

Важной составной частью мультимедиа является звук или аудио, звуковая информация (аудиоинформация).

В компьютерной технике аудиоинформация представляется в цифровом виде.

По мере развития компьютерных технологий возрастают требования к представлению аудиоинформации. Эти требования охватывают вопросы повышения естественности воспроизведения звука, сокращения объема аудиофайлов при сохранении высокого качества их звучания и т. п.

Некоторым вопросам данной области и посвящено предлагаемое пособие.

Для успешного усвоения материала пособия необходимо свободно владеть вопросами формирования цифрового представления аудиоинформации из аналоговой ее формы, особенностями спектрального анализа на основе преобразования Фурье, знать принципы построения фильтров в различных частотных диапазонах.

Основные свойства звука

Чаще всего в звуке рассматривается амплитуда и спектральный состав звукового колебания, а также их изменение во времени [1].

Амплитуда (amplitude) определяет максимальную интенсивность колебаний – громкость (volume) или силу звука. На осциллограмме амплитуда представляется размахом сигнала – наибольшим и наименьшим относительно среднего значения уровнями.

Спектральный состав определяет окраску или тембр звука (timbre). Любое периодическое колебание может быть представлено рядом Фурье – суммой конечного числа синусоидальных колебаний (чистых тонов). Спектр звука представляет собой график интенсивностей (амплитуд) этих частотных составляющих, обозначаемых обычно в виде вертикальных линий соответствующей высоты. Спектр чистого тона имеет только одну линию, соответствующую его частоте; спектр любого другого колебания имеет более одной линии. Если на спектре звука имеется достаточно острый пик, то такой звук воспринимается на слух как тон соответствующей высоты, а остальные составляющие определяют его окраску; в противном случае звук воспринимается как одновременное звучание нескольких тонов или шум. Частотные составляющие, кратные основной частоте тона, называются гармониками (harmonics) или обертонами; гармоники нумеруются, начиная с самого основного тона (первая гармоника), а обертоны – с первой кратной составляющей (первый обертон – вторая гармоника и т. д.).

Из-за особенностей слухового восприятия высота звука определяется больше по его спектральному составу, нежели по самому основному тону.

Например, субъективная высота большинства спектрально богатых низкочастотных звуков практически не меняется даже при полном удалении из них основного тона, который в слуховом аппарате восстанавливается по разностным частотам первых обертонов.

Изменение амплитуды во времени называется амплитудной огибающей (envelope) звука – на амплитудном графике она как бы огибает график колебания, а график получается как бы вписанным в огибающую. Любой природный звук имеет огибающую, примерно такого вида (рис. 1.1):

 
  Методы, используемые для обработки звука - student2.ru

Рис. 1.1. Фазы звука

Цифрами обозначены фазы развития звука, принятые в акустике:

1 – атака (attack) – начальная фаза, подъем;

2 – остановка (hold) – короткая стабилизация после подъема;

3 – спад (decay) – фаза перехода звука в установившееся состояние;

4 – удержание (sustain) – фаза «поддержки»;

5 – затухание (release) – послезвучание.

Фаза поддержки имеет место лишь в том случае, когда вызвавшее появление звука воздействие остается постоянным в течение какого-то времени (например, движение пилы по металлу или поток воздуха в духовом инструменте).

Аналогично, имеется понятие спектральной огибающей – трехмерный график изменения спектра (и соответственно – тембра) во времени.

Кроме периодических колебаний – тонов – рассматриваются также непериодические колебания – шумы. Для шума характерно более или менее равномерное распределение интенсивности по спектру, без явно выраженных пиков или спадов. В основном различается два вида шума: белый и розовый.

Белый шум имеет равномерную спектральную плотность и в чистом виде в природных звуках не встречается, однако часто встречается в электронных приборах; плотность «розового» шума спадает с ростом частоты (1/f) – это характеристика шума дождя, прибоя, ветра и прочих неярко выраженных природных шумов. Иногда рассматривается также «коричневый» шум с плотностью 1/f 2, быстро спадающей с ростом частоты – характеристика, близкая к звукам ударного происхождения (гром, обвал).

Единицы измерения

Для измерения звука используется децибел [1].

Это относительная логарифмическая единица измерения величин, связанных с интенсивностью звука (мощности, амплитуды, напряжения или тока сигнала, усиления/ослабления и т. п.). Чувствительность слуха носит логарифмический характер – нарастание интенсивности в виде степенной функции воспринимается на слух как линейное увеличение громкости, поэтому в ряде случаев удобнее пользоваться логарифмическими, а не линейными единицами. Десятичный логарифм отношения некоторой величины к ее эталонному значению – lg (X/XЭ) – называется белом (Б), а его десятая часть – lg (X/XЭ) / 10 – децибелом (дБ). Измерение в децибелах удобно еще и тем, что человеческое ухо различает относительное изменение интенсивности примерно на 1 дБ.

При измерениях абсолютной интенсивности звука (Вт/м2) за эталонное значение принимается уровень порога слышимости для синусоидального сигнала с частотой 1 кГц – 10 в степени –12 (10–12) Вт/м2. При этом порог слышимости определяется интенсивностью 0 дБ, а интенсивность, при которой начинаются болевые ощущения (болевой порог) – около 140 дБ. Интенсивность тихого шепота – около 35 дБ, громкого голоса – около 95 дБ, forte fortissimo оркестра – около 100 дБ, оркестрового тутти (звучания всех инструментов) – около 120 дБ.

При измерениях величин, с которыми интенсивность связана квадратичной зависимостью – напряжения, тока и звукового давления – в выражении для децибела множитель 10 меняется на 20 (двойка выносится из логарифма отношения квадратов).

При измерениях относительных величин за эталонный уровень принимается какое-либо значение величины. Например, при оценке усиления за него принимается единичное усиление (пропускание сигнала без изменения), равное 0 дБ. При этом 60 дБ соответствует усилению в 1000 раз (60 = 20lg 1000), а –20 дБ – ослаблению в 10 раз. Для описания характеристик усилителей и фильтров применяется также единица «децибел на октаву» (дБ/окт), показывающая изменение усиления при изменении частоты в два раза.

В акустике принято измерять громкость в дБ SPL (Sound Pressure Level). Удвоение интенсивности звука приводит к увеличению уровня интенсивности на 3 дБ.

Выражая уровень звукового давления в децибелах, следует помнить, что при увеличении давления вдвое прибавляется 6 дБ.

Существуют разновидности измерений: dBA, dBB, dBC, dBD – опорные уровни выбраны по частотным характеристикам «весовых фильтров» в соответствии с кривыми равной громкости.

Децибел акустический

Единица измерения уровня шума с наложенным на измеритель фильтром, учитывающим особенность восприятия шума слуховым аппаратом человека (нелинейность частотной характеристики уха). Величина дБА – уровень звукового давления, измеренный в дБ при помощи шумомера, содержащего корректирующую цепочку, снижающую чувствительность устройства на низких и очень высоких частотах для того, чтобы точнее имитировать чувствительность человеческого уха и получать отсчеты, дающие некоторые указания на громкость, неприятное действие или приемлемость звука. Значение дБА обычно на 10 единиц превосходит эквивалентное значение нормировочного индекса шума для данного звука.

В цифровой обработке понятие дБ считается от нуля и вниз, в область отрицательных значений. Ноль – максимальный уровень, представимый цифровой схемой.

В dBFS (Full Scale – «полная шкала») – опорное напряжение соответствует полной шкале прибора; например, «уровень записи составляет −6 dBFS». Для линейного цифрового кода каждый разряд соответствует 6 дБ, и максимально возможный уровень записи равен 0 dBFS.

Параметры звукового сигнала

Звук – это упругое колебание среды, он распространяется в среде с помощью волн давления посредством колебания атомов и молекул. Как и любая волна, звук характеризуется скоростью, амплитудой и частотой [2].

Воздействуя на слух, звук вызывает раздражение, которое создает у человека субъективный эффект – ощущение.

Интенсивность звука I определяется как среднее количество звуковой энергии, проходящей в единицу времени через единицу поверхности:

Методы, используемые для обработки звука - student2.ru (3.1)

где P – звуковое давление, Па;

Q0 – удельное сопротивление воздуха, Q0 = 1,23 кг/м3.

При исследовании восприятия изменения интенсивности звука было установлено, что одинаковые относительные изменения интенсивности вызывают одинаковые абсолютные изменения слухового ощущения, т. е. слуховое ощущение E пропорционально логарифму раздражающей силы:

E = algI + C. (3.2)

На пороге слышимости I = IПС слуховое ощущение равно нулю, поэтому

C = – algIПС, (3.3)

откуда

E = alg(I/IПС) (3.4)

Для оценки величины слухового ощущения была предложена единица под название «бел» (a = 1). Эта единица соответствует десятикратному отношению интенсивностей, поэтому была введена более мелкая единица – «децибел» (a = 10).

E = 10lg(I/IПС), дБ (3.5)

Вследствие логарифмического закона восприятия звука и широкого диапазона слышимости звуков было введено понятие уровня интенсивности

N(I) = (I/I0), дБ (3.6)

За нулевой уровень условились принимать интенсивность I0 близкую к порогу слышимости для нормального слуха на частоте 1 кГц
(I0 = 10–12 Вт/м2). Нулевой уровень по звуковому давлению P0 равен 2,04∙10–5 Па. Интенсивность и звуковое давление связаны квадратичной зависимостью, поэтому уровень звукового давления N определяется равенством:

N = 20lg(P/P0). (3.7)

Порог слышимости – это минимальное звуковое давление, при котором еще существует слуховое ощущение. На рис. 2.1 показана зависимость порога слышимости от частоты, которая была выявлена опытным путем.

 
  Методы, используемые для обработки звука - student2.ru

Рис. 2.1. Абсолютный порог слышимости

Параметры звукового тракта

Звуковым трактом называют любое устройство, осуществляющее передачу и/или преобразование звука. Звуковой тракт характеризуется следующими параметрами [1].

– Номинальный входной и выходной уровень (Input/Output Level) – величина сигнала на входе и выходе тракта, до которого он сохраняет указанные параметры. Указывается в вольтах и обычно принимается за 0 дБ.

Таким образом, рабочие уровни сигнала имеют отрицательный либо нулевой уровень.

– Максимальный входной и выходной уровень – величина сигнала, до которой тракт сохраняет работоспособность. Уровни сигналов от номинального до максимального всегда имеют ненулевой положительный уровень.

– Коэффициент усиления – отношение величины выходного сигнала ко входному. Указывается в разах, процентах или децибелах.

– Диапазон частот (Frequency Response) – частотный интервал, в котором тракт сохраняет свои основные характеристики. Нуль подразумевает постоянный ток.

– Форма амплитудно-частотной характеристики (АЧХ) – график зависимости амплитуды сигнала на выходе от его частоты при неизменной амплитуде сигнала на входе. Тракты с горизонтальной зависимостью внутри частотного диапазона АЧХ называют частотно-независимыми.

– Неравномерность АЧХ – отклонения графика от заданной формы. Указывается в процентах или децибелах.

– Уровень шума (Noise Level) – величина шума относительно номинального уровня сигнала. Указывается в децибелах и всегда имеет отрицательное значение. Другое название – соотношение сигнал/шум (Signal to Noise Ratio, SNR), которое имеет такое же положительное значение. Иногда указывается уровень шума, приведенный ко входу – в предположении, что весь шум поступает только на вход, а сам тракт собственного шума не имеет.

– Коэффициент гармоник (Total Harmonic Distortion, THD) – величина побочных гармонических составляющих, вносимых нелинейностью тракта. Указывается в процентах от величины сигнала; в ряде случаев указывается для различных гармоник (на слух наибольшие искажения вносят нечетные гармоники высших порядков).

– Уровень интермодуляционных искажений (InterModulation Distortion, IMD) – относительный уровень паразитных частотных компонент, порожденных взаимной модуляцией полезных компонент сигнала. Указывается в процентах от величины сигнала.

– Переходное затухание (Stereo Crosstalk) – степень ослабления сигнала при его проникновении в соседний стереоканал. Указывается в децибелах.

– Динамический диапазон (Dynamic Range) – диапазон наибольшего и наименьшего уровней сигнала, внутри которых сохраняются основные характеристики тракта. Снизу обычно ограничен уровнем шума, сверху – номинальным уровнем, поэтому часто равен соотношению сигнал/шум, однако нелинейность тракта в ряде случаев не позволяет выдержать параметры в этих областях, а это сужает динамический диапазон.

Методы синтеза звука

Создание (синтез) звука в основном преследует две цели: имитация различных естественных звуков (шум ветра и дождя, звук шагов, пение птиц и т. п.), а также акустических музыкальных инструментов (имитационный синтез), и получение принципиально новых звуков, не встречающихся в природе (чистый синтез) [1].

Обработка звука обычно направлена на получение новых звуков из уже существующих (например, «голос робота»), либо придание им дополнительных качеств или устранение существующих (например, добавление эффекта хора, удаление шума или щелчков). Каждый из методов синтеза и обработки имеет свою математическую и алгоритмическую модель, что позволяет любой из них реализовать на компьютере; однако, многие методы, будучи реализованы точно, требуют слишком большого объема вычислений, отчего их обычно реализуют с какой-либо степенью допущения.

Существуют следующие основные методы синтеза звука.

1. Аддитивный (additive). Основан на утверждении Фурье о том, что любое периодическое колебание можно представить в виде суммы чистых тонов (синусоидальных колебаний с различными частотами и амплитудами).

Для этого нужен набор из нескольких синусоидальных генераторов с независимым управлением, выходные сигналы которых суммируются для получения результирующего сигнала. На этом методе основан принцип создания звука в духовом органе.

Достоинства метода: позволяет получить любой периодический звук, и процесс синтеза хорошо предсказуем (изменение настройки одного из генераторов не влияет на остальную часть спектра звука). Основной недостаток – для звуков сложной структуры могут потребоваться сотни генераторов, что достаточно сложно и дорого реализовать. Для снижения стоимости реализации вместо набора отдельных генераторов (реальных или математических) применяется обратное преобразование Фурье.

2. Разностный (subtractive). Идеологически противоположен первому. В основу положена генерация звукового сигнала с богатым спектром (множеством частотных составляющих) с последующей фильтрацией (выделением одних составляющих и ослаблением других) – по этому принципу работает речевой аппарат человека. В качестве исходных сигналов обычно используются меандр (прямоугольный, square), с переменной скважностью (отношением всего периода к положительному полупериоду), пилообразный (saw) – прямой и обратный, и треугольный (triangle), а также различные виды шумов (случайных непериодических колебаний). Основным органом синтеза в этом методе служат управляемые фильтры: резонансный (полосовой) – с изменяемым положением и шириной полосы пропускания (band) и фильтр нижних частот (ФНЧ) с изменяемой частотой среза (cutoff). Для каждого фильтра также регулируется добротность (Q) – крутизна подъема или спада на резонансной частоте.

Достоинства метода – относительно простая реализация и довольно широкий диапазон синтезируемых звуков. На этом методе построено множество студийных и концертных синтезаторов.

Недостаток – для синтеза звуков со сложным спектром требуется большое количество управляемых фильтров, которые достаточно сложны и дороги.

3. Частотно-модуляционный (frequency modulation – FM). В основу положена взаимная модуляция по частоте между несколькими синусоидальными генераторами. Каждый из таких генераторов, снабженный собственными формирователем амплитудной огибающей, амплитудным и частотным вибрато, именуется оператором. Различные способы соединения нескольких операторов, когда сигналы с выходов одних управляют работой других, называются алгоритмами синтеза. Алгоритм может включать один или больше операторов, соединенных последовательно, параллельно, последовательно-параллельно, с обратными связями и в прочих сочетаниях – все это дает практически бесконечное множество возможных звуков.

Благодаря простоте цифровой реализации, метод получил широкое распространение в студийной и концертной практике. Однако практическое использование этого метода достаточно сложно из-за того, что большая часть звуков, получаемых с его помощью, представляет собой шумоподобные колебания, и достаточно лишь слегка изменить настройку одного из генераторов, чтобы чистый тембр превратился в шум. Однако метод дает широкие возможности по синтезу разного рода ударных звуков, а также – различных звуковыхэффектов, недостижимых в других методах разумной сложности.

4. Самплерный (sample – выборка). В этом методе записывается реальное звучание (сампл), которое затем в нужный момент воспроизводится. Для получения звуков разной высоты воспроизведение ускоряется или замедляется; при неизменной скорости выборки применяется расчет промежуточных значений отсчетов (интерполяция). Чтобы тембр звука при сдвиге высоты не менялся слишком сильно, используется несколько записей звучания через определенные интервалы (обычно – через одну-две октавы). В ранних самплерных синтезаторах звуки в буквальном смысле записывались на магнитофон, в современных применяется цифровая запись звука.

Метод позволяет получить сколь угодно точное подобие звучания реального инструмента, однако для этого требуются достаточно большие объемы памяти. С другой стороны, запись звучит естественно только при тех же параметрах, при которых она была сделана – при попытке, например, придать ей другую амплитудную огибающую естественность резко падает.

Для уменьшения требуемого объема памяти применяется зацикливание сампла (looping). В этом случае записывается только короткое время звучания инструмента, затем в нем выделяется средняя фаза с установившимся (sustained) звуком, которая при воспроизведении повторяется до тех пор, пока включена нота (нажата клавиша), а после отпускания воспроизводится концевая фаза.

На самом деле этот метод нельзя с полным правом называть синтезом – это скорее метод записи-воспроизведения. Однако в современных синтезаторах на его основе воспроизводимый звук можно подвергать различной обработке – модуляции, фильтрованию, добавлению новых гармоник, звуковых эффектов, в результате чего звук может приобретать совершенно новый тембр, иногда совсем непохожий на первоначальный. По сути, получается комбинация трех основных методов синтеза, где в качестве основного сигнала используется исходное звучание.

5. Таблично-волновой (wave table). Разновидность самплерного метода, когда записывается не все звучание целиком, а его отдельные фазы – атака, начальное затухание, средняя фаза и концевое затухание, что позволяет резко снизить объем памяти, требуемый для хранения самплов.

Эти фазы записываются на различных частотах и при различных условиях (мягкий или резкий удар по клавише рояля, различное положение губ и языка при игре на саксофоне и т. п.), в результате чего получается семейство звучаний одного инструмента. При воспроизведении эти фазы нужным образом составляются, что дает возможность при относительно небольшом объеме самплов получить достаточно широкий спектр различных звучаний инструмента, а главное – заметно усилить выразительность звучания, выбирая, например, в зависимости от силы удара по клавише синтезатора не только нужную амплитудную огибающую, как делает любой синтезатор, но и нужную фазу атаки.

Основная проблема этого метода – в сложности сопряжения различных фаз друг с другом, чтобы переходы не воспринимались на слух, и звучание было цельным и непрерывным. Поэтому синтезаторы этого класса достаточно редки и дороги.

Этот метод также используется в синтезаторах звуковых карт персональных компьютеров, однако его возможности там сильно урезаны. В частности, почти нигде не применяют составление звука из нескольких фаз, сводя метод к простому самплерному, хотя почти везде есть возможность параллельного воспроизведения более одного сампла внутри одной ноты.

6. Метод физического моделирования (physical modelling). Состоит в моделировании физических процессов, определяющих звучание реального инструмента на основе его заданных параметров (например, для скрипки – порода дерева, состав лака, геометрические размеры, материал струн и смычка и т. п.). В связи с крайней сложностью точного моделирования даже простых инструментов и огромным объемом вычислений метод пока развивается медленно, на уровне студийных и экспериментальных образцов синтезаторов. Ожидается, что с момента своего достаточного развития он заменит известные методы синтеза звучаний акустических инструментов, оставив им только задачу синтеза не встречающихся в природе тембров.

7. (Alexander Grigoriev) WaveGuide технология, активно разрабатываемая в Стэнфоpдcком Унивеpcитете и применяемая уже в нескольких промышленных моделях электронных роялей. Представляет собой pазновидноcть физического моделирования, при которой моделиpyетcя pаcпpоcтpанение колебаний, пpедcтавленных диcкpетными отсчетами, по cтpyне (одномерное моделирование) и по pезонанcным повеpхноcтям (двyмеpное моделирование) или в объемном pезонатоpе (тpехмеpное). При этом появляется возможность моделировать также нелинейные эффекты, например удар молоточка и касание струны демпфером, а также взаимную связь струн и связь горизонтальной и вертикальной мод.

Обработка цифрового звука

Цифровой звук обрабатывается посредством математических операций, применяемых к отдельным отсчетам сигнала, либо к группам отсчетов различной длины. Выполняемые математические операции могут либо имитировать работу традиционных аналоговых средств обработки (микширование двух сигналов – сложение, усиление/ослабление сигнала – умножение на константу, модуляция – умножение на функцию и т. п.), либо использовать альтернативные методы – например, разложение сигнала в спектр (ряд Фурье), коррекция отдельных частотных составляющих, затем обратная «сборка» сигнала из спектра [3].

Обработка цифровых сигналов подразделяется на линейную (в реальном времени, над «живым» сигналом) и нелинейную – над предварительно записанным сигналом. Линейная обработка требует достаточного быстродействия вычислительной системы (процессора); в ряде случаев невозможно совмещение требуемого быстродействия и качества, и тогда используется упрощенная обработка с пониженным качеством. Нелинейная обработка никак не ограничена во времени, поэтому для нее могут быть использованы вычислительные средства любой мощности, а время обработки, особенно с высоким качеством, может достигать нескольких минут и даже часов.

Для обработки применяются как универсальные процессоры общего назначения – Intel 8035, 8051, 80x86, Motorola 68xxx, SPARC – так и специализированные цифровые сигнальные процессоры (Digital Signal Processor, DSP) Texas Instruments TMS xxx, Motorola 56xxx, Analog Devices ADSP-xxxx и др.

Разница между универсальным процессором и DSP состоит в том, что первый ориентирован на широкий класс задач – научных, экономических, логических, игровых и т. п., и содержит большой набор команд общего назначения, в котором преобладают обычные математические и логические операции. DSP специально ориентированы на обработку сигналов и содержат наборы специфических операций – сложение с ограничением, перемножение векторов, вычисление математического ряда и т. п. Реализация даже несложной обработки звука на универсальном процессоре требует значительного быстродействия и далеко не всегда возможна в реальном времени, в то время как даже простые DSP нередко справляются в реальном времени с относительно сложной обработкой, а мощные DSP способны выполнять качественную спектральную обработку сразу нескольких сигналов.

В силу своей специализации DSP редко применяются самостоятельно – чаще всего устройство обработки имеет универсальный процессор средней мощности для управления всем устройством, приема/передачи информации, взаимодействия с пользователем, и один или несколько DSP – собственно для обработки звукового сигнала. Например, для реализации надежной и быстрой обработки сигналов в компьютерных системах применяют специализированные платы с DSP, через которые пропускается обрабатываемый сигнал, в то время как центральному процессору компьютера остаются лишь функции управления и передачи.

Звуковые эффекты

Вот наиболее распpостpаненные звуковые эффекты.

– Вибрато – амплитудная или частотная модуляция сигнала с небольшой частотой (до 10 Гц). Амплитудное вибpато также носит название тремоло; на слух оно воспринимается, как замирание или дрожание звука, а частотное – как «завывание» или «плавание» звука (типичная неисправность механизма магнитофона).

– Динамическая фильтрация (wah-wah – «вау-вау») – реализуется изменением частоты среза или полосы пропускания фильтра с небольшой частотой. На слух воспринимается, как вращение или заслонение/открывание источника звука – увеличение высокочастотных составляющих ассоциируется с источником, обращенным на слушателя, а их уменьшение – с отклонением от этого направления.

– Фленжер (flange – кайма, гребень). Название происходит от способа pеализации этого эффекта в аналоговых устройствах – пpи помощи так называемых гребенчатых фильтров. Заключается в добавлении к исходному сигналу его копий, сдвинутых во вpемени на небольшие величины (до 20 мс) с возможной частотной модуляцией копий или величин их временных сдвигов и обратной связью (суммарный сигнал снова копируется, сдвигается и т. п.). На слух это ощущается как «дробление», «размазывание» звука, возникновение биений – разностных частот, хаpактеpных для игры в унисон или хорового пения, отчего фленжеpы с определенными паpаметpами применяются для получения хорового эффекта (chorus). Меняя паpаметpы фленжеpа, можно в значительной степени изменять первоначальный тембp звука.

– Pевеpбеpация (reverberation – повторение, отражение). Получается путем добавления к исходному сигналу затухающей серии его сдвинутых во вpемени копий. Это имитирует затухание звука в помещении, когда за счет многократных отражений от стен, потолка и прочих поверхностей звук пpиобpетает полноту и гулкость, а после пpекpащения звучания источника затухает не сразу, а постепенно. Пpи этом время между последовательными отзвуками (пpимеpно до 50 мс) ассоциируется с величиной помещения, а их интенсивность – с его гулкостью. По сути, pевеpбеpатоp представляет собой частный случай фленжеpа с увеличенной задержкой между отзвуками основного сигнала, однако особенности слухового восприятия качественно различают эти два вида обработки.

– Эхо (echo). Ревеpбеpация с еще более увеличенным временем задержки – выше 50 мс. При этом слух перестает субъективно воспринимать отражения, как призвуки основного сигнала, и начинает воспринимать их как повторения. Эхо обычно pеализуется так же, как и естественное – с затуханием повторяющихся копий.

– Дистошн (distortion – искажение) – намеренное искажение формы звука, что придает ему резкий, скрежещущий оттенок. Наибольшее применение получил в качестве гитарного эффекта (классическая гитара heavy metal). Получается пеpеусилением исходного сигнала до появления ограничений в усилителе (среза верхушек импульсов) и даже его самовозбуждения. Благодаpя этому исходный сигнал становится похож на прямоугольный, отчего в нем появляется большое количество новых частотных составляющих, резко pасшиpяющих спектp. Этот эффект пpименяется в pазличных вариациях (fuzz, overdrive и т. п.), различающихся способом ограничения сигнала (обычное или сглаженное, весь спектp или полоса частот, весь амплитудный диапазон или его часть и т. п.), соотношением исходного и искаженного сигналов в выходном, частотными хаpактеpистиками усилителей (наличие/отсутствие фильтров на выходе).

– Компрессия – сжатие динамического диапазона сигнала, когда слабые звуки усиливаются сильнее, а сильные – слабее. Hа слух воспринимается как уменьшение разницы между тихим и громким звучанием исходного сигнала. Используется для последующей обработки методами, чувствительными к изменению амплитуды сигнала. В звукозаписи используется для снижения относительного уровня шума и пpедотвpащения пеpегpузок. В качестве гитарной приставки позволяет значительно (на десятки секунд) продлить звучание струны без затухания громкости.

– Фейзеp (phase – фаза) – смешивание исходного сигнала с его копиями, сдвинутыми по фазе. По сути дела, это частный случай фленжеpа, но с намного более простой аналоговой реализацией (цифровая реализация одинакова). Изменение фазовых сдвигов суммируемых сигналов приводит к подавлению отдельных гармоник или частотных областей, как в многополосном фильтре. Hа слух такой эффект напоминает качание головки в стереомагнитофоне – физические процессы в обоих случаях пpимеpно одинаковы.

– Вокодер (voice coder – кодировщик голоса) – синтез речи на основе произвольного входного сигнала с богатым спектpом. Речевой синтез pеализуется пpи помощи формантных пpеобpазований: выделение из сигнала с достаточным спектpом нужного набора фоpмант с нужными соотношениями придает сигналу свойства соответствующего гласного звука. Изначально вокодеры использовались для передачи кодированной речи: путем анализа исходного речевого сигнала из него выделялась информация об изменении положений фоpмант (переход от звука к звуку), которая кодировалась и передавалась по линии связи, а на приемном конце блок управляемых фильтров и усилителей синтезировал речь заново. Подавая на блок речевого синтеза звучание, напpимеp, электpогитаpы и произнося слова в микрофон блока анализа, можно получить эффект «pазговаpивающей гитары»; пpи подаче звучания с синтезатора получается известный «голос робота», а подача сигнала, близкого по спектру к колебаниям голосовых связок, но отличающегося по частоте, меняет pегистp голоса – мужской на женский или детский, и наоборот.

Маскировка звука

Повышение порога слышимости одного тона (или сигнала) при одновременном воздействии другого тона (шума или сигнала) называют маскировкой. Различают частотное и временное маскирование [2].

На рис. 7.1 показаны кривые маскировки тона, когда мешающим звуком является тоже тон. По этим кривым определяют порог слышимости на конкретных частотах маскируемого тона, и рассчитывается коэффициент маскировки.

 
  Методы, используемые для обработки звука - student2.ru

Рис. 7.1. Кривые порога тона с частотой FT при маскировке тоном с частотой
FM = 1 кГц и уровнем NM, дБ

Маскировка максимальна, когда частоты FT и FM близки, величина маскировки увеличивается по мере возрастания уровня мешающего тона NM.

На рис. 7.2 показаны кривые маскировки тона узкополосным шумом.

Они примерно такие же, как при маскировке тоном с некоторыми отличиями: нет биений и провала коэффициента маскировки. Узкополосный шум маскирует не только тоны, но и широкополосные шумы квантования.

На рис. 7.3 показан порог слышимости во временной области, при воздействии сигнала с уровнем интенсивности 60 дБ.

 
  Методы, используемые для обработки звука - student2.ru

Рис. 7.2. Кривые порога тона с частотой FT при маскировке узкополосным шумом с центральной частотой FM = 1 кГц и уровнем NM дБ

 
  Методы, используемые для обработки звука - student2.ru

Рис. 7.3. Порог слышимости при временном маскировании

Системы шумоподавления

В определении понятия «шумоподавитель», да и самого шумоподавления существует некоторая неясность. Этими терминами обозначаются два абсолютно разных понятия, одно из которых скорее относится к реставрационным работам, а второе – непосредственно к самой процедуре звукозаписи [4].

В первом случае речь идёт об улучшении звучания уже имеющегося материала, а во втором случае – о более качественном процессе записи нового. И, хотя эти два различных процесса имеют идентичные названия, физическая их сущность абсолютно разная. Даже несмотря на то, что основаны они, в сущности, на использовании одного и того же свойства человеческого слуха – эффекта маскировки.

Денойзеры

Этот процесс и является именно шумоподавлением в его исходном смысле, т. е. применяется для удаления шумов с уже готовых фонограмм, записанных давно и без специальных приемов удаления шумов.

При этом сигнал обрабатывается как бы «с одной стороны», а именно – при его воспроизведении. По принятой терминологии такие шумоподавители именно так и называются – single-ended, «односторонние».

Самым первым был простейший noise-gate, блокировавший прохождение сигналов в паузах фонограммы. Он действовал как простой выключатель – либо полностью пропускал входной сигнал на выход, либо полностью же его подавлял.

Однако, несмотря на свою полезность во многих случаях, реального подавления шумов он не осуществлял. А иногда даже наоборот, делал их субъективно более заметными – когда после достигнутой его усилиями абсолютной тишины начинало звучать тихое место фонограммы, на котором шумы как раз наиболее заметны.

По мере развития схемотехники конструкции гейтов (ключей) постепенно усложнялись, появилась возможность плавного их открытия и закрытия, но полностью устранить указанное явление тем не менее не удалось, и в настоящее время гейты для целей уменьшения шумов практически не применяются.

Чтобы избавиться от описанного эффекта и получить более приятное на слух уменьшение шумов, многими фирмами были разработаны самые различные системы шумоподавления, в основном для прослушивания записей с маг

Наши рекомендации