Кодирование формы речевых сигналов. икм
Цифровое представлениеРС основано на сохранении его формыв процессе дискретизации и квантования. В этом методе используются три основных способа кодирования: импульсно-кодовая модуляция (ИКМ),дифференциальная ИКМ (ДИКМ),адаптивная дифференциальная ИКМ (АДИКМ)и дельта-модуляция (ДМ) [3, 26].
Системе ИКМ соответствует цифровой сигнал с выхода АЦП, поэтому в нем сохраняется вся избыточность аналогового PC.
Первый шаг при АЦП PC состоит в его периодической дискретизации. Если отсчеты(дискреты)формируются достаточно часто, то исходный сигнал может быть полностью восстановлен из их последовательности путем применения ФНЧ. Для совместимости по полосе с распространенными аналоговыми сетями в ИКМ-телефонии отсчеты аналоговой речи, согласно теореме Котельникова, необходимо брать с частотой выборки 8000 отсчетов в секунду, т. е. аналоговый сигнал дискретизируется с постоянной частотой дискретизации = 8 кГц (ранее уже отмечалось, что при цифровой передаче РС ограничиваются полосой частот от 300 до 3400 Гц, поэтому общепринятой является = 8 кГц).
Второй шаг в процессе АЦП состоит в квантовании. В процессе квантования амплитуда каждого отсчета заменяется дискретной величиной, размещенной в середине соответствующего шага квантования. Для передачи по каналу связи квантованные по амплитуде дискреты преобразуются в двоичные кодовые комбинации (кодовые слова), которые передаются затем в виде потока двоичных импульсов (бит) [35].
Чаще всего кодирование заключается в записи номера уровня в двоичной системе счисления. В цифровых системах связи и вещания распространены симметричные коды, характеризуемые тем, что первый символ (старший значащий бит) кодовой комбинации определяется полярностью кодируемого отсчета сигнала, а остальные символы несут информацию об абсолютном значении отсчета. Необходимое число разрядов для кодирования при заданном максимальном числе уровней шкалы квантования определяется из выражения [26].
Число двоичных разрядов АЦП РС обычно выбирается равным = 8, включая знаковый разряд. Поэтому диапазон чисел на выходе АЦП составляет от –127 до +127. В результате на выходе АЦП формируется последовательность 8-разрядных кодовых слов, следующих с частотой 8 кГц. Следовательно, цифровая скорость передачи сигнала на выходе АЦП составляет
[кбит/с].
Эта величина представляет собой информационный объем цифрового представления PC (система ИКМ-64), который необходимо учитывать при его передаче или хранении [3, 26].
На приемной стороне линии цифровой передачи в декодере битовый поток восстанавливается и воссоздаются величины квантованных дискретов. Затем для восстановления исходной формы сигнала используется ФНЧ. Декодер и ФНЧ образуют цифро-аналоговый преобразователь (ЦАП).Если ошибок в передаче не было, то сигнал на выходе идентичен входному за исключением шума квантования(искажения в результате квантования: разности между величиной дискрета и ее квантованным представлением).
Искажения (шум) квантования, возникающие при преобразовании аналогового РС в цифровую форму, обычно выражаются в виде отношения средних мощностей сигнала и шума, т.е. отношения сигнал-шум(ОСШ)квантования: [26, 35].
Анализ этой формулы показывает, что каждое добавление одного разряда в кодовое слово улучшает ОСШ на 6 дБ. Это является особенностью ИКМ, так как ни один другой метод АЦП не позволяет так заметно улучшать помехозащищенность за счет небольшого увеличения скорости передачи [26].
При передаче сигналов для обеспечения всем абонентам одинакового качества часто стремятся сделать постоянной относительную ошибку квантования. Это достигается путем использования неравномерного распределения уровней квантования в процессе мгновенного компандирования, когда на передающей стороне PC подвергают компрессии по логарифмическому закону, а на приемной осуществляют обратную операцию – экспандирование с помощью экспоненциального преобразования [12, 26].
Широкое распространение получила квазилогарифмическая характеристика компрессии типа А и [3, 12]. В цифровых системах применяют, как правило, кусочно-линейную аппроксимацию характеристик. При этом диапазон мгновенных значений сигнала разбивают на несколько сегментов, в каждом из которых характеристика аппроксимируется отрезком прямой линии [3, 26]. В подобных системах при разрядности кода m = 7 реализуется цифровая скорость передачи = 56 кбит/с.
Такая система (logИKM) по своим качественным характеристикам (по отношению сигнал/шум квантования) практически не уступает системе ИКМ-64 с равномерным квантованием.
В обычной системе с ИКМ каждый дискрет входного сигнала кодируется независимо от всех остальных. Поэтому логарифмическая ИКМ никак не использует взаимную корреляцию между соседними отсчетами речи. В то же время анализ PC показывает, что при переходе от одного дискрета к другому проявляется значительная избыточность, а именно – коэффициент корреляции (мера предсказуемости) между соседними дискретами, следующими с частотой 8 кГц, составляет в общем случае 0,85 или больше. Следовательно, избыточность при обычном ИКМ-кодировании указывает на возможность значительной экономии за счет уменьшения цифровой скорости потока, что можно осуществить за счет более эффективных методов кодирования, приспособленных к характеристикам PC [3, 26].
Простейшим способом использования корреляции между дискретами речи является кодирование разностеймежду соседними дискретами. Поэтому первым примером «сжимающей» обработки стоит считать дифференциальную ИКМ (ДИКМ), при которой осуществляется предсказание речи первого порядка. Предыдущий отсчет берется с определенным весом, формируя прогноз, а разница между предсказанным и реальным отсчетами речи подвергается квантованию.
ДИКМ и дельта-модуляция (ДМ) специально разработаны для реализации преимуществ, которые дает использование корреляции между дискретами в РС. Наличие корреляции означает, что сигнал изменяется медленно и разность между соседними отсчетами будет иметь меньшие значения, чем исходный сигнал. Поскольку диапазон разностей значений дискретов меньше диапазона самих значений дискретов, для кодирования значений разности потребуется меньше разрядов.
Простейшими средствами получения разности значений дискретов являются запоминание предыдущего входного дискрета непосредственно в аналоговой памяти и использование аналогового вычитающего устройства для измерения изменения (рис. 6.1) [26]. Изменения сигнала затем квантуются и кодируются для передачи.
Рис. 6.1. Структурная схема системы ДИКМ
Сигнал разности после дискретизации квантуется при ДМ только по знаку (полярности), а при ДИКМ – и по знаку, и по величине, после чего формируются двоичные символы (кодовые слова) цифрового сигнала.
Таким образом, в дифференциальных кодеках квантованию и передаче по цифровому каналу подвергается разность между текущим отсчетом (выборкой) PC и его предсказанным значением.
Шум квантования при подаче на вход квантователя будет меньше, чем при обычном квантовании (ИКМ). При одинаковом уровне шума число уровней квантования будет меньше, а значит, длина двоичного кодового слова и необходимая скорость передачи будут снижены [3].
На приемной стороне из принятого цифрового сигнала аналогичным образом формируется квантованный аппроксимирующий сигнал, который после ФНЧ и усиления поступает на выход системы.
Дельта-модуляция фактически может рассматриваться как особый случай ДИКМ, когда используется только один разряд на отсчет разностного сигнала. Этот единственный разряд показывает полярность отсчета разностного сигнала и посредством этого указывает на то, увеличился или уменьшился сигнал за время, прошедшее после последнего отсчета. В системах с ДМ частота дискретизации выбирается во много раз больше, чем в системе с ИКМ. В результате соседние отсчеты оказываются в большой степени коррелированными.
В простейшем случае линейной ДМ квантователь имеет только два уровня и фиксированный шаг квантования, а предсказатель представляет собой цифровое интегрирующее устройство, в котором сигнал задерживается на такт и умножается на коэффициент а, где 0 < < 1.
Иногда дельта-модулятор не в состоянии отслеживать быстрые изменения во входном сигнале. Когда это случается, возникает «отставание» восстановленного сигнала от исходного, характеризуемое как искажения перегрузки по крутизне [3, 27].
Рис. 6.2. Искажения перегрузки по крутизне при ДМ
Ошибки квантования (шумомдробленияили гранулярный шум) можно уменьшить, выбирая меньший шаг. При медленном изменении сигнала искажения обусловлены только шумом квантования. Но при быстром изменении сигнала ДМ-квантователь с мелким шагом просто не будет успевать подстраивать напряжение на выходе, и будет наблюдаться «перегрузка по наклону». Как показано на рис. 6.2, для медленно меняющихся сигналов основное значение имеет гранулярный шум, в то время как для быстро меняющихся сигналов – искажения перегрузки по крутизне.
Таким образом, приходится искать компромисс.
Перегрузка по крутизне является не только ограничивающим фактором для системы с ДМ, но и проблемой, присущей любой системе, когда кодируется разность значений соседних отсчетов. Поэтому для снижения погрешности передачи при ДИКМ и повышения эффективности ДМ (снижения ) параметры квантователя и предсказателя должны быть согласованы со статистическими характеристиками PC. Следовательно, как квантователь, так и предсказатель должны быть адаптивными. В этом случае речь идет об адаптивной ДИКМ (АДИКМ).
Основная идея адаптивного квантования состоит в том, что шаг квантования изменяется таким образом, чтобы соответствовать изменяющейся дисперсиикодируемого сигнала. В результате размеры шкалы квантования подстраивают в соответствии с энергией речи так, чтобы слабые сигналы квантовались малыми ступенями квантования, а сильные сигналы – большими. Благодаря непрерывной подстройке шага квантования к текущей мощности речи, разрядность шкалы квантования при АДИКМ удалось снизить до четырех бит и получить кодек со скоростью передачи 32 кбит/с (в два раза ниже ИКМ-64) и качеством, близким к ИКМ [26].
Процедура предсказания может быть фиксированной и адаптивной.
Фиксированное предсказаниехарактеризуется постоянными параметрами предсказателя, которые выбираются исходя из свойств долговременной корреляционной функции PC. Наибольшее распространение при дифференциальном кодировании получило линейное предсказание, при котором предсказанное значение сигнала формируется как линейная комбинация предыдущих отсчетов на анализируемом сегменте PC длительностью 20...30 мс.
Адаптивное предсказаниеосновано на слежении за изменением кратковременной дисперсии PC. В результате коэффициенты предсказания периодически обновляются на основании анализа системы уравнений коэффициентов с целью минимизации среднего квадрата погрешности предсказания на коротком интервале времени. В этом случае оценивается кратковременная корреляционная функция PC в предположении его локальной стационарности, т.е. предполагается, что свойства PC не меняются в течение короткого интервала времени [26, 27].
В 1984 году был принят стандарт на АДИКМ (32 кбит/с) ITU-T G.721, позднее замененный на G.726, для передачи по каналам со скоростью 16, 24, 32 кбит/с с хорошим качеством, используемый в настоящее время в бесшнуровой телефонии стандартов СТ2 и DECT и системах абонентского доступа. При использовании адаптивного предсказания при прочих равных условиях качество РС получается существенно выше [3].
Обобщенная схема кодека АДИКМ [27] представлена на рис. 6.3.
Аналоговый РС дискретизируется и затем обрабатывается в 12-битном (т = 12) линейном АЦП.
На следующем этапе вычисляется ошибка предсказания z(k) как разность между реальным s(k) и предсказанным значениями сигнала.
Рис. 6.3. Схема кодека АДИКМ по рекомендации МККТТ G.726
Представленный 12-битным словом разностный сигнал z(k) обрабатывается в квантователе, имеющим логарифмическую (по основанию 2) характеристику и 16 порогов квантования.
В результате последующего кодирования квантованной ошибки предсказания zq(k) формируется ее 4-битовое (т = 4) представление s1(k), что при частоте дискретизации 8 кГц обеспечивает скорость цифрового потока на выходе кодера АДИКМ, равную 32 кбит/с.
Четырехбитовый выходной сигнал s1(k) на основе статистического оценивания его параметров позволяет определить значения масштабного множителя квантователя q(k) и коэффициенты предсказания, используемые соответственно в адаптивном квантователе и в схеме адаптивного предсказания. Восстановленная квантованная ошибка zq(k) добавляется к сигналу , снимаемому с выхода адаптивного предсказателя Р, и направляется на его вход.
АДИКМ обеспечивает выигрыш около 5 дБ по сравнению со обычной неадаптивной ИКМ с -законом. Адаптивный квантователь позволяет расширить динамический диапазон. С учетом дополнительного выигрыша в величине ОСШ приблизительно 6 дБ за схемы с адаптивным квантованием, АДИКМ позволяет получить ОСШ на 10...11 дБ больше, чем при использовании неадаптивного квантователя с тем же числом уровней [27].
При одной и той же вероятности ошибки на бит АДИКМ с скоростью 40 кбит/с обеспечивает намного лучшее качество передачи речи, чем логарифмическая -ИКМ со скоростью 56 кбит/с. При этом следует отметить, что снижение скорости передачи не обязательно сопровождается повышением устойчивости к ошибкам передачи. Более того, если РС представляется меньшим числом битов, то это сопровождается увеличением информации, содержащейся о сигнале в каждом бите, и, следовательно, необходимо повышать защищенность битов от ошибок. В некоторых типах низкоскоростных кодеров имеются биты, несущие критическую информацию; поэтому при ошибках в их приеме искажения речевого сигнала могут оказаться просто неприемлемыми.
Контрольные вопросы
1. В чем заключается основная особенность кодирования формы PC?
2. Какими способами реализуется этот метод кодирования?
3. Сформулируйте теорему В. А. Котельникова.
4. Искажается ли сигнал в процессе дискретизации?
5. Можно ли полностью восстановить дискретизированный сигнал?
6. Чем определяется выбор числа уровней квантования?
7. Какова цифровая скорость передачи РС в системе ИКМ?
8. Какую задачу решает фильтр нижних частот на входе системы ИКМ?
9. За счет чего достигается выигрыш при компандировании PC?
10. Каким образом удается обеспечить постоянство относительной ошибки квантования?
11. Можно ли её существенно уменьшить избыточность РС в ИКМ?
12. Как используется избыточность речи в системах ДИКМ и ДМ?
13. Чем вызвано искажение перегрузки по крутизне в ДМ?
14. Как уменьшить погрешности передачи при ДИКМ и ДМ?
15. В чем состоит суть метода линейного предсказания?
16. Что дает применение метода линейного предсказания в системах АДИКМ?
17. Почему системы типа АДИКМ не применяются в сотовой связи?