Метод кодирования MPEG-4 CELP

Метод кодирования MPEG-4 CELP предназначен для обработки речевых сигналов (РС).

В системе DRM применяется вариант кодирования MPEG-4 CELP (стандарты ISO/IEC 14496-3 и ISO/IEC 14496-3/Amd1), обеспечивающий повышенную устойчивость против ошибок (Object Type ID=24, который является частью High Quality Audio Profile).

Метод MPEG-4 CELP в системе DRM обеспечивает кодирование и декодирование речевых сигналов при скоростях цифровых потоков на выходах кодеров от 4 до 24 кбит/с. Для данного метода в DRM предусмотрены две частоты дискретизации: fд = 8 кГц и fд = 16 кГц. Соответствующие значения диапазонов воспроизводимых звуковых частот:

100 Гц–3800 Гц для fд = 8 кГц;

50 Гц–7000 Гц для fд = 16 кГц.

Базовая блок-схема декодера MPEG-4 CELP представлена на рис. 3.4.

Метод кодирования MPEG-4 CELP - student2.ru

Рис. 3.4. Базовая блок-схема декодера MPEG-4 CELP

Генератор возбуждения содержит адаптивную кодовую книгу для моделирования периодических компонентов, фиксированные кодовые книги для моделирования случайных компонентов и декодер усиления для восстановления уровня речевого сигнала.

Индексы кодовых книг (повышение/понижение тона для адаптивной кодовой книги, индексы моделей для фиксированных кодовых книг, индексы усиления) используют для генерации возбуждающего сигнала. Сигнал, созданный этим генератором, поступает на вход линейного синтезирующего фильтра с предсказанием (Linear Predictive Synthesis Filter–LPSF).

Коэффициенты фильтра восстанавливаются на основе принятых LPC-индексов, которые предварительно интерполируются. Значения этих коэффициентов поступают на вход синтезирующего фильтра. На выходе декодера может быть установлен так называемый “пост-фильтр”. Пост-фильтр осуществляет фильтрацию декодированного речевого сигнала в целях улучшения качества восприятия речи. Типичная схема пост-фильтра содержит три основных элемента: долговременный пост-фильтр, кратковременный пост-фильтр и устройство масштабирования усиления. Имеются также вспомогательные элементы.

Долговременный пост-фильтр, иногда называемый пост-фильтром основного тона речи, представляет собой гребенчатый фильтр, спектральные пики которого расположены на частотах, кратных частоте основного сигнала, подлежащего фильтрации. Основная задача кратковременного пост-фильтра заключается в ослаблении частотных составляющих между пиками формант. Устройство масштабирования усиления обеспечивает одинаковый уровень речевого сигнала до и после обработки в пост-фильтре.

Звуковые кадры, формируемые кодером MPEG-4 CELP, имеют фиксированную длину. Эти кадры объединяются в сверхкадры, длительность которых 400 мс.

Применяется неравная защита от ошибок (UEP).

Начало каждого кадра имеет повышенную защиту от ошибок; оставшиеся биты размещаются в части кадра с нормальной защитой. Индексы, указывающие скорость цифрового потока, передаются в канал SDC.

Наши рекомендации