Тема 2.4.Устранение избыточности речи, методы речевого кодирования в абонентском оборудовании мобильной связи

Требования к знаниям

Студент должен

знать:

· содержание методов кодирования формы сигнала и источника сигнала;

· методы оценки качества передачи речи;

· зависимость качества передачи речи от скорость кодирования;

· принципы работы вокодеров, типы вокодеров, гибридные кодеры;

· задачи выбора метода речевого кодирования в абонентском оборудовании различных стандартов сотовой, транкинговой связи, в стандартах беспроводной телефонии.
уметь:

· объяснить, почему длительность блочного кодирования выбирается величиной 20 мс;

Содержание учебного материала

Методы и показатели качества кодирования речевых сообщений.

Основная функция схем кодирования - проанализировать сигнал, удалить избыточность и соответствующим образом закодировать информативные части сигнала. При декодировании сигнала восстановить его с минимально-возможными отклонениями.

В процессе развития схем кодирования речи сложилось два метода кодирования: кодирование формы сигнала и кодирование источника сигнала.

Первый метод основан на использовании статических характеристик сигнала и практически не зависит от механизма формирования сигнала. Кодеры этого типа обеспечивают высокое качество передачи речи, но отличаются невысокой эффективностью при сжатии сигнала речи, представленного в цифровой форме.

При втором методе кодирования – кодировании источника сигнала, использовалась модель голосового тракта, а устройства, осуществляющие кодирование этим методом были названы вокодерами. Вокодеры позволяли получить низкую скорость передачи информации, но при характерном, «синтетическом» качестве речи на выходе.

Для снижения скорости цифрового потока разрабатываются всё более сложные методы устранения избыточности. Качество речи и скорость передачи–два конфликтующих фактора. Чем более низкая скорость речевого кодера, т.е. более высокая степень компрессии сигнала, тем больше страдает качество (достоверность) передаваемой речи. Другие критерии выбора, которые также должны рассматриваться, включают время задержки из-за кодирования при передаче от точки к точке, требования к источникам питания, особенно для портативных абонентских станций, совместимость с существующими стандартами и устойчивость закодированной речи к ошибкам в канале передачи. Особенно важным является последнее требование, поскольку каналом передачи в сотовой связи является радиоканал, в котором радиосигналы подвержены многим нежелательным эффектам (замираниям, затенениям, доплеровскому расширению спектра).

В зависимости от используемого метода кодирования речевого сигнала различные речевые кодеки(кодер и декодер) имеют разную устойчивость по отношению к ошибкам в канале передачи. Например, при одной и той же вероятности ошибки на бит ADPCM (АДИКМ) со скоростью 32 кбит/с обеспечивает намного лучшее качество передачи речи, чем логарифмическая PCM (ИКМ) со скоростью 64 кбит/с. Следует отметить, что снижение скорости передачи не обязательно сопровождается повышением устойчивости к ошибкам передачи. Более того, если речевой сигнал представляется меньшим числом битов, то это сопровождается увеличением информации, содержащейся о сигнале в каждом бите, и, следовательно, необходимо повышать защищённость битов от ошибок.

Выбор кодека осуществляется также с учётом размера соты в планируемой системе. Если размер соты мал, так что в системе обеспечивается высокая спектральная эффективность за счёт повторного использования частот, можно применять простые высокоскоростные кодеры. Напр., в системах стандартов СТ2, DECT (микросоты), кодеры ADPCM (АДИКМ) со скоростью 32 кбит/с обеспечивают приемлемое качество речи даже без канального кодирования. Сотовые системы имеют более крупные соты и более сложные условия распространения в радиоканалах. Поэтому они должны снабжаться низкоскоростными кодами, корректирующими ошибки в канале передачи.

В спутниковых системах с очень большим размером сот и малой доступной полосой частот, приходится ограничиваться скоростью речевого кодера порядка 3 кбит/с.

Для систем, которые работают в телефонных сетях общего пользования и им подобным, основным требованием является качество кодирования, однако для закрытых сетей, таких как коммерческие или военные системы, требования к качеству могут быть снижены с целью понижения скорости.

Перечень стандартов приведен в таблице 1.

PCM – импульсно-кодовая модуляция ИКМ

ADPCM – Адаптивная дифференциальная ИКМ

LD-CЕLP – возбуждаемое кодом линейное предсказание с малой задержкой APC – кодирование с адаптивным предсказанием

RPE-RTL – линейное предсказание с возбуждением регулярной последовательностью импульсов и долговременным предсказанием.

MPLPC - многоимпульсное кодирование с линейным предсказанием

VSELP - линейное предсказание с векторным возбуждением

CELP – линейное предсказание с возбуждением от кода

MBE – многополосное возбуждение

VAPC – кодирование с векторно-адаптивным предсказанием

LPC-10 – кодирование с линейным предсказанием

Табл.1

Скорость преобразования кбит/с Область применения Тип кодера Год внедре- ния
ТФОП (1-е поколение) РСМ
ТФОП (2-е поколение) ADPCM
ТФОП (3-е поколение) LD-CELP
Морские системы связи INMARSAT Standard В APC
Общеевропейская система GSM RPE-RTL
9,6 Аэрокосмическая система связи (Skyphone) MPLPC
Мобильные системы связи (северо-американская система цифр. подвиж. р/с) VSELP
6, 7 Мобильные системы связи (японская сист. цифровой подвижной радиосвязи ) VSELP
5…6 Мобильная система связи Half-Rate GSM CELP
6,4 Наземные системы связи INMARSAT Standard M MBE
4,8 Федеральный стандарт правительст. США CELP
4,8 Система мобильной спутниковой связи NASA MSAT-X VAPC
2.4 Федеральный стандарт правительст. США LPC-10

Способы оценки качества передачи речи подразделяются на объективные и субъективные. Объективные критерии основываются на значениях некоторых статистических параметров, которые позволяют судить о степени отличия принятого по каналу связи речевого сигнала от переданного (средняя квадратичная ошибка, отношение сигнал – шум, искажения спектра и т. д.). Объективные критерии обычно используют при проектировании системы связи.

Но для слушателя оценкой качества речи является усреднённое субъективное восприятие. Субъективные критерии оценки качества речи основываются на статистической обработке субъективных оценок качества большого числа слушателей – экспертов.

Методика вычисления средней экспертной оценки регламентирована рекомендациями Европейского института стандартов в области Телекоммуникаций (ETSI-T):

табл. 2

Описание уровня Оценка Степень усилий при восприятии
Превосходный Без усилий
Хороший Нет ощутимых усилий
Допустимый Умеренные усилия
Слабый Значительные усилия
Плохой Теряется восприятие при физически возможных усилиях

В качестве примера ниже приведены результаты оценки семи типов кодеков

табл. 3

Тип кодера Cкорость преобразования Значения оценки MOS
PCM (ИКМ) 64 кбит/с 4,3
ADPCM (АДИКМ) 32 кбит/с 4,1
RPE-LTR (стандарт GSM) 13 кбит/с 3,58
VSELP (стандарт D-AMPS) 8 кбит/с 3,44
CELP (стандарт CDMA) 4,8 кбит/с 9,6 кбит/с 3,0 3,7
Q-CELP (стандарт CDMA) 13 кбит/с 4,02
LPC 2,4 кбит/с 2,5

Структурная схема процессов обработки речи в стандарте GSM.

В стандарте GSM принята прерывистая передача речи DTX (включение передатчика только во время разговора и отключение в паузах и в конце разговора). Система DTX управляется детектором активности речи VAD, который обеспечивает обнаружение и выделение интервалов передачи речи с шумом и шума без речи даже в тех случаях, когда уровень шума соизмерим с уровнем речи. В состав системы прерывистой передачи речи входит также УФКШ – устройство формирования комфортного шума, включаемое в паузах. DTX-процесс включает также в себя восстановление потерянных при передаче по радиоканалу фрагментов речи.

Рис. 3 Структурная схема процесса обработки речи в стандарте GSM.

Тема 2.4.Устранение избыточности речи, методы речевого кодирования в абонентском оборудовании мобильной связи - student2.ru

В случае применения стандартных кодеков ИКМ (PCM) для формирования 8 TDMA-кадров (временных каналов) в одном частотном канале потребовалась бы скорость передачи 64×8=512 кбит/с. Такую скорость обеспечить в частотном канале шириной 200 кГц практически невозможно. Имеется 2 решения:

- увеличение плотности передаваемой информации (сложна техническая реализация),

- применение более сложных способов кодирования, при которых передаётся меньший объём информации (передаваемая в радиоканале информация уменьшается, а затем восстанавливается в приёмном декодере).

Наиболее низкая скорость передачи информации в вокодерах – (1-3 кбит/с) не обеспечивает требуемого качества речи. В стандарте GSM используется способ кодирования, использующий вокодеры и DPCM (ДИКМ), который получил название дифференциального кодирования.

Речевой аппарат человека можно представить механизмом:

- источник колебаний – голосовые связки;

- горло и рот – фильтр.

Этот механизм инерционен и за 10-30 мс не изменяет своего состояния. И, если брать отрезки речевого сигнала по 20 мс, уметь определять частоту основного тона и параметры фильтра речеобразующего тракта, то по ним в приёмном устройстве можно восстановить исходный сигнал в состоянии близком к передаваемому. Изменение сигнала (ухудшение качества) происходит из-за того, что параметры речевого аппарата постоянно изменяются. Для уменьшения этого влияния, в DPCM кодируется не сам сигнал, а разность амплитуд поступившего и предыдущего дискретного отсчётов.

В Европейском стандарте GSM используется кодек RPE-LTR (долговременное предсказание с возбуждающей регулярной последовательностью импульсов). Кодер создаёт битовый поток со скоростью 13 кбит/с и был выбран после многочисленных экспертных оценок. Этот кодер вобрал в себя достоинства 2-х способов кодирования: RELP (линейное предсказание с возбуждением с остатком) и MPE-LTR (долговременное предсказание с импульсным возбуждением), предложенные ранее Францией и Германией. Преимущество RELP – кодека состоит в том, что он обеспечивает очень хорошее качество речи при сравнительно малой сложности. Однако, качество речи при использовании этого кодека ограничивается помехой, создаваемой при восстановлении высокочастотных компонентов речевого сигнала и ошибками при передаче битов по каналу связи. Благодаря модификации RELP – кодека с целью введения в него некоторых элементов MPE-LTR – кодека скорость нового кодека была снижена с 14,77 до 13,0 кбит/с без потерь качества речи. Наиболее важным введённым в кодек элементом, была петля предсказания.

Рис. 4 Функциональная схема кодера GSM

Наши рекомендации