Обработка речевых сигналов на радиоучастке
Описание обработки речевого сигнала на радиоучастке приводится на упрощенной схеме приемо-передатчика мобильной станции (рис. 21.6).
Рис. 21.6. Упрощенная блок-схема приемо-передатчика мобильной станции
Так как аналогичные блоки содержатся и в базовой станции, поэтому ограничимся описанием только мобильной станцией.
В микрофоне речевой сигнал преобразуется в электрический, ширина спектра которого ограничена фильтром и составляет 4 КГц. В состав передатчика и приемника входят следующие блоки.
· Аналого-цифровой преобразователь (АЦП) преобразует в цифровую форму сигнал с выхода микрофона. Последующая обработка и передача сигнала речи производится в цифровой форме, вплоть до обратного цифро-аналогового преобразования (ЦАП) на приеме.
· Кодер речи осуществляет кодирование сигнала речи в цифровой форме с целью сокращения объема информации, передаваемой по каналу связи. Декодер речи восстанавливает на приеме поступивший на него закодированный сигнал речи.
· Кодер канала добавляет в сигнал закодированной речи дополнительную информацию, предназначенную для защиты от ошибок на радиоучастке. Декодер канала проверяет принятую информацию на наличие ошибок и выявленные ошибки по возможности исправляет.
· Модулятор осуществляет перенос информации на несущую частоту. Демодулятор выделяет из модулированного радиосигнала несущую информацию.
Рассмотрим все этапы обработки.
Кодер речи
Кодер речи является первым элементом цифрового участка передающего тракта, следующим после АЦП. На вход кодера речи поступает поток информации со скоростью 64 Кбит/c. Основная задача кодера (encoder) речи – уменьшение скорости передачи, т.е. предельно возможное сжатие сигнала речи, но при сохранении приемлемого качества передачи речи. В приемном тракте перед АЦП размещен декодер речи. Задача декодера (decoder) – восстановление обычного цифрового сигнала речи. В GSM используется кодирование речи на основе линейного предсказания LPC (Liner Predictive Coding). Суть этого метода заключается в том, что по каналу связи передаются не параметры речевого сигнала, а параметры некоторого фильтра, эквивалентного голосовому сигналу, и параметры возбуждения этого фильтра. Задача кодирования на передающем конце канала связи заключается в оценке параметров фильтра и параметров сигналов возбуждения, а задача декодирования на приемном конце – в пропускании сигнала возбуждения через фильтр, на выходе которого получается восстановленный сигнал речи. Метод линейного предсказания заключается в том, что очередная выборка речевого сигнала с некоторой степенью точности предсказывается линейной комбинацией m предшествующих выборок. Для каждого 20-миллисекундного сегмента оцениваются параметры фильтра кратковременного линейного предсказания, составляющие 260 бит информации. Таким образом, кодер речи осуществляет сжатие информации в 4.92 раза – (64 Кбит/с*20 мс)/260 бит, а скорость потока данных на выходе речевого кодера уменьшается с 64 Кбит/c до 13Кбит/c.
При оценке качества кодирования и сопоставлении кодеров оцениваются разборчивость речи и качество синтеза (качество звучания) речи. Для оценки разборчивости речи используют метод DRT (Diagnostic Rhyme Test – диагностический рифмованный тест). В этом методе подбираются пары близких по звучанию слов, отличающихся отдельными согласными (типа «дот – кот», «кол – гол»), которые многократно произносятся рядом дикторов, и по результатам испытаний оценивается доля искажений. Метод позволяет получить как оценку разборчивости отдельных согласных, так и общую оценку разборчивости речи.
Для оценки качества звучания используется критерий DAM (Diagnostic Acceptability Measure – диагностическая мера приемлемости). Испытания заключаются в чтении несколькими дикторами мужчинами и женщинами, ряда специально подобранных фраз, которые прослушиваются на выходе тракта связи рядом экспертов-слушателей, выставляющих свои оценки по пятибалльной шкале. Результатом является средняя субъективная оценка, или средняя оценка мнений (Mean Opinion Score – MOS). Хотя этот метод является субъективным по своей сути, его результаты по сопоставлению различных типов кодеков при проведении испытаний одними и теми же группами дикторов и экспертов- слушателей являются достаточно объективными. В качестве примера в табл. 21.3 приведены результаты оценки используемого в GSM кодека по сравнению с импульсно-кодовой модуляцией без использования сжатия методом линейного предсказания.
Таблица 21.3. Оценка кодеков речи по шкале MOS
Тип кодека | Скорость передачи информации, Кбит/с | Оценка MOS |
ИКМ | 4.12 | |
RPE-LTP (стандарт GSM) | 3.58 |
Кодер канала
Основная задача кодека канала – помехоустойчивое кодирование/декодирование сигнала речи, т.е. такое кодирование которое позволяет обнаружить и в значительной мере исправить ошибки, возникающие на радиоучастке, т.е. между BTS и MS. Методы обнаружения ошибок применяются в протоколах управления каналами передачи данных, таких как HDLC, а также транспортных протоколах, таких как TCP. При этом имеется в виду повторная передача искаженных в канале блоков данных. Для беспроводных каналов характерен высокий уровень ошибок, в результате чего потребуется недопустимо большое число повторных передач, что для речевых сообщений недопустимо из-за больших задержек.
Используемые в сотовой связи дециметровые волны, распространяются в основном по прямой, но испытывают многочисленные отражения от крупных объектов. При сложении нескольких сигналов, прошедших по разным путям и имеющих в точке приема в общем случае различные фазы, результирующий сигнал может быть как выше среднего уровня, так и заметно ниже. Образующиеся замирания сигнала (колебания уровня) бывают достаточно глубокими, и при этом отношение сигнал/шум падает настолько сильно, что полезная информация может существенно искажаться шумами, вплоть до полной ее потери. В сети GSM для борьбы с замиранием, а также с межсимвольной интерференцией может использоваться расширение спектра методом перескока частоты или скачков по частоте (frequency hopping). Метод скачков по частоте состоит в том, что несущая частота для каждого физического канала периодически переводится на новый частотный канал. При изменении частоты замирание с большей вероятностью не будет. Следовательно, при достаточно частых изменениях частоты существенно снижается вероятность длительных замираний и соответственно снижается вероятность групповых ошибок. С одиночными ошибками можно успешно бороться с помощью помехоустойчивого кодирования, о чем подробно будет изложено в настоящем разделе.
По качеству речи, воспроизводимой с помощью кодека речи GSM, биты в 260-битовом блоке можно разделить на три класса:
· Класс 1a: 50 бит, наиболее чувствительные к битовым ошибкам.
· Класс 1b: 132 бита, умеренно чувствительные к битовым ошибкам.
· Класс 2a: 78 бит, минимально чувствительные к битовым ошибкам.
Для защиты первых 50 бит используется 3-битовая проверка с помощью циклического кода. При обнаружении ошибки – весь блок 260 бит отбрасывается и заменяется предыдущим. Эти 53 бита при необнаруженной ошибке, 132 бита класса 1b, а также 4 - битовая остаточная последовательность нулей (т.е. всего 189 бит), затем защищаются сверточным кодом. Сверточный код используется для исправления одиночных ошибок. Коды с исправлением ошибок называются прямой коррекцией ошибок FEC (Forward Error Correction).
При сверточном кодировании (рис. 21.7) K последовательных символов входной информационной последовательности, по k бит в каждом символе участвуют в образовании n-битовых символов выходной последовательности, n > k, причем на каждый символ входной последовательности приходится по одному символу выходной.
Каждый бит выходной последовательности получается в результате суммирования по модулю 2 нескольких бит (от двух до Kk бит) K входных символов, для чего используются n сумматоров по модулю 2. Сверточный кодер с параметрами n, k, K обозначается (n, k, K).
Рис. 21.7. Схема сверточного кодера (4, 2, 5)
(n = 4, k =2; R = k/n = ½)
Отношение R=k/n называется скоростью кодирования кодера. Параметр K называется длиной ограничения и определяет длину сдвигового регистра (в символах), содержимое которого участвует в формировании одного выходного символа.
После того как очередной выходной символ сформирован, входная последовательность сдвигается на один символ вправо, в результате чего символ 1 выходит за пределы регистра, символы 2, 3, 4, 5 перемещаются вправо, каждый на место соседнего, а на освободившееся место записывается очередной символ входной последовательности, и по новому содержимому регистра формируется следующий выходной символ. Если k = 1, т.е. символы входной последовательности однобитовые, сверточный кодер называется двоичным. Сверточный кодер, схема которого приведена на рис. 21.7 не является двоичным, поскольку для него k = 2.
В случае GSM 189 бит речевого сигнала защищаются сверточным кодом (2, 1, 5), что в итоге составляет 456 бит (189*2 плюс 78 бит незащищенные). В результате на выходе кодера канала скорость потока данных увеличивается с 13 Кбит/с до 22.8 Кбит/с - (13 Кбит/с*456бит/260бит).
На рис. 21.8 приведено описанное выше канальное кодирование 20-миллисекундного сегмента речи.
Рис. 21.8. Канальное кодирование 20-миллисекундного сегмента речи
Сверточный код (2.1.5) используется для исправления одиночных ошибок. Кодированный блок сегмента речи подвергается перемежению. Примем в качестве меры избыточности, вносимую кодированием, отношение длины исходной информации к длине информации, передаваемой в канал. Будем называть это значение скоростью кодирования. В данном случае для сегмента речи эта величина равна 260/456, т.е. 0,57. Высокая избыточность кодирования при исправлении одиночной ошибки не позволяет использовать кодирование с большей исправляющей способностью (т.е. двойные и более ошибки). Перед выдачей в канал связи закодированная информация речи также подвергается перемежению. Перемежение представляет собой такое изменение порядка следования символов информационной последовательности, т.е. такую перестановку, или перетасовку, символов, при которой стоявшие рядом символы оказываются разделенными несколькими другими символами. Такая процедура предпринимается с целью преобразования групповых ошибок (пакетов ошибок) в одиночные с которыми легче бороться с помощью кодирования. Использование перемежения – одна из характерных особенностей сотовой связи, и это является следствием неизбежных глубоких замираний сигнала в условиях многолучевого распространения, которое практически всегда имеет место, особенно в условиях плотной городской застройки. При этом группа следующих один за другим символов, попадающих на интервал замирания (провала) сигнала, с большой вероятностью оказывается ошибочной. Если же перед выдачей информационной последовательности в радиоканал она подвергается процедуре перемежения, а на приемном конце восстанавливается прежний порядок следования символов, то пакеты ошибок с большой вероятностью рассыпаются на одиночные ошибки. Известно несколько различных схем перемежения и их модификаций – диагональная, блочная, сверточная и другие. Мы кратко рассмотрим первые две из них, лежащие в основе схем, применяемых в сотовой связи.
При диагональном перемежении входная информация делится на блоки, а блоки – на субблоки, и в выходной последовательности субблоки, например, второй половины предыдущего блока чередуются с субблоками первой половины следующего блока. Такая схема иллюстрируется на рис. 21.9, где каждый блок состоит из шести субблоков, и субблоки первого блока обозначены ai, второго – bi, третьего – ci. Субблок может состоять из нескольких символов, или из одного символа, или даже из одного бита. Приведенная схема диагонального перемежения вносит малую задержку, но расставляет соседние символы лишь через один, т.е. рассредоточение ошибочных символов группы получается сравнительно небольшим.
Рис. 21.9. Пример схемы диагонального перемежения
При блочном перемежении входная информация также делится на блоки по n субблоков (или символов) в каждом, и в выходной последовательности чередуются субблоки k последовательных блоков. Работу этой схемы можно представить себе в виде записи блоков входной последовательности в качестве строк матрицы размерности k*n (рис. 21.10), считывание информации из которой производится по столбцам. Следовательно, если входная последовательность в этом примере имела вид a1,a2,...,an,b1,b2,...,bn,k1,k2,...,kn, то выходная будет такой: a1,b1,...,k1,a2,b2,...,k2,an,bn,...,kn. Субблоки, или символы, в частном случае здесь также могут состоять лишь из одного бита. Схема блочного перемежения вносит большую задержку, чем диагонального, но значительно сильнее рассредоточивает символы группы ошибок.
Рис. 21.10. Схема блочного перемежения
В стандарте GSM используется достаточно сложная и совершенная схема блочно- диагонального перемежения. 456 бит информации одного 20-миллисекундного сегмента речи разбиваются на 8 подсегментов. 57 бит одного подсегмента распределяются между смежными восемью подсегментами таким образом, что после перемежения смежными с каждым конкретным битом оказываются соответствующие ему по положению биты, отстоявшие от него до перестановки на 4 подсегмента, причем на четные и нечетные (после перестановки) битовые позиции подсегмента ставятся биты из смежных сегментов. Алгоритм перемежения обладает свойствами квазислучайности, так что смежные биты исходной последовательности оказываются разделенными непостоянным числом бит, что является преимуществом в борьбе с периодическим битовыми ошибками.
Вносимая задержка речи составляет существенную величину порядка 70-80 мс и включает порядка 20 мс на кодек речи, 10-20 мс на кодек канала и 40 мс на перемежение и деперемежение.
Информация каналов управления подвергается блочному и сверточному кодированию в полном объеме. Так, для кодирования информации каналов SACCH, FACCH, FCCH, PCH, AGCH, SDCCH используется блочный кодер (224, 184), сверточный кодер (2, 1, 5) и та же схема перемежения, что и для канала трафика. В каналах RACH, SCH используются другие схемы блочного кодирования, а также сверточные кодеры (2, 1, 5), отличающиеся от сверточных кодеров перечисленных ранее каналов управления. При передачи данных используются более сложные схемы сверточного кодирования и перемежения, обеспечивающие соответственно и более высокое качество передачи информации. На рис. 21.11 приведена схема кодирования блока сигналов управления между мобильной станцией MS и базовой станцией BTS. При передачи управляющих сообщений используется кодирование с более сильной коррекцией ошибок, чем при передаче речи.
Управляющее сообщение состоит из 23 байт, т.е. 184 бит. При кодировании к управляющему сообщению (блоку данных) добавляется 40 бит контрольно-проверочной комбинации блочного циклического кода CRC.
Скорость кодирования блоков символов управления равна 184/456=0,4. Это значит, что избыточность кодирования выше, чем в случае сегмента речи, схема которого приведена выше на рис. 21.10.
Рис. 21.11. Канальное кодирование блока символов управления
Модуляция
Модулятор является последним элементом передающего тракта (рис. 20.8) и, строго говоря, не выполняет никаких операций собственно цифровой обработки сигналов. Его задача состоит в переносе информации цифрового сигнала с выхода кодера канала на несущую частоту, т.е. в модуляции сверхвысокочастотной (СВЧ) несущей низкочастотным (НЧ) цифровым сигналом. Модулированный СВЧ сигнал с выхода модулятора через антенный коммутатор поступает на антенну и излучается в эфир, чтобы быть затем принятым антенной станции-получателя информации. Соответственно демодулятор – первый элемент приемного тракта, и его задача заключается в выделении из принятого модулированного радиосигнала информационного сигнала, который подвергается цифровой обработке в последующей части приемного тракта.
Как известно, существуют три основных вида модуляции: это амплитудная модуляция – AM (Amplitude Modulation – AM), частотная модуляция – ЧМ (Frequency Modulation – FM) и фазовая модуляция – ФМ (Phase Modulation – PM). Между тем, в цифровой сотовой связи фигурируют такие названия, как квадратурная фазовая модуляция (Quadrature Phase Shift Keying – QPSK), бинарная фазовая модуляция (Binary Phase Shift Keying) и др. На самом деле, это не что иное, как разновидности фазовой или частотной модуляции, предназначенные для передачи дискретных (цифровых) сигналов. В стандарте GSM используется гауссовская модуляция MSC с минимальным сдвигом (Gaussian Minimum Shift Keying – GMSK). В основу схемы MSK положена двоичная частотная манипуляция без резких изменений фазы, т.е. MSK относится к схемам модуляции без разрыва фазы. Напомним о комбинированной амплитудной модуляции QAM (глава 3, раздел 3.4), широко используемой в беспроводных сетях связи GSM, WiMAX и др.