Обработка сообщений как кодирование

Основные понятия теории кодирования. Словом в алфавите А называется кортеж, т.е. любая конечная последовательность символов Обработка сообщений как кодирование - student2.ru где Обработка сообщений как кодирование - student2.ru , число Обработка сообщений как кодирование - student2.ru показывает длину слова Обработка сообщений как кодирование - student2.ru и обозначается Обработка сообщений как кодирование - student2.ru .Пустое слово обозначается L, т.е. если L Обработка сообщений как кодирование - student2.ru , то Обработка сообщений как кодирование - student2.ru = Обработка сообщений как кодирование - student2.ru .

Для слова Обработка сообщений как кодирование - student2.ru буква a1 называется началом или префиксом слова Обработка сообщений как кодирование - student2.ru , а буква Обработка сообщений как кодирование - student2.ru – окончанием или постфиксом слова Обработка сообщений как кодирование - student2.ru . Пустое слово является началом и окончанием любого слова Обработка сообщений как кодирование - student2.ru , если Обработка сообщений как кодирование - student2.ru . Для того, чтобы соединить слова, необходимо, чтобы префикс второго слова следовал сразу за постфиксом первого. Соединение слов a1 и a2 обозначается a1a2, соединение n одинаковых слов a обозначается Обработка сообщений как кодирование - student2.ru , причем Обработка сообщений как кодирование - student2.ru . Множество всех непустых слов алфавита A обозначим A*, т.е. A*={a|l(a)>0}, в алфавите В – B*. Множество A называют алфавитом сообщений, а множество B – кодирующим алфавитом.

Код сообщения Обработка сообщений как кодирование - student2.ru (от лат. codex - называется) такое слово Обработка сообщений как кодирование - student2.ru , что Обработка сообщений как кодирование - student2.ru , где Обработка сообщений как кодирование - student2.ru – отображение всех слов алфавита А на алфавит В. Процесс F: A*®B* преобразования слов исходного алфавита A в алфавит B называется кодированием информации.Назовем элементарной частью сообщения ту его минимальную часть, которой ставится в соответствие символ из множества B.

Блочно-двоичный (m,n)-код.Слово длины m записывается с помощью двоичных символов 0 и 1. Сообщение длины m кодируется другим словом длины n, где m<n, которое передается по каналу связи.Если все кодовые слова имеют одинаковую длину, то код называется равномернымили блочным.

Алфавитное кодирование.Алфавитное, т.е. побуквенное кодирование задается таблицей кодов или схемой в виде подстановки Обработка сообщений как кодирование - student2.ru . Из множества B* выбирается r слов b1, b2, …, br, называемых множеством элементарных кодов..

Схема Обработка сообщений как кодирование - student2.ru , где Обработка сообщений как кодирование - student2.ru или Обработка сообщений как кодирование - student2.ru задает алфавитное кодирование. Такое побуквенное кодирование обозначается Обработка сообщений как кодирование - student2.ru .

Префиксной называется схема Обработка сообщений как кодирование - student2.ru , в которой элементарный код одной буквы не является префиксом кода другой буквы.

Разделимой называется схема Обработка сообщений как кодирование - student2.ru , в которой любое слово, составленное из элементарных кодов, разлагается на элементарные коды единственным образом.

Проблема кодирования: возможность по коду b сообщения Обработка сообщений как кодирование - student2.ru однозначно восстановить это сообщение. Доказано, что если схема прямого кодирования Обработка сообщений как кодирование - student2.ru и схема Обработка сообщений как кодирование - student2.ru обратного кодирования обладают свойством префикса, то соответствующее алфавитное кодирование будем взаимно-однозначным. Однако может случиться, что схема кодирования будет обладать свойством однозначности, но не будет обладать свойством префиксности (т.е. это лишь достаточное условие, оно не является необходимым).

Теорема А.А. Маркова (Критерий взаимной однозначности): Алфавитное кодирование со схемой s обладает свойством взаимной однозначности тогда и только тогда, когда в соответствующем графе отсутствуют контуры и петли, проходящие через вершину Λ. Т.о., алфавитное кодирование не является однозначным тогда и только тогда, когда соответствующий граф содержит ориентированный цикл (контур), проходящий через вершину Λ.

Для установления, обладает ли заданный код свойством однозначности, будем применять алгоритм:

1) Выпишем все нетривиальные разложения каждого элементарного кода.
2) Составим множество M1, включая в него слова, входящие в качестве начал (префиксов) в нетривиальные разложения элементарных кодов.

3) Составим множество M2, включая в него слова, которые являются окончаниями (постфиксами) нетривиальных разложений элементарных кодов.

4) Составим множество Обработка сообщений как кодирование - student2.ru , которое состоит из множества начал, окончаний нетривиальных разложений элементарных кодов.

5) Выпишем все разложения элементарных кодов, связанных с элементами множества M.

6) По полученным разложениям построим ориентированный граф, вершины которого – элементы множества Обработка сообщений как кодирование - student2.ru . Пару вершин соединяем дугами тогда и только тогда, когда существует разложения, в которое вершины графа входят в качестве начала и конца.

7) Граф G подскажет, обладает ли заданная схема свойством однозначности. Для ответа на этот вопрос воспользуемся теоремой А.А. Маркова.

Алфавитное кодирование с разделимой схемой допускает декодирование. Для разделимой схемы Обработка сообщений как кодирование - student2.ru алфавитного кодирования существует так называемая средняя цена или длина кодирования Обработка сообщений как кодирование - student2.ru , которая обозначаетсяОбработка сообщений как кодирование - student2.ruи определяется Обработка сообщений как кодирование - student2.ru где Обработка сообщений как кодирование - student2.ru – длина кодового слова, а Обработка сообщений как кодирование - student2.ru – вероятность появления буквы Обработка сообщений как кодирование - student2.ru .

Двоичное кодирование. Рассмотрим алфавит Обработка сообщений как кодирование - student2.ru и некоторое произвольное множество A, которое может быть некоторым конечным алфавитом, множеством слов в некотором алфавите. Множество слов длины n в этом алфавите обозначим Bn.

Произвольное отображение множества A во множество слов алфавита B называют двоичным кодированием множества A. Код называется равномерным, если все буквы его алфавита имеют одинаковую длину.

Пусть Е - двоичная запись натуральных чисел. Кодирование Ek первых 2k натуральных чисел, когда каждому n (где 0£n<2k) ставится в соответствие слово ek(n) – двоичная запись числа n с помощью k цифр. Код Ek является равномерным,т.к. у которого все буквы алфавита имеют длину, равную k.

n
e(n)
e4(n)

Методы эффективного кодирования информации.Наиболее выгодным является кодирование, на которое затрачивается минимальное количество символов (букв алфавита).

Алфавитное разделяемое кодирование Обработка сообщений как кодирование - student2.ru будет кодированием с минимальной избыточностьюили оптимальным, если будут учтены распределения вероятностей p для символов этого алфавита.

Оптимальное кодирование. Последовательные появления букв алфавита А статистически независимы и подчинены распределению вероятностей Обработка сообщений как кодирование - student2.ru .

Каждый код b в алфавите В = {0, 1} характеризуется средним числом Обработка сообщений как кодирование - student2.ru двоичных цифр, приходящихся на одну букву алфавита А при побуквенном кодировании.

Наши рекомендации