Кодирование информации. Кодированием называется сопоставление алфавитов, а правило
Кодированием называется сопоставление алфавитов, а правило, по которому оно производится,- кодом. Иными словами, кодирование можно определить как представление сообщений в форме, удобной для передачи по данному каналу. Электрический ток в телефонных проводах - это кодированная речь, а звуковые волны речи - это кодированные колебания голосовых связок.
В рассматриваемом нами конкретном случае кодирование есть представление по определенным правилам дискретных сообщений в некоторые комбинации, составленные из определенного числа элементов - символов. Эти элементы называются элементами кода, а число различных элементов, из которых слагаются комбинации,- основанием кода. Элементы кода образуют кодовые комбинации. Например, если мы составляем комбинации из различных сочетаний 0 и 1, то это код с основанием два или двоичный код. Если все комбинации имеют одинаковое число знаков, код называется равномерным. Широко известный код Морзе - неравномерный код. Правило кодирования обычно выражается кодовой таблицей, в которой каждому символу сообщения ставится в соответствие определенная кодовая комбинация.
Кодовое представление дискретных значений сигнала осуществляется с помощью цифр, но не обязательно десятичных. Напомним, что в десятичной системе, называя число, мы указываем, сколько единиц от нуля до девяти имеется в разряде единиц, в разряде десятков, сотен, тысяч и т. д. То же происходит в любой другой системе счисления с другим основанием. В десятичной системе мы пользуемся десятью цифрами: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. В двоичной системе счисления в нашем распоряжении только две цифры: 0 и 1
Если пронумеровать все буквы алфавита и необходимые специальные символы и выразить каждую цифру в двоичной системе счисления, получится натуральный двоичный код данного алфавита. Очевидно, что число разрядов в двоичной системе больше, чем в десятичной, так как основание системы счисления меньше.
Число кодовых комбинаций определяется числом дискретных значений сигнала. Например, если в языке 32 буквы (или букв и знаков), то для передачи сообщений на этом языке необходимо иметь 32 различные кодовые комбинации. В десятичной системе это означало бы передачу 32 цифр от 0 до 31. В двоичной системе необходимо составить отличающиеся друг от друга 32 кодовые комбинации, и так как 32 = 25, эти комбинации должны быть из 5 элементов, например 01010, 11111, 11001 и т. д. Число возможных кодовых комбинаций для представления 32 букв колоссально: 32! Один из этих вариантов есть натуральный пятизначный двоичный код, используемый для передачи букв латинского и русского алфавитов. При цифровом кодировании речевых сигналов исходят из практического наблюдения: искажения сигнала невелики, если его изменения представлять 128 амплитудными значениями, т. е. для его передачи необходимо 128 кодовых комбинаций. Для двоичного кода из соотношения 2n = 128 определяем, что длина кодовой комбинации n=7. Таким образом, для передачи речевых сигналов нужен код с 7-элементными кодовыми комбинациями. Обычно речевой сигнал по спектру ограничен частотой 4000 Гц. В этом случае речь в цифровой форме необходимо передавать со скоростью (вспомним теорему о выборках) 4000*2*7=56 кбит/с. Заметим, что обычно в комбинацию добавляют один служебный символ и тогда комбинация становится 8-элементной, а необходимая скорость передачи увеличивается до 64 Кбит/с.
Остановимся также на принципах помехоустойчивого кодирования, имеющего чрезвычайно важную роль в развитии средств передачи информации. Отметим, что теория помехоустойчивого кодирования является достаточно сложной, и наши рассуждения носят весьма упрощенный характер.
Основным условием обнаружения и исправления ошибок в принимаемых кодовых комбинациях является избыточность. Поясним это на примере.
Условимся, что необходимо передавать только четыре сообщения: А, Б, В и Г. Можно составить четыре 2-элементные комбинации для передачи этих сообщений:
А Б В Г
00 01 10 11
Пусть помехи воздействуют на комбинацию таким образом, что изменяют только один из ее элементов. Если помехе подверглась комбинация 00 и она вследствие этого превратилась в комбинацию 01, то мы не обнаружим ошибку, а будем просто считать, что вместо А передатчик послал Б. И так будет со всеми четырьмя комбинациями.
Теперь введем избыточность. Используем для передачи А, Б, В, Г трехэлементные кодовые комбинации, которых, кстати, может быть всего восемь. Выберем из восьми возможных комбинаций 000, 001, 010, 100, 110, 011, 101, 111 (других комбинаций быть не может) только четыре, но так, чтобы они максимально отличались друг от друга: 000, 011, 101, 110.
Пусть теперь в результате действия помехи изменится один из элементов в любой из выбранных комбинаций. Она не будет идентичной ни одной из наших комбинаций, и мы сразу укажем, что принята ошибочная. Таким образом, для передачи сообщений А, Б, В, Г код 00, 01, 10, 11 годится, но он не помехоустойчив, код же 000, 011, 101, 110 является помехоустойчивым. При этом следует оговориться, что он помехоустойчив только к таким помехам, которые могут привести лишь к однократной ошибке в комбинации. При двукратной ошибке код не помехоустойчив. Для защиты от таких помех ансамбля А, Б, В и Г пришлось бы допустить еще большую избыточность, используя 4-элементные кодовые комбинации, т. е. выбрав 4 комбинации из 16 возможных.
Таким образом, обнаружить ошибку невозможно, если любой принятый символ служит сообщением. Ошибки можно обнаружить только в том случае, если на возможные сообщения наложены некоторые ограничения.
Итак, одним из основных достоинств передачи информации в цифровой форме является возможность использования кодированных сигналов и оптимального в заданных условиях способа их приема. Важно, что при цифровой передаче все типы сигналов, такие как речь, музыка, телевидение, данные, могут объединяться в один общий поток информации, передача которого формализована. Кроме того, уплотнение при одновременном использовании компьютера позволяет эффективнее использовать спектр и время, защитить канал от несанкционированного доступа, объединить в единый процесс передачу цифровой информации и цифровую коммутацию каналов и сообщений.