Кодирование текстовой информации
Тема № 2: Передача информации
2.1 Процесс передачи информации, источник и приемник информации, сигнал, скорость передачи информации;
2.2 Кодирование и декодирование информации.
Информационные процессы - это действия с информацией, приводящие к какому-либо результату.
Виды информационных процессов:
- Хранение информации
- Обмен информацией (приём и передача)
- Обработка информации (преобразование, использование)
Информационная система – это взаимосвязанное сочетание, средств, методов и людей, участвующих в информационных процессах.
Для хранения необходимы носители информации.
Информация передаётся в виде информационных сообщенийот источникак приёмнику по каналам связи.
Создателями теории передачи и кодирования информации в каналах связи стали К. Шеннон, Н. Винер, А.Н. Колмогорови др. Обобщенную схему передачи данных можно проиллюстрировать схемой К. Шеннона.
Из множества возможных сообщений выбирается одно и кодируется. Закодированное сообщение поступает в канал связи и под воздействием помех этого канала превращается в искаженное сообщение. На приемном конце канала связи необходимо провести декодирование сообщения, но сначала необходимо ликвидировать искажение.
Одна из важных задач, решаемых в теории кодирования, - это разработка специальных корректирующих кодов, которые позволяют находить и исправлять ошибки, возникающие при передаче сообщений.
Каждое звено этой схемы может быть представлено каким-нибудь устройством. Соединяясь, они образуют систему связи и передачи информации.
Для того, чтобы осуществить схему Шеннона, информация, поступающая обычно непрерывно (звук, изображение), должна быть представлена в дисперсном виде, т.е. разделена на мелкие части, для кодирования.
Информация передается нам по различным каналам - электрическим и телефонным проводам, радиоволнам и т.п.
Скорость передачи данных - скорость, с которой передается или принимается информация в двоичной форме. Обычно скорость передачи данных измеряется количеством бит, переданных в одну секунду.
Биты в секунду - единица скорости передачи информации, равная количеству двоичных разрядов, пропускаемых каналом связи в 1 секунду с учетом и полезной и служебной информации.
Пропускная способность канала связи - максимальная скорость передачи данных от источника к получателю.
Символы в секунду - единица измерения скорости передачи (только) полезной информации.
Кодирование - инструмент преобразования информации.
Кодирование текстовой информации
Всякий текст – это набор знаков. Но компьютер не может различать знаки, он “понимает” только язык электрических сигналов. Поэтому каждый знак в компьютере закодирован некоторой неповторимой последовательностью электрических сигналов, а им, в свою очередь, установлено цифровое соответствие – код. Нажимая на клавишу клавиатуры, мы посылаем такой код в память компьютера, затем процессор ищет ему соответствие и выдаёт необходимый знак на экран монитора.
Процесс преобразования в компьютере текстовой информации в цифровую форму и обратно называют текстовым кодированием. Таким образом, человек различает знаки по их начертанию, а компьютер – по их коду.
Коды составляют таблицу кодировки, к которой и обращается процессор при обработке текстов. В этой таблице для представления любого текста предусмотрено 28 (256) знаков, что составляет машинный алфавит. Первые 33 кода таблицы (с 0 по 32) отведены не для знаков, а для операций (перевод строки, ввод пробела и т. д.). Коды с 33 по 127 – интернациональные и соответствуют символам латинского алфавита, цифрам, знакам препинания и знакам арифметических действий. Коды с 128 по 255 являются национальными, то есть в нашей стране отведены для знаков кириллицы.
На сегодняшний день существует универсальная таблица кодировки – ASCII (American Standart Code for Information Interchange). Но она не единственная. Для русских букв существует несколько кодировок, среди которых: СР1251 (Windows), СР866, КОИ-8 (MS-DOS). В последнее время появился новый международный стандарт Unicode, который позволяет кодировать 216 (65536) символов.