Кодирование данных и действий
В результате моделирования информации получаются фактографическая и процедурная модели. Фактографическая модель представляется в виде некоторой структуры данных (например, таблиц реляционной модели), а процедурная информация - в виде алгоритмической структуры операций над данными фактографической модели. В итоге, с целью автоматизации работы с информацией, и данные и операции должны быть представлены числовыми кодами. Для того, чтобы получить представление об основах кодирования информации числовыми кодами, рассмотрим примеры некоторых систем и методов кодирования данных и операций.
Кодирование алфавитно-цифровых данных
В своей практической деятельности люди широко используют информацию, представленную в виде текстов. Это связано с тем, что символьная информация удобна для зрительного восприятия её человеком. Для создания текстов, несущих смысловую информацию, могут быть использованы только такие наборы символов, относительно которых между людьми имеется явная или неявная договорённость об их семантике. В связи с этим большое практическое значение имеют тексты, состоящие из букв, цифр и других символов, давно используемых людьми. Представленную таким образом информацию называют алфавитно-цифровой. Примером алфавитно-цифровой информации является календарная дата. Например, "20 июля 1953г".
В информатике в базовом наборе символов, используемых для представления алфавитно‑цифровой информации, различают символы трёх типов:
цифры – 0 1 2 . . . 9
буквы – русский, латинский или иной алфавит
специальные символы - . , = + пробел : ; & . . .
Термин алфавитно-цифровая информация относится и к цифрам, и к буквам, и к специальным символам. В состав специальных символов входят и символы для обозначения различных операций над данными.
Для автоматизации обработки алфавитно-цифровой информации возникает необходимость в её кодировании числами. Для этого достаточно закодировать числами символы базового набора. Так как базовый набор алфавитно-цифровых символов ограничен, то соответствующие символам числовые коды задаются с помощью таблицы. Полагают при этом, что код каждого символа должен иметь фиксированное и заранее определённое количество разрядов. Разрядность чисел, используемых для кодирования алфавитно-цифровой информации, зависит от количества символов базового набора. Например, 5-разрядными двоичными целыми числами можно закодировать базовый набор, состоящий максимум из 25=32 символов. Если в базовом наборе окажется хотя бы на один символ больше, то потребуются для кодирования уже 6-разрядные целые двоичные числа. Однако 6-разрядными кодами можно закодировать базовый набор, состоящий из 64 символов. Поэтому целесообразно расширить базовый набор дополнительными символами для более эффективного использования кода.
В настоящее время разработаны и используются для автоматизации обработки информации международные (стандартные) системы (таблицы) кодирования алфавитно-цифровой информации. Широко используется для кодирования алфавитно-цифровой информации международный код ASCII (American Standard Code for Information Interchange ‑ американский стандартный код для обмена информацией). В этом стандарте в качестве кодов используются 8-разрядные двоичные целые числа или их аналоги - 2-разрядные шестнадцатеричные целые числа. Например, код ASCII латинской буквы N имеет вид 4Е16 или 010011102 (ПРИЛОЖЕНИЕ 2). Символьные строки в коде ASCII представляются последовательностью кодов, заканчивающейся кодом 0016.
В качестве примера рассмотрим символьную строку "МIR", представленную в шестнадцатеричных кодах ASCII. Так как в этом коде M=4D16, I=4916, R=5216, а 0016 – признак конца строки, то символьная строка "MIR" представится в закодированном виде как 4D49520016.
Кодирование изображений
Огромное количество информации, воспринимается человеком в форме изображений. Поэтому автоматизация информационных процессов, связанных с изображениями, приносить значительный эффект. Если при кодировании текстовой информации достаточно было поставить в соответствие конечному набору символов числовые коды, то изображение, в общем случае, не является дискретным, а существует как единое целое. Поэтому предварительно необходимо построить информационную модель изображения, для которой можно было бы применить процедуру кодирования числами. Существуют различные методы построения информационных моделей изображения. На примере прямоугольника рассмотрим в упрощенном виде один из методов построения информационной модели изображения и его кодирования.
Для информационного моделирования и кодирования изображения прямоугольника покроем его предварительно координатной сеткой (Рис. 11).
Рис. 11 Информационное моделирование изображения
Совокупность ячеек координатной сетки, целиком попавших в границы прямоугольника, будем рассматривать как информационную модель прямоугольника. Каждая ячейка однозначно задается парой 16-ричных цифр. Первая цифра будет означать номер столбца, а вторая - номер строки. Тогда в закодированном виде прямоугольник будет представлять собой набор 16-ричных чисел {32, 33, 34, 35, 36, 37, 38, 42, 43, 44, 45, 46, 47, 48, 52, 53, 54, 55, 56, 57, 58, 62, 63, 64, 65, 66, 67, 68, 72, 73, 74, 75, 76, 77, 78,}. Чтобы по числам восстановить вид прямоугольника достаточно на соответствующей координатной сетке отметить ячейки, соответствующие заданным числам. Очевидно, что точность восстановления границ фигуры зависит от разрешающей способности координатной сетки. Чем она чаще, тем фигура воспроизводится точнее.