Системы кодирования информации
При получении и обработке информации важно представить ее в более компактной и удобной форме – присвоить определенные кодовые обозначения или коды определенным объектам, т.е. закодировать.
Кодирование – это присвоение объекту кодового обозначения.
Процессу кодирования всегда предшествует классифицирование объектов или выбор системы классификации.
Декодирование информации – это преобразование кодового обозначения в исходную форму.
При составлении первичных документов и создании массивов информации на машинных носителях, передаче данных по каналам связи, вводе их в компьютер и выдаче результатной информации потребителям используется многократный процесс кодирования и декодирования информации.
Необходимость кодирования информации обусловлена:
ü ее большими объемами;
ü высоким удельным весом алфавитной информации;
ü преобладанием логических операций в процессе обработки информации;
ü возрастанием объемов информации, подлежащей передаче по каналам связи.
Коды облегчают распознавание признаков объектов и возможность их контроля, упрощают и ускоряют запись информации на любом носителе и наведение всевозможных справок. Применение кодов значительно облегчает группировку информации.
Под кодом понимается условное обозначение объекта с помощью цифр, букв или буквенно-цифровых символов, присвоенных по определенным правилам. Цифры, буквы и символы, используемые в кодовом обозначении, называются алфавитом кода.
Коды имеют определенную длину L – количество знаков в коде и структуру – порядок расположения знаков в нем.
По форме коды могут быть простые и сложные. Простые коды предусматривают кодирование одной совокупности; сложные – объединение двух и более совокупностей в одном коде.
В зависимости от используемого алфавита различают цифровые и алфавитно-цифровые коды.
Совокупность элементов множеств, включающих перечень элементов, равнозначных по отношению к друг другу, называется номенклатурой. Каждый элемент номенклатуры называется позицией.
Величина номенклатур, подлежащих кодированию, весьма разнообразна. Наименование предприятий, цехов, административно-территориальных единиц, наименование материалов, готовых изделий и услуг, средств труда, категории работающих, профессий составляют определенные номенклатуры.
Системой кодирования называется совокупность правил кодирования элементов экономической информации. При кодировании элементов экономической информации широко используются порядковая, серийно-порядковая, разрядная (позиционная), повторения и комбинированные системы.
При порядковой системе кодирования каждому элементу кодируемого множества присваивается номер по порядку без какого-либо пропуска номеров, что обеспечивает сплошное использование емкости кода и его минимальную длину, но не оставляет резерва для включения дополнительных позиций. Поэтому порядковую систему рекомендуется использовать для небольших, простых и стабильных номенклатур, например, для категорий работающих, видов образования, единиц измерения и т.д.
Серийно-порядковая система применяется для кодирования элементов множеств, имеющих неглубокую классификацию, например, по двум признакам. При кодировании старшему признаку отводится серия номеров, внутри которой все элементы младшего признака кодируются по порядку. Размер серий устанавливается с учетом количества элементов младшего признака и необходимого резерва свободных номеров на случай расширения номенклатуры. Для новых элементов отводятся кодовые обозначения из резерва свободных номеров соответствующей серии.
К недостаткам серийно-порядковой системы следует отнести малую информативность и то, что размеры серий не всегда можно предусмотреть.
Серийно-порядковую систему рекомендуется использовать для кодирования цехов и отделов предприятия, видов оплат и удержаний и т.д.
Разрядная (позиционная) система кодирования применяется для кодирования сложных номенклатур. Все элементы кодируемого множества классифицируются по определенным признакам, и каждому из них отводится определенное число разрядов (позиций) в соответствии с количеством элементов данной группировки.
Предположим, надо построить классификатор материалов. Известно, что все материалы подразделяются на классы, каждый класс – на группы, группа – на подгруппы, а каждая подгруппа содержит определенное число наименований материалов. Количество элементов следующее: классов – 15, групп – 9, подгрупп – 12, наименований материалов в подгруппе – более 100.
Код материалов будет иметь следующий вид:
XX Х XX XXX
Класс Группа Подгруппа Наименование материалов
При разрядной системе кодирования резерв свободных номеров определяется самой структурой кода.
Достоинствами разрядного кода являются четкое выделение каждого классификационного признака, стройность и логичность построения, удобство при машинной обработке, высокая информативность. К недостаткам кода относится его большая длина.
Система повторения применяется для кодирования отдельных номенклатур. При этом кодовые обозначения позиций включают в себя цифровые и буквенно-цифровые обозначения, непосредственно характеризующие данный объект (размер, вес, возраст и т.п.). Коды повторения используются для кодирования балансовых счетов и субсчетов, обозначения чисел месяца, месяцев, лет, разрядов рабочих и др. Коды, построенные по этой системе, просты и легко запоминаются. К недостаткам этой системы следует отнести узость ее применения.
При комбинированной системе кодирование осуществляется одновременно по нескольким системам, например разрядной и системе повторения, разрядной и серийной. Данную систему целесообразно использовать для кодирования сложных многопризначных номенклатур.
При записи кодированной информации на документах и машинных носителях могут возникать ошибки. Искажение информации происходит также при передаче ее по линиям связи и при вводе в компьютер.
Для уменьшения вероятности появления ошибок на указанных операциях целесообразно использовать специальные коды, получившие название кодов обнаружения ошибок. С их помощью можно осуществлять эффективный аппаратный и программный контроль. В информационных системах эти коды применяются для контроля записи информации на машинные носители, контроля передачи и ввода данных в ЭВМ. При построении таких кодов широко используется принцип делимости кодового числа на модуль или контроль по модулю.
Контроль по модулю заключается в том, что к каждому кодовому значению реквизита-признака приписывается заранее исчисленное контрольное число, которое и служит для автоматического обнаружения ошибок. Полученное кодовое число должно делиться на модуль без остатка.
На практике широко известны методы контроля по модулю 9, 10, 11.
Структура кодового числа может быть представлена следующим образом: кодовое значение признака и контрольное число.
Контрольное число вычисляется по формуле
КЧ=М – У, (3.2)
где КЧ – контрольное число; М – модуль Î {9, 10, 11}; У – остаток от деления суммы цифр информационного кодового обозначения на модуль.
Например, надо исчислить контрольное число по модулю 11 кодового обозначения признака, равного 1265.
Сумма цифр кодового обозначения равна 1 + 2 + 6 + 5 = 14.
При делении на 11 остаток равен 3. Следовательно, контрольное число – 8.
Таким образом, в кодовое обозначение 1265 добавляется контрольное число 8, и кодовое число будет 12658.
Далее контроль выполняется с помощью специальных технических средств или программным путем на ЭВМ и заключается в проверке делимости суммы цифр кодового числа на модуль.
Описанный метод контроля не обнаруживает ошибки в перестановке цифр (1265 и 1625) из-за того, что не учитывает места цифры в числе.
Для повышения надежности специальных кодов используется не просто сумма цифр кодового обозначения, а сумма произведений цифр на номер места (вес) цифры в числе. Цифра в контрольном числе должна дополнить эту сумму произведений до числа, кратного модулю. Например, для исчисления контрольного числа кодового обозначения 1265 выполняются следующие операции:
умножение каждого разряда кода на соответствующий вес и получение суммы произведений:
(1 · 4 + 2 · 3 + 6 · 2 + 5 · 1) = 27;
деление полученной суммы на модуль (например, 11):
27/11 = 2 + остаток 5;
исчисление контрольного числа:
11–5 = 6;
контрольное число 6 прибавляется к кодовому обозначению, и кодовое число записывается как 12656.
В условиях машинной обработки экономической информации применение кодов обнаружения ошибок имеет важное практическое значение. Эффективность их применения очень высока и составляет 99,995%.