Методы кодирования экономической информации
Методы кодирования технико-экономической информации, которые используются при создании классификаторов, непосредственно связаны с методами классификации. Кодирование предназначено для формализованного описания семантики (названий) различных аспектов данных, которые используются в управлении народным хозяйством, чаще всего в виде цифровых кодов. Такое представление самое приемлемое для повышения эффективности автоматизированной обработки экономической информации.
Кодированием называют процесс обозначения первичного множества объектов или сообщений с помощью набора символов заданного алфавита на основе совокупности определенных правил. В зависимости от используемых символов различают цифровые, буквено-цифровые и буквенные коды.
Количество символов в алфавите называют основанием кода. В зависимости от основания кода они бывают двоичные, десятичные, шіст-надцяткові т.д. В зависимости от использованных правил кодирования коды могут быть переменной или постоянной длины. Основным требованием к кодированию есть однозначное представление каждого объекта множества кодирования, т.е. каждому объекту множества должен соответствовать единый код.
Системой кодирования называют совокупность методов и правил обозначения объектов заданного множества. Она характеризуется емкостью - количеством кодов, которые различаются между собой, то есть комбинаций, использующих алфавит кода и правила образования кода.
Код характеризуется длиной или количеством использованных разрядов, структурой, которая отражает содержание отдельных разрядов или групп разрядов кода.
В процессе кодирования пытаются решить две основные проблемы - обеспечить эффективность и надежность переработки информации. Если решение первой проблемы чаще всего связано с попыткой уменьшить длину кода, то при решении второй приходится вводить информационную избыточность.
В процессе кодирования экономической информации необходимо решить следующие задачи: идентификации каждого объекта заданного множества, кодирования определенной совокупности атрибутов объекта и обеспечения информационной надежности или достоверности на всех этапах кодирования, передачи, хранения и переработки данных.
Код любого объекта состоит из идентификационной части, информационного блока, который содержит набор кодов, соответствующих свойствам определенного объекта, и дополнительных разрядов или блоков, которые обеспечивают защиту всего кода от возможных ошибок.
Есть четыре системы кодирования экономической информации.
1. Порядковая (регистрационная) система создание кода из натуральных чисел. Алфавит этого кода составляют числа 0, 1,..., 9; основание кода равно 10. Это самый распространенный метод кодирования объектов первичной множества. При использовании этого метода каждый объект классифицированной множества кодируется с помощью текущего номера. Порядковый метод применяется при кодировании одноознакових, постоянных и малозначительных номенклатур.
2. Серийно-порядковая система создание кода из натуральных чисел и закрепление серий (диапазонов) кодов за объектами с одинаковыми признаками. Метод характеризуется тем, что первичная множество делится на несколько частей (по определенному признаку) и для кодирования объектов каждой части назначается серия номеров (кодов). Объекты кодируются порядковым номером в пределах отведенных для них серий. Этот метод кодирования используется для объектов, которые имеют несколько признаков. При кодировании совокупности свойств объектов рекомендуют применять два основных метода создания кода: последовательного кодирования на основе использования иерархической классификации и параллельного кодирования на основе фасетной классификации.
3. Последовательная система построения кода с использованием кодов последовательно расположенных классификационных группировок" полученных в результате применения иерархической системы классификации. При использовании последовательного метода логично строится кодовая комбинация имеет большую информативность. Но код при этом очень громоздкий, сложный по структуре.
Через негибкость последовательного метода кодирования его целесообразно использовать лишь в тех случаях, когда технико-эконо-мична информация изменяется в незначительных размерах или совсем не изменяется в течение длительного времени использования классификаторов. Метод широко применяется при разработке общегосударственных классификаторов продукции, отраслей.
4. Параллельная система образование кода из кодов независимых группировок, полученных в результате применения фасетной классификации. Структура кода совокупности свойств при параллельном методе соответствует фасетной формуле.
Кодирование широко применяется во время автоматизированной обработки информации в финансово-кредитных учреждениях. При этом кодируются не только объекты, но и сами процессы и операции обработки, технологии, модели и т.д. Благодаря такому подходу удается существенно уменьшить объемы данных, а следовательно, и время их обработки.
Кодировка данных применяют не только для упрощения их обработки, но и для шифрования, чтобы скрыть содержание информации. Шифрование как технологическая операция усложняет процесс обработки данных и увеличивает общие затраты времени за счет операций шифрования и расшифрования. Кодировка должна обеспечивать в процессе автоматизированной обработки информации:
o решение всех задач по минимальной длины кода;
o единство кодов для всех задач, всех комплексов, подсистем и уровней управления;
o информационные связи для взаимосвязанных систем;
o возможность автоматического контроля за правильностью кодирования.
Кодировать объекты можно различными способами: вручную, автоматизировано (с помощью ЭВМ), с помощью специального оборудования и т.д.
Чтобы спроектировать код, нужно:
а) определить совокупность объектов, которые нужно кодировать;
б) выбрать систему классификации и кодирования;
в) определить длину кода и описать его структуру. Во время автоматизированной обработки экономической информации
важно контролировать правильность кодов вводимых данных с первичных документов, передаются и обрабатываются в ИС. Поэтому следует обеспечить автоматический контроль правильности кодов.
Автоматизация контроля правильности кодов базируется в основном на использовании метода контрольных чисел (контрольных разрядов). Суть этого метода заключается в том, что до кода, который нужно контролировать, добавляют еще один разряд, значение которого вычисляется по значениям других разрядов кода.
Код объекта который нужно контролировать,
заменяют на код ЛГ=(и1,....И,с), где c = f(k^,...tkn).
Автоматическое вычисление значения контрольного разряда и его сравнение с переданным или введенным значением обеспечивает контроль правильности передачи или введения других разрядов кода.
Простой способ распознавания одиночной ошибки заключается в добавлении к информационных разрядов контрольного бита проверки на парністьр (бит паритета). Этот бит можно формировать двумя способами. При первом способе в контрольный разряд записывается "0", если количество единиц в информационном слове парная. Если число единиц нечетное, то в контрольный разряд записывается "1". При этом общее количество единиц в кодовом слове, включая контрольный разряд, всегда оказывается четным (четный паритет). Второй способ предлагает такое формирование контрольного разряда, при котором общее количество единиц в кодовом слове является нечетной (нечетный паритет).