Кодирование объектов
Кодирование представляет собой образование по определенным правилам и присвоение кодов объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Стремление к минимизации количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки информации.
Кодовое обозначение характеризуется:
· алфавитом кода;
· структурой кода;
· числом знаков – длиной кода;
· методом кодирования.
Коды должны удовлетворять следующим основным требованиям:
· однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;
· иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;
· иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;
· быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;
· обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.
Классификационные методы кодирования разделяются на два типа: последовательный и параллельный.
Последовательные метод чаще всего используется при иерархическом методе классификации, когда множество разделяется на подмножества в нужной последовательности и когда кодовое обозначение строится по заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления. К его недостаткам следует отнести зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков, через которые идентифицируется объект.
Параллельный (независимый) метод чаще всего используется при фасетной классификации объектов, когда коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кодового обозначения определяется фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется, и для тех случаев, когда необходимо анализировать различные множества объектов. Он обеспечивает возможность независимого изменения и дополнения характеристик объектов и их различных сочетаний, необходимых для решения конкретных задач. К недостаткам параллельного метода следует отнести некоторую громоздкость фасетных формул и избыточную емкость кодов.
Кодирование при обоих методах осуществляется путем присвоения порядковых номеров, причем параллельный метод может успешно применяться при иерархическом методе классификации, когда одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах.