Классификация и кодирование информации
Система классификации.
Общие сведения
Важным понятием при работе с информацией является классификация объектов.
Классификация – система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Под объектомпонимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов – это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Пример Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:
• информация о студентах – в виде информационного объекта "Студент";
• информация о преподавателях – в виде информационного объекта "Преподаватель";
• информация о факультетах – в виде информационного объекта "Факультет" и т.п.
Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами.Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.
Реквизит– логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Пример Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:
– фамилия, имя, отчество;
– пол;
– год рождения;
– место рождения;
– адрес проживания;
– факультет, где проходит обучение студент, и т.д.
Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".
Кроме выявления общих свойств информационного объекта, классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.
Пример Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авторах, абонентах и т.д.
Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д.
Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.
При любой классификации желательно, чтобы соблюдались следующие требования:
• полнота охвата объектов рассматриваемой области;
• однозначность реквизитов;
• возможность включения новых объектов.
В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор– систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятия классификационный признаки значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Пример В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.
Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Так же можно встретить понятие структура данных: иерархическая, табличная, линейная.
Рассмотрим основные идеи этих методов для создания систем классификации.