Тема 10. Классификация объектов в ИС
План лекции
1. Первичные определения
2. Типы систем классификации. Иерархическая система классификации
3. Фасетная система классификации
4. Выбор типа системы классификации
5. Дескрипторная система классификации
1. Первичные определения
Классификатор (от лат. classis– разряд и facere– делать) – нормативный документ, определяющий правила синтеза формализованного описания проблемной информации, включающего в себя:
1) наименования объектов классификации:
2) наименования классификационных группировок:
3) коды (кодовые наименования) группировок и объектов классификации.
Классификатор реализует некоторую систему классификации и связанный с этой системой способ кодирования группировок и объектов. Классификатор синтезирует коды для объектов классификации по некоторой схеме группирования этих объектов. При этом коды являются неповторяемыми и могут рассматриваться как уникальные идентификаторы объектов. Объектами классификации и ассоциированного кодирования в информационных системах очень часто являются различного рода документы, но классифицироваться и кодироваться могут объекты различной физической природы (например, элементы проектов систем: подсистемы, задачи, программные модули, файлы, формы и др.).
Непосредственными предметами классификации и кодирования являются названия объектов (документов, подсистем, задач, модулей и т.д.). Поэтому можно считать, что классификатор осуществляет отображение названий объектов классификации в их уникальные коды.
С помощью классификатора можно осуществлять и обратную процедуру – указывать название объекта по его коду. Таким образом, классификатор может использоваться с двумя компланарными целями:
1) для однозначной идентификации документа кодом;
2) для поиска информации по ее коду и получению названия соответствующего документа.
Классификация – это результат распределения объектов заданного множества на подмножества по сходству или различию распределяемых объектов.
Объект классификации – это элемент классифицируемого множества.
Система классификации – это совокупность правил распределения объектов множества на подмножества.
Процесс классификации, или классифицирование, – это процесс распределения объектов классификации в соответствии с принятой системой классификации.
Признак классификации – это свойство (или характеристика объекта классификации, позволяющее установить сходство или различие этого объекта с другими объектами классификации).
Классификационная группировка – это множество или подмножество, объединяющее часть объектов классификации по одному илинескольким признакам.
Ступень классификации – это этап классификации при иерархическом методе, результатом которого является совокупность классификационных группировок.
Основание классификации – признак, по которому ведется разбиение множества объектов на подмножества на определенной ступени классификации.
Уровень классификации – это совокупность классификационныхгруппировок, полученных на одной и той же ступени (одном и том жеэтапе) классификации.
Глубина классификации – это число ступеней (уровней) классификации (количество ступеней всегда равно количеству уровнейклассификации.
Каждая система классификации характеризуется двумя признаками: гибкостью структуры и емкостью.
Конкретная классификация – результат классифицированияхарактеризуется степенью заполненности.
Гибкость структуры системы классификации – это способность допускать вовлечение в рассмотрение новых признаков объектов без разрушения структуры классификатора.
Емкость системы классификации Qmax– это максимально допустимое количество классификационных группировок.
Степень заполненности классификации Kзап– это доля емкости системы классификации, занимаемая фактическим количеством группировок в классификации Qфакт: