Матрица образов как семейство множеств

  S1 S2 S3 Sq
Z1
Z2
Z3
... ...
Zp

Семейство множеств S или Z с заданными на них отношениями можно рассматривать как системы, в которых связи между элементами образуют определенную структуру. Следовательно, содержание задач по обработке матриц образов систем включает подбор типов отношений и анализ структуры порождаемых ими систем.

Рассмотрим основные меры, порождающие отношения на множестве исследуемых систем.

Меры сходства и различия. Мерой сходства (близости) обычно называется величина С (Sj, Sk), имеющая предел и возрастающая с возрастанием близости объектов. Под мерой сходства будем понимать неотрицательную вещественную функцию С (Sj, Sk), обладающую следующими свойствами:

Матрица образов как семейство множеств - student2.ru

Здесь Sj, Sk — множества значений признаков, описывающие сравниваемые объекты. Мера, коэквивалентная мере сходства, называется мерой различия D (Sj, Sk) и обладает свойствами метрики, если:

Матрица образов как семейство множеств - student2.ru

Свойствами (5.2) обладает, в частности, континуум эквивалентных мер, представляемых формулой

Матрица образов как семейство множеств - student2.ru

Матрица образов как семейство множеств - student2.ru

Меры сходства и различия "изобретаются"по специальным правилам [4], а выбор конкретных мер зависит, в первую очередь, от суперзадачи — цели конкретного исследования, а также от шкалы измерений. В табл. 5.4 приведены наиболее распространенные меры сходства и различия для различных значений коэффициента и (5.3), предназначенные для обработки качественных и количественных признаков.

Матрица образов как семейство множеств - student2.ru

Вычисление значений меры сходства двух сравниваемых объектов по качественным признакам удобно производить на основе бинарной матрицы, которая в терминах теории множеств задается следующим образом:

Матрица образов как семейство множеств - student2.ru

Здесь S — индексированное множество с элементами Sj (алфавит описаний), Sj —j-e описание объекта; Z — индексированное множество с элементами Zi (алфавит признаков или значений признаков); Zi — i-й признак (значение признака); xiy — одно из двух значений {0, 1} i-гo признака y j-го объекта (xij = 1, если i-й признак есть у j-го объекта, в противном случае xij = 0); J и I— индексные множества.

Бинарная матрица для вычисления меры сходства между двумя объектами имеет следующий вид:

Матрица образов как семейство множеств - student2.ru

Вычисление меры сходства, например, по формуле Чекановского — Серенсена (см. табл. 5.4) с учетом бинарной матрицы (5.4) осуществляется по следующему выражению:

Матрица образов как семейство множеств - student2.ru

где xi1, xi2 — одно из двух значений {0, 1).

Рассмотрим правила вычисления количества элементов некоторых множеств, получаемых в результате операций над ними. Количество элементов множества S равно

Матрица образов как семейство множеств - student2.ru

где р — общее число элементов множества S;

xi — значение i-ro элемента множества S, при этом Матрица образов как семейство множеств - student2.ru Î S®xi = 1.

Количество элементов пересечения двух множеств S1 Ç S2 равно

Матрица образов как семейство множеств - student2.ru

где xi1, xi2 — соответственно значения i-го элемента для множеств S1 и S2 .

Количество элементов объединения двух множеств S1 È S2 равно

Матрица образов как семейство множеств - student2.ru

Мера включения. Она отражает различную степень включения одного объекта в другой и позволяет выявить, какой из двух сравниваемых объектов содержит больше специфических признаков, т. е. определить, какой объект более оригинален, а какой — более типичен среди множества анализируемых объектов.

Меры включения множества S2 в множество S1 и S1 в S2 определяются следующим образом:

Матрица образов как семейство множеств - student2.ru

Меры включения несимметричны, а включение j-го описания в самом себе стопроцентно, так как

Матрица образов как семейство множеств - student2.ru

Для более полного анализа множеств исследуемых объектов рассчитываются меры сходства, различия и включения для всех пар объектов. Полученные после вычислений значения соответствующих мер сводятся в квадратные матрицы порядка q x g, номерами строк и столбцов которых являются номера изучаемых объектов.

Наши рекомендации