Таким образом, для каждого из 10 объектов рассчитана условная
характеристика – многомерная средняя, заменяющая три первоначальных
Признака. По многомерной средней как группировочному признаку
Необходимо выполнить одномерную структурную группировку. Для этого
определяется:
• Количество однородных групп m = 1+ 3.322× lg10 ≈ 4 ;
• Ширина интервалов 0,33
max min 1,7 0,3 =
−
=
−
=
m
A x x .
Структурная группировка представлена в таблице 4.5.
Таблица 4.5.
Группировка объектов по многомерной средней
№ Параметры групп
Групп н
I x в
I x i a
Номера объектов Количество объектов
В группе, i n
1 0,38 0,71 0,33 2,3,5,8 4
2 0,71 1,04 0,33 10 1
3 1,04 1,37 0,33 1,7 2
4 1,37 1,07 0,33 4,6,9 3
Итого 0,38 1,07 1,32 - 10
Таким образом, 10 объектов были распределены по 4-м однородным
Группам.
При втором подходе к выполнению многомерных группировок
Каждая единица совокупности, обладающая набором из k признаков
рассматривается как точка в k-мерном пространстве – пространстве
Признаков, а каждому признаку придается смысл координаты. Задача
Классификации в этом случае сводится к выделению сгущений объектов в
Этом пространстве. Для этого используются различные алгоритмы, но
Всегда однородные группы выделяются на основании близости объектов
По совокупности признаков. Мерой близости объектов, то есть мерой
Сходства единиц совокупности, могут служить различные критерии.
Выделяют три типа мер сходства:
• Коэффициенты подобия;
• коэффициенты связи;
• показатели расстояния.
Коэффициенты подобия используются для измерения степени
Близости между парой объектов, каждый из признаков которых принимает
Значения 0 или 1.
Наиболее простой коэффициент подобия рассчитывается по
формуле:
m
P
S ij
ij = ;
Где ij P - число совпадений признаков у объектов i и j;
m – общее число признаков, по которым осуществляется сравнение.
Ij S .
Коэффициенты корреляции используются как измерители силы
Связи между статистическими единицами или между признаками. Для
Измерения тесноты связи количественных признаков применяют
Коэффициенты линейной корреляции.
В кластерном анализе мерой сходства является мера расстояния
Между двумя объектами I и j. Для количественных признаков
используется Евклидово расстояние:
Σ=
= −
m
j
Ij i j R P P
1 1 ( ) ,
Где i1 P , j1 P - стандартизованные значения 1-ого признака i-ого и
J-ого объекта наблюдения.
Статистические таблицы
Результаты сводок и группировок заносятся в статистические
Таблицы, являющиеся средством наглядного выражения результатов
исследования. Статистическая таблица представляет собой
Рационального и наглядного изложения статистических данных об
Исследуемых явлениях. Основу статистической таблицы составляет
Графленная сетка, вертикальные столбцы которой называются графами, а
горизонтальные – строками. Если строки и графы имеют название, то это
будет макет таблицы (рис.3.1).
Рис. 4.1. Макет статистической таблицы
В таблице различают: заголовок, подлежащее и сказуемое.
Заголовок таблицы отражает содержание таблицы, место и время, к
Которому относятся ее данные, единицы измерения, если они являются
Общими для приведенных данных. Подлежащим таблицы являются
Перечень единиц совокупности или группы, т. е. объект изучения,
сказуемым – цифровые данные, характеризующие подлежащее, т. е.
Результаты сводки. Обычно подлежащее располагается слева в виде
названий строк, а сказуемое – сверху в виде названий граф.
По содержанию подлежащего все статистические таблицы можно
разделить на следующие группы:
• Простые таблицы, в подлежащем которых отсутствуют
Группировки. Они содержат обобщающие показатели, относящиеся к
Перечню единиц совокупности (перечневые таблицы), к перечню
Хронологических дат (хронологические таблицы) или к перечню
Территорий (территориальные таблицы).
• Групповые таблицы, в подлежащем которых изучаемый
Объект разделен на группы по определенному признаку. При этом каждая