Основные типы задач кластер-анализа и основные типы кластер-процедур

Типы задач кластер-анализа выделяются в зависимости от объема n совокупности классифицируемых Х1, Х2, …Хn

Тип Б1: задачи классификации сравнительно небольших по объему совокупностей наблюдений, не более чем несколько десятков (например, страны, города, пр-ия и тд)

Тип Б2: задачи классификации больших массивов многомерных наблюдений n-порядка нескольких сотен и тысяч (например, семьи, изделия, индивидуумы и тп)

С точки зрения априорной информации об окончательном числе разбиваемой совокупности объектов задачи кластер-анализа можно подразделить на три основных типа: (а) число классов априори задано;

(б) число классов подлежит определению (оценке);

(в) число классов неизвестно, но его определение не входит в условие задачи; требуется построить так называемое иерархическое дерево исследуемой совокупности , или дендограмму. Три типа обслуживающих кластер-анализ кластер-процедур:

· Процедуры иерархические, предназначенные в основном для решения задач типа Б1,(в). Процедуры параллельные, предназначены для решения задач типов Б1 (а) и Б1 (б). Реализуются с помощью итеративных алгоритмов.

· Процедуры последовательные предназначены для решения задач типов Б2(а) и Б2 (б).

48. Основное содержание задачи снижения размерности исходной системы данных. Метод главных компонент.

Априорное допущение: существует небольшое число (в сравнении с числом р исходных анализируемых признаков Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru ) p’ признаков – детерминант (главные компоненты, общие факторы, наиболее информативные объясняющие переменные), с помощью которых могут быть достаточно точно описаны анализируемые переменные наблюдаемых объектов. При этом главные факторы могут находиться среди исходных признаков, а могут быть латентными, т.е. непосредственно статистически не наблюдаемыми, но восстанавливаемыми по исходным данным.

1. Отбор наиболее информативных показателей (включая выявление латентных факторов).Имеется в виду решение задачи от отборе из исходного (априорного) множества признаков Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru или о построении в качестве некоторых комбинаций исходных признаков относительно небольшого числа p’ переменных Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , которые обладали бы свойствами наибольшей информативности в смысле, определённом, как правило, некоторым специально подобранным для задач критерием информативности Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru .

Пример 1. Если критерий Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru «настроен» на достижение максимальной точности регрессионного прогноза некоторого результирующего показателя Y по известным значениям предикторных переменных, т.е. речь идёт о наилучшем подборе наиболее существенных предиктов в модели регрессии.

Пример 2. Если критерий Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru устроен таким образом, что его оптимизация обеспечивает наивысшую точность решения задачи отнесения объекта к одному из классов по значениям Х его описательных признаков, то речь идёт о построении системы типообразующих признаков в задачах классификации или о выявлении и интерпретации некоторой сводной (латентной) характеристики изучаемого свойства.

Пример 3. Критерий Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru может быть нацелен на максимальную автоинформированность новой системы показателей, т.е максимально точное воспроизведение всех исходных признаков Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru по небольшому числу вспомогательных переменных Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru . В этом случае можно говорить о наилучшем автопрогнозе и целесообразно обратиться к методам и моделям факторного анализа и его разновидностей.

2. Сжатие массивов обрабатываемой и хранимой информации.Этот тип задач тесно связан с предыдущими, в частности, требует в качестве одного из основных приемов решения построения экономной системы вспомогательных признаков, обладающей автоинформированностью, т.е. свойством автопрогноза. Классификации зачастую позволяют перейти от массива, содержащего информацию по всем nстатистически обследованным объектом, к соответствующей информации только по k эталонным образцам Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru . Методы снижения размерности позволяют заменить исходную систему показателей Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru набором вспомогательных переменных Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru . Таким образом, размерность информационного массива понижается от Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru .

Визуализация данных. При формировании рабочих гипотез, исходных допущений о геометрической и вероятностной природе совокупности анализируемых данных Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru важно было бы суметь «подсмотреть», как эти данные точки располагаются в анализируемом пространстве. Здесь попутно может возникнуть задача снижения анализируемой совокупности в соответствии с некоторым специально сформулированным критерием..

3. Построение условных координатных осей (многомерное шкалирование. Латентно-структурный анализ).В данной постановке задачи исходной координатной системы не существует вовсе, а подлежащие статистическому анализу и моделированию данные представлены в статистическом варианте, т.е матрица из элементов Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru – парные сравнения объектов.

Ставится задача: для заданной, сравнительно невысокой размерности Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru определить вспомогательные условные координатные оси Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru и способ сопоставления каждому объекту Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru его координат Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru в этой системе таким образом, чтобы попарные отношения Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru (например попарные взаимные расстояния между объектами, вычисленные на базе этих условных координат) в определённом смысле минимально бы отличались от заданных величин Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru (построение различных рейтингов).

Метод главных компонент – переход к новым объясняющим переменным, линейным комбинациям старых.

1) Центрирование переменных Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

2) Решение характеристического уравнения Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru :

a) Нахождение собственных чисел Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

b) Нахождение для каждого собственного числа Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru собственного вектора Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

3) Переход к новым переменным Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

4) Построение линейной регрессии Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , вычисление оценок с помощью МНК

Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

5) Проверка гипотез Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , исключение несущественных переменных

6) При необходимости переход к исходной модели Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru , Основные типы задач кластер-анализа и основные типы кластер-процедур - student2.ru

Наши рекомендации