Clustering Two-way joining
OK
Cancel
Open D.ala
Рис. 2. Диалоговое окно кластерного анализа
Слева вверху в этом окне размещена кнопка Переменные (jg
J
Ее следует нажать, чтобы избрать те переменные, по которым вы будете проводить кластерный анализ. После нажатия на эту кнопку возникнет новое диалоговое окно, представленное на рис. 4.
Поскольку нам для анализа потребуются все переменные, то выберите опцию Выбрать Все (Select All), после чего нажмите кнопку
Выбор переменных
Способ кластеризации
(по столбикам
или по строкам)
Стратегия кластеризации
Способ измерения расстояния
CtotfejAno :Ш&$ф,:
gy Variable*: ! попе Inputmaw data
~~*"^f.... '•"---------- —- '----- _____ _.
Cbstei: Vatiablei jcolumnsj ^ I
Amalgamation ffinkagej rule:. I Single Linkage Distance measure:
В
Рис. З. Параметры кластерного анализа
ОК. Так вы возвратитесь к окну параметров кластерного анализа (рис. 3). В большинстве случаев остальные параметры не изменяют, -так поступим и мы.
Select v<iiiables foi the analysis
OK
М П 4-KJ1
5-P_A
Cancel]
Выбрать все
SB
Select variables:
1-11
Рис. 4. Окно выбора переменных для кластерного анализа
Для начала кластерного анализа нажмите кнопку ОК. Перед вами (рис. 5) появится окно Результаты Объединения (Joining Results). Этой есть результаты кластерного анализа. Теперь, нажимая соответствующие кнопки, вы получите необходимые для анализа таблицы и графики,
Для описания результатов кластерного анализа нам будут важны следующие результаты:
); |
|); |
-&**&*#«*«****, |
таблица расстояний ('д~. ■p таблица объединений (и
горизонтальное или вертикальное кластерное дерево (
или Ш
Горизонтальное и вертикальное кластерные деревья |
Wunber of variables: 10 Vuibei of cases: ID Joining/ ot variables Hissing data ыесе саэеи1эе deleted Analgaiaaticn (Joining) rule: Single Li Diicance metric is: Kuciideiii distances |
Таблица объединений |
ЕЯ Hofi/ortdl hieraicbieal if ее plol |
Таблица расстояний |
[•■ Qectangulai bcancbet Г Scale Нее to dlink/dmaifi 00 |
[distance matiin Descriptive tl-atiilic* |
Описательные S*статистики |
juulgamalion tchedule |
." 1 jiiaph of iim.ilgsmelion schedule |
Рис. 5. Результаты кластерного анализа
Таблица расстоянии имеет следующий вид (рис. 6).
?? Euclidea | 1С | es (cla^ | or.sta) | К В | Р А | KB j В Д. | П Р | Д_К . | |||
Continue... | .- | О В | И П | К 0 | 3 А ] | ||||||
■ия | ,0 | 13,3 | 14,8 | 13,4 | 13,5 | 11,5 14,4 | 13,6 | 12,3 | 12,8 | 12,8 | |
"".о в • | 13,3 £§ | 6,2 | 7,0 | 7,3 | 5,9 16,8 | 12,9 | 21,7 | 21,7 | 21,7 | ||
-л п | 14,86,2 | ,0 | 6,8 | 6,7 | 8,0 14,9 | 12,4 | 20,4 | 20,4 | 20,4 | ||
к п | 13,4 7,0 | 6,8 | ,0 | 4,0 | 8,8 13,4 | 11,0 | 19,6 | 19,6 | 19,6 | ||
Р А ' | 13,5, 7,3 | 6,7 | 4,0 | ,0 | 8,9 ! 12,3 | 9,0 | 13,9 | 18,9 | 18,9 | | ||
лл К" В \ | 11,55,9 | е,о | 8,8 | 8,9 | ,0 16,4 | 13,8 | 18,7 | 18,7 | 18,7 | ||
14,4 16,8 | 14,9 | 13,4 | 12,3 | 16,4 ! ,0 | 6,6 | 12,9 | 12,9 | 12,9 | |||
*а р | 13,6 12,9 | 12,4 | 11,0 | 9,0 | 13,8 6,6 | ,0 | 16,0 | 16,0 | 16,0 | ||
д к | 12,8; 21,7 | 20,4 | 19,6 | 18,9 | 18,7 . 12,9 | 16,0 | ,0 | ,0 | ,0 | ||
Е 0 | 12,8: 21,7 | 20,4 | 19,6 | 18,9 | 18,7 ' 12,9 | 16,0 | -0 | ,0 | ,0 1 | ||
• 3_А_ | 12,8 21,7 | 20,4 | 19,6 | 13,9 | 18,7 12,9 | 16,0 | ,0 | ,0 | ,0 : |
Рис. 6. Таблица расстояний
Из этой таблицы можно получить информацию о расстояниях между отдельными объектами — чем больше числовое значение в определенной графе таблицы, тем больше расстояние между соответствующими ей объектами.
Однако на основе анализа только одной таблицы расстояний тяжело делать определенные обобщения и выводы. Более информативной является таблица объединений (рис. 7):
Как видим, в этой таблице содержание кластеров представлено иначе — слева указаны расстояния (linkage distance), а вверху — количество объектов в кластере. В самой же таблице размещены непосредственно объекты. Тем самым уже более явно показано, что в дан-
jf5Jinwl§emat)en Schedule j«ks»r. | la) ":> •' | ЯМ | ММ | XI. | |||||||||||||||||
Continue... | ЕигШеад distance | ||||||||||||||||||||
distance | CSj. [to. | да], но, | ujJ. Ко. | 3)j. No. В | Ob]. No. | .СО). Кй. . 11 | |||||||||||||||
Ш--...Л | Л к | lo | ||||||||||||||||||||
Й_К_ Е_0_ К И ^1 | 3_A_ | ||||||||||||||||||||
5.537,71 | OB KB | ||||||||||||||||||||
i,SB9S« | □ В KB OB KB | я и | ED | Г 1 | |||||||||||||||||
3,041571 | OB- KB | я п | К П | t 1 | в д | П Р | |||||||||||||||
■ 1US1DB6 | 10 OB | к в | я а | к п | р i | В Д | П Р | ||||||||||||||
13,ЭШ1 | i 0 0 8 | к в | к п | к п | Р А | в д_ | ПР | д к | Е 0 Э A J | ||||||||||||
Рис. 7. Таблица объединений
ном примере в первый кластер входят 2 объекта, во второй —- 3, а третий образован 5 переменными и т. д.
Еще нагляднее результаты кластерного анализа можно представить в виде кластерного дерева (рис. 8).
Tree Diagram for 11 Variables
Single Linkage Euclidean distances
10 12 14 |
гп | h | |||
п | ||||
к„п_ | k | |||
~1------------------------ ' | ||||
J...J 1 | ||||
р | ||||
Д.К- | ||||
э.л_ |
0 2 4 6
Linkage Distance
Рис. 8. Кластерное дерево
Сохранение результатов кластерного анализа
Одним из элементов экспериментальной работы является грамотное представление ее результатов. В связи с этим после завершения
процедуры кластерного анализа необходимо адекватно изложить полученные данные с целью:
1) облегчить интерпретацию кластерных структур;
2) иметь возможность перенести числовые результаты в текст на
учной работы;
3) убедить читателей работы в достоверности полученныхданных.
Именно поэтому все полученные в результате анализа данные должны быть представлены как в тексте {кластерное дерево), так и в приложениях (таблицы расстояний и объединений).
Для удобства работы все вышеназванные параметры нужно сохранить в виде файла Кластерный анализ.хЬ (формат Excel).