Ключевые термины и понятия

агломеративная кластеризация (agglomerative clustering)

дивизивная кластеризация (divisive clus­tering)

дисперсионный метод (variance methods)

древовидная диаграмма (дендрограмма) (dendrogram)

евклидово расстояние (euclidean distance)

иерархическая кластеризация (hierarchical clustering)

кластерные центры (cluster centers) кластерный центроид (cluster centroid)

матрица сходства/матрица коэффициен­тов (значений расстояний между объеди­няемыми объектами) (similarity/distance coefficient matrix)

метод Варда (Ward's procedure)

метод одиночной связи (single linkage)

метод оптимизирующего распределения (optimizing partitioning method)

метод полной связи (complete linkage) метод средней связи (average linkage) методы связи (linkage methods)

неиерархическая кластеризация (nonhierarchical clustering)

параллельный пороговый метод (parallel threshold method)

план агломерации (allomeration schedule]

последовательный пороговый метод (sequential threshold method)

расстояния между центрами кластеров (distances between cluster centres)

сосульчатая диаграмма (icicle diagram) центроидный метод (centroid method)

УПРАЖНЕНИЯ

Вопросы

1. Обсудите сходство и различие между кластерным и дискриминантным анализом.

2. Назовите примеры использования кластерного анализа в маркетинге.

3. Дайте краткие определения следующим терминам: дендрограмма, сосульчатая диаграмма, график агломерации и кластерная принадлежность.

4. Что является наиболее распространенной мерой сходства в кластерном анализе?

5. Дайте классификацию процедур кластеризации.

6. Почему обычно предпочитают использовать метод средней связи, а не одиночной и пол­ной связи?

7. Назовите два главных преимущества процедур неиерархической кластеризации.

8. Чем следует руководствоваться при принятии решения о количестве кластеров?

9. Что понимают под интерпретацией кластеров?

10. Что представляют собой дополнительные переменные, используемые для профилирования кластеров?

11. Опишите несколько процедур для оценки качества (надежности и достоверности) кластер­ного анализа.

12. Как кластерный анализ используют для группирования переменных?

Задачи

1. Верны ли следующие утверждения.

a) Методы иерархической и неиерархической кластеризации всегда приводят к разным результатам.

b) Перед выполнением кластерного анализа всегда следует нормировать данные.

c) Небольшие значения расстояний между объединяемыми кластерами в плане агломера­ции означают, что объединяются непохожие объекты.

d) He имеет значения, какая используется мера расстояния, так как итог кластеризации в принципе одинаковый.

e) Рекомендуется один и тот же набор данных анализировать с помощью различных мето­дов кластеризации.

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET И КОМПЬЮТЕРА

1. Проанализируйте данные табл. 20.1, используя следующие методы: (а) метод одиночной связи, (Ь) метод полной связи, и (с) центроидный метод. При этом используйте SPSS, SAS, BMDP или Minitab. Сравните полученные результаты с результатами, приведенны­ми в табл. 20.2.

КОММЕНТАРИИ

1. Liz Stuart, "Haagen-Dazs Aims to Scoop a Larger Share", Marketing Week, February 21, 19 p. 26; Dwight J. Shelton, "Birds of a Geodemographic Feather Flock Together', Marketing Ne August 28, 1987, p. 13.

2. О применении кластерного анализа см. статью Sudhir H. Kale, "Grouping Euroconsum A Culture-Based Clustering Approach", Journal of International Marketing, March 1995, p. 35—48

3. Существуют также перекрывающиеся методы кластеризации, позволяющие отнести обь к более чем одному кластеру. См. статью Anil Chaturvedi, J. Douglass Carroll, Paul E. Gre John A. Rotondo, "A Feature-Based Approach to Market Segmentation via Overlapping Centroids Clustering", Journal of Marketing Research, August 1997, p. 370—377.

4. Прекрасные дискуссии относительно различных аспектов кластерного анализа можно н; ти в работах В. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Halsted Press, 1993); H. Cha; Romsturg, Cluster Analysis for Researchers (Melbourne: Krieger Publishing Company, 1990).

5. Vicki Douglas, "Questionnaires Too Long? Try Variable Clustering", Marketing News, February 1995, p. 38; Girish Punj, David Stewart, "Cluster Analysis in Marketing Research: Review and Si gestions for Application", Journal of Marketing Research, May 1983, p. 134-148.

6. Об использовании кластерного анализа для сегментации см. статьи Mark Peterson, Naresh Malhotra, "Comparative Marketing Measures of Societal Quality of Life: Substantive Dimensions 186 Countries", Journal of Macromarketing, Spring 1997, p. 25-38; Tung-Zong Chang, Su-J< Chen, "Benefit Segmentation: A Useful Tool for Financial Investment Services", Journal Professional Services Marketing, February 1995, p. 69-80; "Using Cluster Analysis for Segmen tion", Sawtooth News, Winter 1994/1995, p. 6-7.

7. Chul-Min Mo, Mark E. Havitz, Dennis R. Howard, "Segmenting Travel Markets with the Inten tional Tourism Role (ITR) Scale", Journal of Travel Research, Summer 1994, p. 24-31; Geo Moschis, Daniel C. Bello, "Decision-Making Patterns among International Vacationers: A Cro Cultural Perspective", Psychology & Marketing, Spring 1987, p. 75-89.

8. B. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Halsted Press, 1993).

9. Более детально различные меры подобия и формулы для их вычисления обсуждаются в \ ботах Victor Chepoi, Feodor Dragan, "Computing a Median Point of a Simple Rectilim Polygon", Information Processing Letters, March 22, 1994, p. 281-285; H. Charles Romsburg, С/ш Analysis for Researchers (Melbourne: Krieger Publishing Company, 1990).

10. Tomio Hirata, "A Unified Linear-Time Algorithm for Computing Distance Maps", Informal Processing Letters, May 13, 1996, p. 129-133; Joseph F. Hair, Jr., Ralph E. Anderson, Ronald Tatham, William C. Black, Multivariate Data Analysis with Readings, 5th ed. (Upper Saddle Riv NJ: Prentice Hall, Inc., 1999).

И. Более подробно дискуссия по вопросам стандартизации рассматривается в работе H. Char Romsburg, Cluster Analysis for Researchers (Melbourne: Krieger Publishing Company, 1990).

12. Richard A. Johnson, Dean A. Wichern, Applied Multivariate Statistical Analysis, 4th ed. (Upper Sa die River, NJ: Prentice Hall, 1998); G. Milligan, "An Examination of the Effect of Six Types of E ror Perturbation on Fiften Clustering Algorithms", Psychometrica, September 1980, p. 325-342.

13. B. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Halsted Press, 1993); Punj Girish, David Ste ard, "Cluster Analysis in Marketing Research: Review and Suggestions for Application", Journal Marketing Research, May 1983, p. 134-138.

14. Оценку надежности, достоверности и проверку значимости в кластерном анализе см. в р ботах S. Dibbs, P. Stern, "Questioning the Reliability of Market Segmentation Techniques", Ome^ December 1995, p. 625-636; G. Ray Funkhouser, "A Note on the Reliability of Certain Clusteri Algorithms", Journal of Marketing Research, February 1983, p. 92-98; S.J. Arnold, "A Test 1 Clusters", Journal of Marketing Research, November 1979, p. 545—551.

15. John Saunders, Veronica Wong, Peter Doyle, "The Congruence of Successful International Com­petitors: A Study of the Marketing Strategies and Organisations of Japanese and U.S. Competitors in the UbCr, Journal of Global Marketing, March 1994, p. 41-59; Peter Doyle, John Saunders, Veronica Wong, "International Marketing Strategies and Organisations: A Study of U.S., Japanese, and British Competitors", in Paul Bloom, Russ Winer, Harold H. Kassarjian, Debra L. Scammon, Bart Weitz, Robert E. Spekman, Vijay Mahajan, Michael Levy (eds.), Enhancing Knowledge Development in Marketing, Series № 55 (Chicago, IL: American Marketing Association, 1989), p. 100-104.

16. Edward J. Holohean, Jr., Steven M. Banks, Blair A. Maddy, "Sysntem Impact and Methodological Issues in the Development of an Empirical Typology of Psychiatric Hospital Residents", Journal of Mental Health Administration, Spring 1995, p. 177-188; Arch G. Woodside, Robert L. Nielsen, Fred Walters, Gale D. Muller, "Preference Segmentation of Health Care Services: The Old-Fashioneds, Value Conscious, Affluents and Professional Want-It-Alls", Journal of Health Care Marketing, June 1988, p. 14-24.

17. Vicki Douglas, "Questionnaire Too Long? Try Variable Clustering", Marketing News, February 27, 1995, p. 38.

18. Thorolf Helgesen, "The Power of Advertising — Myths and Realities", Marketing & Research Today, May 1996, p. 63-71; David A. Aaker, Douglas M. Stayman, Richard Vezina, "Identifying Feelings Elicited by Advertising", Psychology & Marketing, Spring 1988, p. 1—16.

19. Ismael Akaah, "Organizational Culture and Ethical Research Behavior", Journal of the Academy of Marketing Science, Winter 1993, p. 59-63; R.E. Reidenbach, D. Robin, "Some Initial Steps toward Improving the Measurement of Ethical Evaluations of Marketing Activities", Journal of Business Ethics, July 1988, p. 871-879.

Глава 21

Многомерное шкалирование и совместный анализ

Наши рекомендации