Часть III. Сбор, подготовка и анализ данных. 1. Gerhard Mels, Christo Boshoff, Deon Nel, "The Dimensions of Service Quality: The Original Eur pean Perspective Revisited"
КОММЕНТАРИИ
1. Gerhard Mels, Christo Boshoff, Deon Nel, "The Dimensions of Service Quality: The Original Eur pean Perspective Revisited", Service Industries Journal, January 1997, p. 173-189; James M. Sin kula, Leanna Lawtor, "Positioning in the Financial Services Industry: A Look at the Decompositi of Image", in Jon M. Hawes, George B. Glisan (eds.), Developments in Marketing Science, vol. (Akron, OH: Academy of Marketing Science, 1987), p. 439-442.
2. Более подробно о факторном анализе см. работы Jacques Tacq, Multivariate Analysis Techniqi in Social Science Research (Thousand Oaks, CA: Sage Publications, 1996); George H. Duntema Principal Components Analysis (Newbury Park, CA: Sage Publications, 1989). О современном пр менении факторного анализа см. статью Jennifer L. Aaker, "Dimensions of Btand Personality Journal of Marketing Research, August 1997, p. 347-356.
3. См., например, статьи Shirely Bo Edvardsson, Gerry Larsson, Sven Setterlind, "Internal Servi Quality and the Psychosocial Work Environment: An Empirical Analysis of Conseptual Interrelate ness'?, Service Industries Journal, April 1997, p. 252-263; Shirley Taylor, "Waiting for Service: The R lationship between Delays and Evaluations of Service", Journal of Marketing, April 1994, p. 56-69.
См. работы Janjay Gaur, "Adelman and Morris Factor Analysis of Developing Countries", Journal of Policy Modeling, August 1997, p. 407-415; John L. Lastovicka, Kanchana Thamodaran, 4iCommon Factor Score Estimates in Multiple Regression Problems", Journal of Marketing Research, February 1991, p. 105-112; W.R. Dillon, M. Goldstein, Multivariate Analysis: Methods and Applications (New York, NY: John Wiley, 1984), p. 23-99.
О современном применении факторного анализа см. статью Christopher D. Ittner, David F. barker, "Product Development Cycle Time and Organizational Performance", Journal of Marketing Research, February 1997, p. 13-23.
Alexander Basilevsky, Statistical Factor Analysis & Related Methods: Theory & Applications (New York: John Wiley, 1994); Joseph F. Hair, Jr., Ralph E. Andersom, Ronald L. Tatham, William C. Black, Multivariate Data Analysis with Readings, 5th ed. (Upper Saddle River, NJ: Prentice Hall, Inc., 1999). На факторный анализ оказывает большее влияние относительная, а не абсолютная величина коэффициентов корреляций.
См. работы James A. Roberts, Donald R. Beacon, "Exploring the Subtle Relationships between Environmental Concern and Ecologically Conscious Behavior", Journal of Business Research, September 1997, p. 79-89; Sangit Chatterjee, Linda Jamieson, Frederick Wiseman, "Identifying Most Influential Observations in Factor Analysis", Marketing Science, Spring 1991, p. 145-160; Frank Acito, Ronald D. Anderson, "A Monte Carlo Comparison of Factor Analytic Methods", Journal of Marketing Research, May 1980, p. 228-236.
Существуют и другие методы ортогонального вращения. Метод квартимакс минимизирует число факторов, необходимых для объяснения переменной. Метод эквимакс представляет собой комбинацию методов вари макс и квартимакс.
0. James E. Zemanek, Jr., "Manufacturer Influence versus Manufacturer Salesperson Influence over the Industrial Distributor", Industrial Marketing Management, January 1997, p. 59-66; Ronald C. Cur-ban, Robert J. Kopp,"Obtaining Retailer Support for Trade Deals: Key Success Factor", Journal of Advertising Research, December 1987-January 1988, p. 51-60.
1. William M. Bulkeley, "Rebates' Secret Appeal to Manufacturers: Few Consumers Actually Redeem Them", Wall Street Journal, February 10, 1998, p. B1-B2; Donald R. Lichtenstein, Nancy M. Ridgway, Richard G. Netemeyer, "Price Perceptions and Consumer Shopping Behavior: A Field Study", Journal of Marketing Research, May 1993, p. 234-245; Peter Tat, William A. Cunningham III, Emin Babakus, "Consumer Perceptions of Rebates", Journal of Advertising Research, August-September 1988, p. 45-50.
12. "Return of the Beetle", The Economist, January 10, 1998, p. 54.
13. William J. Bigoness, Gerald L. Blakely, "A Cross-National Study of Managerial Values", Journal of International Business Studies, Fourth Quarter 1996, p. 739-752; Ishmael Akaah, Edward A. Rior-dan, "The Incidence of Unethical Practices in Marketing Research: An Imperical Investigation", Journal of the Academy of Marketing Science 18 (1990), p. 143-152.
14. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications, 1998); Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks, CA: Sage Publications, 1993); Mohamed Afzal Norat, "Software Reviews", Economic Journal: The Journal of the Royal Economic Society, May 1997, p. 857-882; Seiter Charles, "The Statistical Difference", Macworld, October 1993, p. 116-121.
Глава 2 О
Кластерный анализ
После изучения материала этой главы вы должны уметь ...
1. Описывать основную идею, область применения кластерного анализа и его важность в ма] кетинговых исследованиях.
2. Анализировать статистики, используемые в ходе кластерного анализа.
3. Объяснять ход выполнения кластерного анализа, включая формулирование проблемы, вь бор способа измерения расстояния, выбор метода кластеризации, принятие решения о чи< ле кластеров, интерпретацию и профилирование кластеров.
4. Описывать цель и методы оценивания качества результатов кластеризации.
5. Рассматривать надежность и достоверность результатов кластеризации.
6. Обсуждать применение неиерархической кластеризации и кластеризации переменных.
КРАТКИЙ ОБЗОР
С помощью кластерного анализа, как и рассмотренного ранее факторного (глава 19), марк< тологи проверяют весь набор взаимозависимых связей. В кластерном анализе не проводят ра: личия между зависимыми и независимыми переменными. Более того, проверяются взаимоз; висимые связи всего набора переменных. Цель кластерного анализа — классификация объеь тов на относительно гомогенные (однородные) группы, исходя из рассматриваемого набо{ переменных. Объекты в группе относительно схожи с точки зрения этих переменных и отл^ чаются от объектов в других группах. Если кластерный анализ использовать именно таким о( разом, то он становится составной частью факторного анализа, так как снижает число объекте] а не число переменных, сгруппировывая их в меньшее число кластеров.
В этой главе описана основная идея кластерного анализа. Этапы кластерного анали: рассматриваются и иллюстрируются в контексте иерархической группировки с помощь: статистического программного пакета. Далее представлено применение неиерархическо кластеризации, которое следует за обсуждением разбиения переменных на кластеры. Начне с двух примеров.
СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА
Кластерный анализ
Маркетологи разделили респондентов на группы (кластеры), исходя из оценок важности, которую они присвоили каждому критерию выбора универмага. Результаты кластеризации показали, что респондентов можно разбить на четыре сегмента. Различия между сегментами были подвергуты статистической проверке. Маркетологи обнаружили, что в каждый сегмент входили респонденты, относительно однородные по критерию выбора магазина. Затем отдельно для каждого сегмента разработали модель выбора магазина. В результате маркетологи получили модели выбора магазина, достаточно хорошо показывающих то, как происходит выбор респондентами магазинов в конкретных сегментах.
ПРИМЕР. Любители мороженого
Руководство компании Haagen-Dazs Shoppe, которая имеет около 300 магазинов по продаже мороженого на всей территории Соединенных Штатов Америки, искало возможности привлечения новых покупателей. С этой целью было решено провести маркетинговое исследование для определения новых сегментов потенциальных потребителей, за счет которых можно было бы увеличить объемы продаж. Для решения этой задачи применили геодемографию, т.е. метод кластеризации потребителей, основанный на географических, демографических характеристиках, а также характеристиках образа жизни. Первоначально провели исследование для разработки демографических и психографических профилей покупателей продукции фирмы Haagen-Da&, включая частоту покупок, время, дни недели и другие переменные, связанные с использованием товара. Кроме того, маркетологи получили адреса и почтовые индексы респондентов. Затем, исходя из метода кластеризации, разработанного Claritas, респондентов распределили по 40 геодемографических кластерам. Используя эту информацию, компания Haagen-Da& определила несколько потенциальных групп потребителей, которые могли увеличить объем продаж [1].
Пример компании Haagen-Dazs иллюстрирует использование кластерного анализа для получения однородных сегментов с целью формулирования конкретных маркетинговых стратегий. В примере с универмагами метод кластеризации использовался для разбивки респондентов на группы для последующего выполнения многомерного анализа.
СУЩНОСТЬ КЛАСТЕРНОГО АНАЛИЗА
Кластерный анализ представляет собой класс методов, используемых для классификации объектов или событий в относительно однородные группы, которые называют кластерами (clusters). Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах. Кластерный анализ также называют классификационным анализом (classification analysis) или численной таксономией (систематикой) (numerical taxonomy) [2]. Мы рассмотрим процедуры кластеризации, которые относят каждый объект к одному и только одному кластеру [3]. На рис. 20.1 показана идеальная ситуация кластеризации, когда кластеры четко отделены друг от друга на основании различий двух переменных: ориентация на качество (переменная 1), и чувствительность к цене (переменная 2).
Переменная 2
Рис. 20.1. Идеальная ситуация кластеризации
Следует отметить, что каждый потребитель попадает в один из кластеров, и перекрывающихся областей нет. С другой стороны, на рис. 20.2 представлена ситуация кластеризации, которая чаще всего встречается на практике.
Переменная 2 Рис. 20.2. Реальная ситуация кластеризации
На рис. 20.2 границы некоторых кластеров очерчены нечетко, и отнесение некоторых п требителей к конкретному кластеру не очевидно, поскольку многие из них нельзя сгруппир вать в тот или иной кластер.
Кластерный анализ, как и дискриминантный, предназначен для классификации переме ных. Однако в дискриминантном анализе необходима предварительная информация о кл стерной (групповой) принадлежности каждого рассматриваемого объекта или события для t го, чтобы разработать правило классификации. В отличие от этого, в кластерном анализе н необходимости в предварительной информации о кластерной принадлежности любого из об ектов. Группы, или кластеры, определяют с помощью собранных данных, а не заранее [4].
Кластерный анализ используют в маркетинге для различных целей [5].
• Сегментация рынка. Например, потребителей можно разбить на кластеры на осно выгод, которые они ожидают получить от покупки данного товара. Каждый класт может состоять из потребителей, которые ищут схожие выгоды [6]. Этот метод наз] вают сегментаций преимуществ (benefit segmentation). Мы проиллюстрируем его ; следующем примере.
ПРИМЕР. Отпускники бывают разными
В исследовании, посвященном моделям принятия решений людьми, проводящим! свой отпуск за рубежом, маркетологи получили от 260 респондентов информацию, ка сающуюся шести психографических направлений: психологического, образовательного социального, релаксационного, физиологического и эстетического. Для разбивки рее пондентов на психографические сегменты использовали кластерный анализ. Первьп сегмент (53%) состоял из людей с высоким (или близким к нему) уровнем жизни. Эг группу назвали "требовательными". Во вторую группу (20%) входили лица с высоким об разовательным уровнем, ее назвали "интеллектуалы". Лица, входящие в последнюю труп пу (26%), оказались большими любителями релаксации (развлечений). Они получил! низкую оценку по социальной шкале, и были названы "беглецами" (от действительно сти). Чтобы привлечь отпускников в каждый из сегментов, разработали специальны! маркетинговые стратегии [7].
• Понимание поведения покупателей. Кластерный анализ используется для идентификации однородных групп покупателей. Затем поведение каждой группы при покупке товара изучается отдельно, как, например, в проекте "Выбор универмага". В этом случае респондентов разбили на группы, исходя из оценок важности, которую они присвоили каждому критерию, используемому для выбора универмага. Кластерный анализ также использовали, чтобы определить виды стратегий, применяемых покупателями автомобилей для получения внешней информации.
• Определение возможностей нового товара. Кластеризацией торговых марок и товаров можно определить конкурентоспособные наборы в пределах данного рынка. Торговые марки в одном и том же кластере конкурируют более жестко между собой, чем с марками других кластеров. Фирма может изучить свои текущие предложения в сравнении с предложениями своих конкурентов, чтобы определить потенциальные возможности новых товаров.
• Выбор тестовых рынков. Группировкой городов в однородные кластеры можно подобрать сравнимые города для проверки различных маркетинговых стратегий.
• Сокращение размерности данных. Кластерный анализ можно использовать как основной инструмент сокращения размерности данных при создании кластеров или подгрупп данных, более удобных для анализа, чем отдельные наблюдения. Последующий многомерный анализ выполняют над кластерами, а не над отдельными наблюдениями. Например, чтобы описать отличия в поведении потребителей по отношению к товарам, их вначале разбивают на группы. Затем различия между группами проверяют с помощью множественного дискриминантного анализа.
СТАТИСТИКИ, СВЯЗАННЫЕ С КЛАСТЕРНЫМ АНАЛИЗОМ
Прежде чем начать разговор о статистиках, соответствующих кластерному анализу, следует помянуть о том, что большинство методов кластеризации — относительно простые процеду->ы, не требующие изощренных статистических расчетов. Можно даже сказать, что методы кла-теризации представляют собой эвристические методы, основанные на определенных алгоритмах действий исследователя. Тем самым кластерный анализ резко отличается от дисперсионно-о, регрессионного, дискриминантного и факторного, которые базируются на обширных татистических расчетах. Хотя многие методы кластеризации обладают важными статистиче-кими свойствами, необходимо признать фундаментальную простоту этих методов [8]. Следующие статистики и понятия связаны с кластерным анализом.
План агломерации, объединения (agglomeration schedule). Дает информацию об объектах (событиях, случаях), которые должны быть объединены на каждой стадии процесса иерархической кластеризации.
Кластерный центроид (cluster centroid). Среднее значение переменных для всех случаев или объектов в конкретном кластере.
Кластерные центры (cluster centers). Исходные начальные точки в неиерархической кластеризации. Кластеры строят вокруг этих центров, или зерен кластеризации.
Принадлежность кластеру (cluster membership). Указывает кластер, которому принадлежит каждый случай или объект.
Древовидная диаграмма (дендрограмма) (dendrogram). Ее также называют древовидный граф — графическое средство для показа результатов кластеризации. Вертикальные линии представляют объединяемые кластеры. Положение вертикальной линии на шкале расстояния (горизонтальная ось) показывает расстояния, при которых объединяли кластеры. Древовидную диаграмму (рис. 20.8) читают слева направо.
•*
Расстояния между кластерными центрами (distances between cluster centres). Указывают, на сколько разнесены отдельные пары кластеров. Кластеры, которые разнесены широко, ясн выражены и поэтому желательны.
Сосульчатая диаграмма (icicle diagram). Это графическое отображение результатов класте ризации. Она названа так потому, что имеет сходство с рядом сосулек, свисающих с крыш] дома. Сосульчатую диаграмму (рис. 20.7) читают сверху вниз.
Матрица сходства/матрица расстояний между объединяемыми объектами (similarity/distanc coefficient matrix). Матрица сходства (расстояний) — это нижняя треугольная матрица, со держащая значения расстояния между парами объектов или случаев.
ВЫПОЛНЕНИЕ КЛАСТЕРНОГО АНАЛИЗА
Этапы выполнения кластерного анализа представлены на рис. 20.3.
Формулировка проблемы
Выбор меры расстояния Выбор метода кластеризации
I
з решения о количестве кластеров Интерпретация и профилирование кластеров
Рис. 20.3. Выполнение кластерного анализа
Первый этап — формулировка проблемы кластеризации путем определения переменны) на базе которых она будет проводиться. Затем выбирается соответствующий способ измерени расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации схожи или не схожи между собой. Разработано несколько методов кластеризации, и исследова телю необходимо выбрать наиболее подходящий для решения данной проблемы. Решение числе кластеров также принимает исследователь. Сформированные кластеры нужно анализи ровать с точки зрения переменных, использованных для их получения, а также для профили рования кластеров можно использовать дополнительные явно выраженные переменные. И на конец, исследователь должен оценить достоверность (качество) процесса кластеризации.
Формулировка проблемы
Возможно, самая важная часть формулирования проблемы кластеризации — это выбор пере менных, на основе которых проводят кластеризацию. Включение даже одной или двух посторо!-них (не имеющих отношение к группированию) переменных может исказить результаты класть ризации. Задача состоит в том, чтобы выбранный набор переменных смог описать сходство межд объектами с точки зрения признаков, имеющих отношение к данной проблеме маркетинговог исследования. Переменные следует выбирать, исходя из опыта прошлых исследований, теори или тестируемой гипотезы. Экспериментатор должен обладать интуицией и уметь делать выводы
У4 Я стараюсь сделать лучшие покупки при посещении магазинов. У5 Мне не нравится посещение магазинов для покупки товаров. уб Вы можете сэкономить много денег, сравнивая цены в разных магазинах. Данные, полученные от 20 респондентов, приведены в табл. 20.1. Таблица 20.1. Данные для кластеризации | ||||||
Номер п/п Vi У 2 Уз | V4 | У5 | V* | |||
На практике кластеризацию выполняют для значительно больших по размеру выборок, состоящих из 100 и больше респондентов. Мы взяли небольшую выборку для иллюстрации процесса кластеризации.