Понятие кластер - анализа, использование его в маркетинговых исследованиях

Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.

Кластерный анализ применяется для решения широкого спектра задач, но чаще всего речь идет именно о задаче сегментация. Все исследования, посвященные проблеме сегментации, безотносительно того, какой используется метод, имеют целью идентифицировать устойчивые группы (люди, рынки, организации), каждая из которых объединяет в себя объекты с похожими характеристиками. Реализуя эту процедуру, исследователи, как правило, допускают ошибку следующего рода: характеристики, на основе которых проводится кластеризация, выбираются по принципу «доступней, проще, дешевле». Такой подход ставит под сомнение целесообразность всего дальнейшего анализа, поскольку включение даже одной-двух незначимых характеристик может привести к неадекватному разбиению на кластеры.

Анализ поведения потребителя

Вторым, но не менее важны направлением использования аппарата кластерного анализа, является построение однородных групп потребителей с целью получить максимально полное представление о том, как ведет себя клиент из каждого сегмента, какие драйверы определяют его поведение. Более подробно эта проблема освещена в работах Клакстона, Фрая и Портиса (1974), Киля и Лэйтона (1981).

Позиционирование

• Кластерный анализ применяется также для того, чтобы определить, в какой нише лучше позиционировать выводимый на рынок продукт. Кластерный анализ позволяет построить карту, на основе которой можно будет определить уровень конкуренции в различных сегментах и характеристики, которыми должен обладать товар для того, чтобы попасть в целевой сегмент. Такая карта позволяет, к примеру, выявить новые рынки, для которых можно разрабатывать и продвигать свои решения.

Выбор тестовых рынков

• Многие исследователи применяют кластерный анализ для того, чтобы, определить, какие рынки (магазины, продукты...) можно объединить в одну группу по релевантным характеристикам. Дело в том, что, выдвинув предположение о существовании определенной закономерности (покупатели элитных товаров с ростом цены увеличивают спрос) необходимо предложить новый, не использованный в анализе, рынок, на котором она должна быть проверена, прежде чем применять на практике.

Сокращение количества наблюдений

• Простейший пример: всем известный АВС анализ объединяет, к примеру, позиции, по одной характеристике (напр. – доход). Т.е. кластеризация проводится только в одном измерении. Результат – три группы, и … (как правило) не совсем адекватное разбиение, поскольку, помимо характеристики «доход» у позиции есть показатели «доходность», «оборачиваемость», «сезонность»… Для того, чтобы аккуратно учесть все эти показатели в процессе классификации, необходимо применять многомерные методы классификации, к коим и относится кластерный анализ.

Иногда бывает разумным перейти от 5000 клиентов к 20-30 группам, и для каждой выработать индивидуальную политику обслуживания. Отсюда можно добиться существенного выигрыша в трудоемкости за счет многократного сокращения объектов анализа.

Методы кластеризации

Выделяют две группы методов кластерного анализа: иерархические и неиерархические.

Основными методами иерархического кластерного анализа являются метод ближнего соседа, метод полной связи, метод средней связи и метод Варда. Наиболее универсальным является последний. Существуют также центроидные методы и методы, использующие медиану, но Сниат и Сокал 1973 аккуратно показали, что их применение может привести к некоторым весьма нежелательным последствиям.

Неиерархических методов больше, хотя работают они на одних и тех же принципах. По сути, они представляют собой итеративные методы дробления исходной совокупности. В процессе деления формируются новые кластеры, и так до тех пор, пока не будет выполнено правило остановки. Между собой методы различаются выбором начальной точки, правило формирования новых кластеров и правилом остановки. Чаще всего используется алгоритм К-средних. Он подразумевает, что аналитик заранее фиксирует количество кластеров в результирующем разбиении.

Наши рекомендации