Миф о достаточной выборке
«Достаточной» является выборка, которая дает возможность сделать вывод о распределении исследуемых параметров в генеральной совокупности с приемлемо низкой погрешностью.
При изучении данных социального характера одним из доминирующих является анализ перекрестных распределений (иначе говоря, «дву-мерок», «двумерных распределений», «кроссов», «перекрестных таблиц», «матриц кросс-табуляции», «пересечений»). Его использование на практике нередко приводит к базовой ошибке в интерпретации, вернее, даже понимании результатов исследования — «игнорированию математики».
Суть ошибки сводится к некритичному отношению к данным в перекрестных таблицах. Рассмотрим типичный пример перекрестной таблицы — пересечение возраста респондентов и вопроса об отношении к брендам. Ошибка «игнорирования математики» заключается в следующем. Большинство тех, кто работает с подобными таблицами, знают о существовании погрешности (как правило, она указывается в начале отчета). Однако не все представляют себе, что эта погрешность зависит от размера генеральной совокупности и выборки, но не напрямую: и для всей России, и для крупного райцентра выборка в 1500 человек достаточна и дает одинаковую погрешность. Еще меньшее число людей знают, что погрешность для каждого из измеренных значений различается (простой пример: для значения 1% погрешность не может составлять ±2,5%); в исследованиях обычно указывается погрешность для измеренного значения 50%.
При анализе распределения ответов на один вопрос в разрезе другого мы наблюдаем аналог нескольких подвыборок из ряда генеральных совокупностей. Количество подвыборок определяется количеством групп, на которые делит выборку вопрос, в разрезе которого мы анализируем данные. В нашем примере это 6 возрастных групп.
Приведем пошаговые расчеты погрешности для одной из подвыборок.
1. Всего в городе жителей старше 18 лет — 450 000 человек.
2. Доля жителей от 55 до 64 лет — 13%.
3. Число жителей 55-64 лет (13% от 450 000) - 58 500 человек.
4. В выборку попало жителей 55-64 лет (13% от 1314) — 171 человек.
5. Погрешность при выборке 171 человека из совокупности в 58 500 человек составляет ±7,48% (при уровне достоверности 95%).
Таким образом, для данных по всей выборке погрешность (для значения 50%) составляет 2,7%, а для данных по возрастной группе «от 55 до 64 лет» — 7,5% (к примеру, для группы «65 лет и старше» погрешность составляет 5,5%).
Итак, нельзя воспринимать понятие «погрешность» как одну цифру в начале отчета. Для каждой группы, по которой приводятся данные, погрешность должна быть указана отдельно.
Частым следствием «игнорирования математики» является то, что люди относятся к цифрам слишком внимательно, а без должного понимания эти цифры могут нанести вред даже больший, чем полное отсутствие информации.
Только имея целостную концепцию исследования, понимая, какие содержательные зависимости мы пытаемся проверить на модели объекта (выборке) и зная, по каким группам (в каком разрезе) будем представлять данные, можно определить адекватный, в полном смысле достаточный, размер выборки.
2.4. Основные вопросы количественного
Исследования потребителей
Рассмотрим классические вопросы, которые включают количественные исследования U&A (Usage and Attitude — «использование и потребление»).
Известность марки
Существуют рейтинги спонтанной и наведенной известности. Спонтанная известность выявляется путем открытого вопроса: «Какие марки соков вы знаете?», а наведенная – путем серии закрытых вопросов: «Знаете ли вы сок XXX марки?» (открытый вопрос предполагает, что человек сам называет варианты ответа, закрытый – что ему варианты предлагаются). Наведенная известность всегда выше, чем спонтанная. Разрыв между рейтингом наведенной и спонтанной известности показывает, насколько легко респонденту вспомнить марку.
Наиболее популярным маркам вкладывать средства в повышение рейтинга известности нет необходимости. А вот для новых марок это является типовой технологией. Затраты на поднятие известности на 1% примерно в 15–20 раз ниже, чем на поднятие рейтинга симпатии. В случае правильной проработки образа резкий рост известности (с 0-3% до 30-50%) влечет за собой рост поддержки до уровня 5–10%, хотя и не очень долгосрочный.
Иногда выделяют отдельный вид спонтанной известности – так называемую известность «top of mind» (наиболее адекватный перевод – «у всех на устах»). Очевидно, что важно не только то, какой процент людей в принципе способен вспомнить марку, но и то, сколько человек, вспомнивших марку, назвали ее в первую очередь. Анализ этого рейтинга известности проводится по тем же данным, просто анкета должна быть разработана таким образом, чтобы иметь возможность определить, в каком порядке респондент назвал марки.
Наиболее подвержена влиянию эффекта новизны молодежь, хотя скорее «пионеры потребления» (потребители-инноваторы, склонные пробовать новые марки) – это группа, принадлежность к которой определяется не возрастом человека, а его психологическими особенностями.
Отношение к продукту
Этот вопрос часто не включается в исследования, однако это оправдано только в том случае, если продукт воспринимается одинаково всеми потребителями. Например, человек может относиться к ноутбуку как к необходимому инструменту работы или учебы, средству развлечений, статусному предмету. Потребители в целом не очень рациональны, поэтому позиционирование марки должно включать и позиционирование продукта.
Предпочтения марок. Смысл этого вопроса очевиден: выявить, какая марка нравится больше всего, – некий рейтинг предпочтений. При этом имеет значение, одна предпочитаемая марка у респондента или несколько. Очень опасно, когда исследование предполагает, что каждый респондент четко предпочитает одну марку. Это заставляет людей делать спонтанный выбор между несколькими равно предпочитаемыми марками, и он не всегда отражает их реальные предпочтения.
Важен феномен непотребительской поддержки: доля предпочитающих марку людей может быть очень высокой, однако доля тех, кто реально потребляет товар этой марки, – крайне малой. Выявление причин подобного «игнорирования» марки теми, кто высоко ее оценивает, – очень важная задача. Естественно, основная причина этого феномена – цена товара или услуги, определяющая так называемую платежеспособность спроса. Однако существует целый ряд других причин, объясняющих, почему человек не потребляет симпатичную ему марку:
· некомфортная система сбыта (отсутствие марки в удобных для потребителя торговых точках);
· механизм принятия решения о покупке, установившийся в семье (мужу нравится кефир, а жена упорно покупает жидкий йогурт);
· отсутствие социального одобрения марки, ее несоответствие социальным стереотипам (человек часто ездит на охоту, и ему хочется купить «УАЗ», но на работе «не поймут»; человеку нравится джин-тоник в банках, но в его компании он считается женским напитком).
Отношение к марке. Отношение к марке, или ее оценка, – еще один типовой вопрос исследований U&A, В отличие от предпочтений, оценка отношения обычно выставляется каждой марке, предложенной исследователем либо названной самим респондентом. Если известность марки высокая, оценить перспективы роста ее рыночной доли можно именно исходя из отношения потребителей к марке.